2010-04-30 19 views

cevap

12

Unicode byte order mark kod noktası U + FEFF geçerli:

Benim googl'ing yaşıyorum tam sorundur ama bir çözüm sağlamaz Bu tartışmayı ortaya çıkardı. İki dosyaları birleştirerek, bu birleştirme komutu tüm BOM karakterleri çıkarmaz:

<concat encoding="UTF-8" outputencoding="UTF-8" destfile="nobom-concat.txt"> 
    <filelist dir="." files="bom1.txt,bom2.txt" /> 
    <filterchain> 
    <deletecharacters chars="&#xFEFF;" /> 
    </filterchain> 
</concat> 

concat komutunun bu şekli UTF-8 karakter verisi olarak dosyaları çözmek için görev söyler. UTF-8'i varsayıyorum, çünkü bu genellikle Java/BOM sorunlarının ortaya çıktığı yerdir.

UTF-8'de, BOM, EF BB BF baytları olarak kodlanır. Sonuç dosyasının başında görünmesi gerekiyorsa, çıktı dosyasını bir BOM ile tekrar önek için bir sonraki birleştirme kullanabilirsiniz.

Diğer UTF kodlamalarında U + FEFF için kodlanmış değerler here listelenir.