2009-06-28 23 views
7

Microsoft Word'den oluşturulan html biçiminde oldukça büyük bir belgem var. Soooo dağınık ve şişmiş şeylerle dolu (bilinmeyen etiket, bilinmeyen isim alanı vb. Ve diğer şişirilmiş şeyler gibi)microsoft html doc nasıl temizlenir?

Düz html sözdizimine dönüştürmenin herhangi bir yolu var mı?

cevap

6

HTML Tidy ürününü deneyin. MS Word tarafından üretilen HTML'de oldukça iyi çalıştığını duyuyorum (kesinlikle en azından Word 2000'e kadar, ama muhtemelen daha yeni sürümlerde de).

2

Bu gerçekten bir programlama sorusu değil, (en azından yeni sürümleri) Word, Office'e özgü etiketleri ve özellikleri kaldıran ve yalnızca belge için gerekli olan etiketlerden ayrılan "Web Sayfası, Filtrelenmiş" olarak kaydedebilir bir web tarayıcısında işlenecek. Yani, Word'ünüz varsa, HTML belgesini açmak ve bu biçimde kaydetmek için kullanmayı deneyebilirsiniz.

2

Muhtemelen HTML Tidy, hemen hemen her dilde adaptörlere sahip olabilirsiniz. Microsoft Word HTML çıktısını (ve diğer birçok özelliği) temizlemek için seçenekleri vardır.