PHP

2012-07-09 18 views
5

kullanarak Olası Çoğalt MS Word "HTML" Kaldır:
What is the best free way to clean up Word HTML?
PHP to clean-up pasted Microsoft inputPHP

Ben istemcileri zengin metin editörü notları girmesine izin ve sadece son zamanlarda yükseltilmiş olması ckEditor 3x, MS sözcük sınıflarını, stilleri ve yorumları varsayılan olarak (kullanıcılar editör nesnesine yapıştığında) dizer. Öyleyse ileri gidiyorum.

Son zamanlarda MS word'leri HTML gömülü olan bazılarının 5 yıllık notlarını temizleme ihtiyacım vardı. Bu metin gövdesinden geçmem ve temizlemem gerek.

Sadece Microsoft tarafından yazılanlar gibi tüm span etiketlerini çıkarmam gerekmez.

HTMLCleaner kullanmayı denedim, ancak MS oluşturulan HTML'yi kaldırmıyor. http://word2cleanhtml.com tam olarak istediğimi yapıyor, ancak geliştiriciler şu anda (9 Temmuz 2012 itibariyle) kamu kullanımı için API sunmuyor.

Son birkaç haftadır böyle bir derse baktım ve fazla şansım olmadı. Herhangi birini paylaşmak istediğiniz yararlı bir sınıf buldunuz mu?

+0

Netleştirmek gerekirse, varolan uygulamanıza yerleştirebileceğim sunucu tarafı bir sınıfa ihtiyacım var. Mario tarafından belirtilen SO soruları/cevaplarında bazı BÜYÜK araçlar var, ancak bunların çoğunlukla tek seferlik dönüşümler için tasarlandığını veya web sitelerine gönderilmek için kıvrılmayı kullandıklarını buluyorum. Bunu PHI ile yapamam. –

+0

Mario, URL'leriniz nereye gitti? Yararlılardı ve kapanış nedenlerimin bir parçasıydı. Onlar da bir retrospektif betik kullanarak HTML temizleme yapmak için OP için yararlı olmalıdır. – halfer

+0

Umarim asagidaki soru, maxhud'un altindaki cevabin, bir soruma htmlpurifier'a hitap ettigi gibi, kullanicinin göz atip yükledigi bir web sitesi degildir. –

cevap