Temelde hepsi başlığında, bir sürü büyük PDF'leri almam ve XHTML 1.0'a sıkı sıkıya sahip olmalıyım, yakın yeterince iyi, sonra onu temizleyebilirim. TeşekkürlerXHTML sıkı dönüştürücü için iyi bir PDF var
cevap
Bu karmaşık bir istektir, çünkü bu PDF'nin kendisine (ve nasıl oluşturulduğuna) bağlı olup olmadığına bağlıdır. İlk deneme olarak, HTML dönüştürücüsüne
http://www.adobe.com/products/acrobat/access_onlinetools.html
kerpiç kendi çevrimiçi PDF kullanmak ve daha sonra düzenli
gibi bir şeyle aslında sonra HTML'ini düzeltmeye çalışacağını söylediPDF'ler görüntü taraması yaparak oluşturuyorlarsa, bunlarla ilişkili hiçbir metin olmayabilir - o zaman yapabileceğiniz en iyi şey ya sayfaları kesip JPG belgelerine dönüştürmek ya da bir çeşit OCR yazılımı kullanmaktır. PDF kendisi.
PDF'lerin el ile oluşturulmuş ve bu nedenle metin bilgisi olsa bile, dönüştürme işleminde elle düzeltilmesi gereken lot hata olabileceği konusunda sizi uyarıyorum. Bu süreci temel olarak şirket yıllık raporları/etc için yapan bir ürün üzerinde çalışıyorum ve sonuç olarak, sayfaları JPG/GIF görüntülerine ve HTML'lere ayırmaya karar verdik - denediğimiz diğer süreçler de çok fazla hata getirdi ve çok emek yoğundu. hepsini düzeltmek için.
- 1. xHTML 1.0 sıkı - Doğrulamak iFrames
- 2. XHTML Sıkı: p etiketi içinde p etiketi
- 3. Google App Engine PDF dönüştürücü
- 4. MTU 2.0 Dönüştürücü Bir SelectOneMenu bileşeninde bir Ülke seçmek üzere özel dönüştürücü var ayrı kavanoz dosya
- 5. hazırda Özel bir dönüştürücü var
- 6. XHTML
- 7. XHTML
- 8. "Sıkı" çizgi çizmek için yaygın bir teknik var mı?
- 9. HTML 4.01 sıkı düzenleme için en iyi Emacs modu nedir?
- 10. XHTML5 doğru doğrulamak ve ben XHTML5 için Sıkı XHTML 1.0 geçiş ediyorum
- 11. Textarea spellcheck özniteliği XHTML Strict
- 12. Sıkı bir dilde MonadFix
- 13. Node.js veya Javascript kitaplığı için DWG dönüştürücü
- 14. Pandoc için özel bir dönüştürücü yazabilir miyim?
- 15. Swift'de PDF Ayrıştırma ile ilgili bazı iyi belgeler var mı?
- 16. XHTML 1.0 Transitional vs XHTML 1.0 Strict?
- 17. Hızlı dönüştürücü için Java kodu
- 18. "sıkı" mod?
- 19. Kullanım dönüştürücü
- 20. XHTML + RDFa için Visual Studio 2010 için bir doğrulama şeması olan var mı?
- 21. PDF dosyaları için bir test paketi var mı?
- 22. Android: Android için ücretsiz bir PDF kütüphanesi var
- 23. Android'de yerleşik bir PDF görüntüleyici var mı?
- 24. PHP ile PDF oluşturmanın en iyi yolu
- 25. PDF Kitaplıktaki PDF dosyalarını görüntüleyebilmek için kütüphane
- 26. Perl Sıkı ref
- 27. datetime.strptime dönüştürücü ile numpy.genfromtxt
- 28. HTML5 için tüm Javascript API'leri için iyi bir kaynak var
- 29. json.net: sözlük tuşları için dönüştürücü belirtin
- 30. Nasıl "İnternet bağlantısı yok izin" sıkı şartı var internet erişimi