2011-05-13 26 views
9

Bir iş arama sitesi çalıştırıyorum ve doc, docx ve pdf dosyalarını php çalıştıran Linux CentOS sunucusundaki HTML'ye dönüştürmem gerekiyor. Kullanıcılar bu dosyaları özgeçmiş olarak gönderir. Şimdiye kadar, PHPx'i html'ye dönüştürmede harika olmak için PHPDocx'i buldum. Ama ben doktora/pdf'de takılıyorum. PDFTOHTML, testleri çalıştırdığımda "kötü renk" hatası veriyor. Doktora gelince, sadece wvwave buldum, bu da karmaşık ve hantal bir şeymiş gibi görünüyor.PHP, docx, pdf'yi HTML kullanarak PHP'ye dönüştürmek

Kolayca doc/pdf'yi HTML'ye nasıl dönüştürebileceğine dair bir fikri olan var mı?

+1

mi orada olacağım eminim komut satırı dönüşüme https://help.libreoffice.org/Common/Starting_the_Software_With_Parameters

sağlar sunucuda LibreOffice bir taşınabilir sürümünü yükleyebilir adanmış sunucu var veya shard hosting kullanıyorsunuz? – pregmatch

+0

PDF'den HTML'ye: http://stackoverflow.com/questions/16785198/use-pdf-js-to-statically-convert-a-pdf-to-html – SteAp

+0

Xpdf'ye göre HTML'den PDF'ye: http: // sourceforge. net/projects/pdftohtml/ – SteAp

cevap

3

Düşünebildiğim tek şey, FPDF. PHP'de PDF dosyaları oluşturmak için tasarlanmıştır, ancak PDF dosyalarını da açabilir. Belki bunu bir temel olarak kullanabilir ve bunun için bir çeşitHTML işlevini geliştirebilirsiniz.

Kullanmak tamamen ücretsizdir ve zaten bazı uzantıları vardır. Size yardımcı olabilir.

http://www.fpdf.org

DÜZENLEME: Pierre yorumlarında benim yazı ek için Teşekkür:

Sen fpdi kullanabilirsiniz: http://www.setasign.de/products/pdf-php-solutions/fpdi ama giriş pdf sadece bir görüntü gibidir.

Kendime şu ana kadar bir bakmadım ama bu yardımcı olabilir.

+0

Eğer spam FPDF? Kullanıcı açıkça PDF'den HTML'ye soruyor, – user1914292

+0

'un diğer yolunu değil, bunu biliyorum!Ama aynı zamanda mevcut PDF dosyalarını okuyabilir ve ben temel sınıf olarak FPDF kullanarak HTML çıkacak bir şey geliştirebilirsiniz oldukça shure ediyorum! – Ch33f

+2

+1, haksız kullanıcı1914292'nin reddinden dolayı, cevabı okumadı ve reddetti. Fakat Ch33f, fdpf'yi beklendiği gibi kullanamazsınız. Fpdi'yi kullanabilirsiniz: http://www.setasign.de/products/pdf-php-solutions/fpdi/ fakat pdf girişi bir resim gibidir. – Pierre

3

Bildiğim kadarıyla .doc dosyaları nasıl OpenOffice/LibreOffice gibi bir şey çalışıyorum hakkında gitmek gibi: PDF metin grafiksel gösterimidir, o zaman şans bitti Bildiğim kadarıyla PDF gider
lowriter -convert-to html doc_file.doc –
En iyi yapabilecekleriniz ImageMagick ile bir görüntüye dönüştürmeyi deneyin, eğer uygun bir metinse kolayca dönüştürmeli.

1

Pdf'yi html'ye kolayca dönüştürmek için, seçkin HTML üreten ve çalışma zamanı dönüştürme için yeterince hızlı olan pdf2htmlEX öneririm. İlk önce sisteminiz için optimize etmek ve geliştirmek için biraz çaba göstermelisiniz. Proje bağlantısına dahil edilen basit bir yapı vardır.

İlgili konular