2010-11-19 43 views
9

Python için bir PDF'den PDF'e dönüştürme kitaplığı olan pisa kullanıyorum.html'den .doc dönüştürücü?

Bir Word belgesi için aynı şey var mı: Python için bir HTML to .doc dönüştürme kitaplığı var mı? Ancak

+0

0 dır, html 10 Filtreli? MS Word HTML okuyabilir. – MSalters

+0

Aynı sorunu yaşıyorum: pdf'ye dönüştürmek için pisa kullanan bir html var ve aynı şeyi kelimeyle yapmak istiyorum. onun büyük bir belge, ~ 20 sayfa, html oluşturmak ve pisa veya başka bir şey ile ihraç etmek için aynı kodu kullanarak büyük olurdu. –

+0

@Eric: Son zamanlarda aynı sorun vardı. Sadece merak ediyorum, HTML'yi Word .docx'e dönüştürmek için bir çözüm buldunuz mu? Teşekkürler. –

cevap

3

Bunu dönüştürmek için izin verebilir doğrudan modül farkında değilim rağmen,:

  1. Sen düz metin ilk html2text modülü kullanarak-HTML dönüştürebilirsiniz.
  2. Bundan sonra, bir doc veya docx dosyaya metni dönüştürmek için bu python-docx modülünü kullanabilirsiniz.
9

MS Word'ün sizin için dönüştürmesine izin vermek için win32com pencereleri için pywin32 python uzantılarından kullanabilirsiniz. Basit bir örnek:

import win32com.client 

word = win32com.client.Dispatch('Word.Application') 

doc = word.Documents.Add('example.html') 
doc.SaveAs('example.doc', FileFormat=0) 
doc.Close() 

word.Quit() 
İlgili konular