2016-04-10 17 views
1

Metin ayıklamak için python'da pdfquery kütüphanesi kullanıyorum. Bunu yapmak için pdf'yi yüklerim ve şimdiye kadar her zaman çalışır.python - pdfquery yüküyle ilgili sorunlar

import pdfquery 
pdfQuery = pdfquery.PDFQuery('10241.pdf') 
pdfQuery.load() 

programı sıkışmış görünüyor ve bitirmek asla: i kodu çalıştırdığınızda

i pdf çalışmak çalıştım Ama şu sorunla karşı karşıya.

Bu problemle karşı karşıya olan veya üstesinden nasıl geleceğe dair herhangi bir öneriniz var mı?

Teşekkürler.

cevap

1

PDF'inizde kaç sayfa var?

yüke sayfa sayısını belirtmek için yararlı olabilir:

pdfQuery.load(0) 

Yukarıdaki kod sadece ilk sayfayı yükleyin ve zaman kazandıracak.