2016-03-22 12 views
0

PDF dosyalarından bazı tablolar çıkarmaya çalışıyorum ve her iki araç da (Abbyy ve Omnipage) tabloları tanımlamak için oldukça iyi bir iş yapıyor. Ancak satır ve sütunları tanımlamaya gelince, ikisi de aynı hataları yapıyorlar. Genellikle, sorun, kısmi bir satır oluşturduklarında, yalnızca tek bir hücreyi yatay olarak böldüklerinde değil, diğerlerini değil, ortaya çıkar. Ne demek istediğimin bir örneği için ekteki görüntüye bakın. Soldaki sütunda, bazı hücreler ikiye bölünür, bu da tablonun Excel'de çalışmasını zorlaştırır.PDF'yi Excel'e Omnipage veya Abbyy Finereader ile dönüştürürken, tek tek hücrelerin bölünmesini engellemenin bir yolu var mı?

Bölünmüş hücreli tablolar her zaman bir acı olduğundan, bu programların bunu ilk sırada yapması gariptir.

Bu programların yalnızca tam sütunları ve satırları ayarlamasına ve tek tek hücreleri bölmesine izin vermenin bir yolu var mı?

Diğer çözümler için önerileriniz var mı?

enter image description here

+0

OCR'yi uygulamanızdan veya son kullanıcı uygulamalarını aramaya mı çalışıyorsunuz? İkincisi o zaman Stackexchange –

cevap

1

ABBYY OCR ürünleri bir yeri vardır, yapılandırılabilir olanlar FineReader Motor ve FlexiLayout Studio denir. Diğer ABBYY ürünlerinin istenen ayarları yoktur.

+0

teşekkürler gibi daha iyi olmalıdır. Çok yararlı. Bu ürünlerin farkında değildim. – mgalka

İlgili konular