2014-12-27 41 views
11

Yazdırılan metnin OCR tanıma üzerinde çalışıyorum. Özellikle, Tesseract motorunun sonuçlarını iyileştirmek için ön işleme adımına odaklanıyorum. Zaten adaptif eşik, gürültü giderme, yazı masası vb. Ile iyi sonuçlar elde ettim ... Ama yine de Tesseract diğer ticari ürünlerde iyi sonuç alındığında başarısız oluyor.Tesseract OCR sonuçlarını bulanık metinle geliştirin

Aşağıdaki test görüntüsünü kullandım ve burada iki ticari OCR apis ile karşılaştırıldığında Tesseract 3.04 ile elde edilen sonuçlar. Tüm 3 hizmetler, biraz az bulanık metin içeren aynı ikili görüntü ile sağlandı.

Text image used to compared the 3 OCR products

tesseract

Careers in Technology Consulting 

Networking Lunch 
21 m 2014, 11:00 - 14:30 

Definingthecorporatellstmtegy, Wammmwdngdeal, creating 
uniquebwinessisighnwilgbigdam-doesflismflxemmyouafioy? 

Findoutmoreabanhowitfeektomkasatedlflogymbyjoiningour 

for further mm please visit mAeloittexom/weers 

ABBYY Fine Reader Online

Careers in Technology Consulting 
Networking Lunch 
21 November 2014,1140-14:30 
Defining the corporate IT strategy, planning a multHnKon <Mar outsourcing deal, creating unique business insights using big data-doesthis sound Ifce something you enjoy? 
Find out more about hour it feels to work as a technology consultant by joining our exclusive networking lunch, 
For further information please visit wrwMuleloittexom/carcert 

Online OCR

(Emin ABBYY OCR Web Hizmeti konusunda emin değil kendi motorunu kullanan için) veya başka bir ön işleme adımlar vardır
Careers in Technology Consulting Networking Lunch 21 November 2014, 11;00 —14:30 
Defining the corporate IT strategy, planning a muiti-indlimi dollar outsourcing deal, creating unique business insights using big data—does this sound like something you enjoy? 
Find out more about how it feels to work as a tedmology consultant by joining our exclusive networking lunch, 
For further information' please visit wwwdeloitte,com/careers 

Şimdi Tesseract ve diğer iki ürün arasında büyük bir boşluk farklı bir motora bağlı olup olmadığını merak ediyorum Tesseract'ı çalıştırmadan önce yapılabilir. Önerin var mı?

+0

Bir ooooold gönderiyi kontrol etme ve bir cevabı kabul etme hakkında ne dersiniz? – Claudio

+0

Bir ooooold gönderisini kontrol etme ve bir yanıtı kabul etme hakkında ne düşünüyorsunuz? – Claudio

cevap

2

"Sihirli" OCR önişlemi için bir öneri.

original image

ve ona bazı "ön işleme-bilgelik" için geçerlidir: en Test OCRs tüm başarısızlığa uğradığı sağlanan metin görüntüden bir alıntıyı düşünelim, önerilen ön işleme fikrinin prensibini açıklamak amacıyla . İlk zamanki eşikleme:

thresholded image

ve sonra max tespit, kelime-öğeleri arasında dikey çizgiler vurarak bazı "sihirli". 2 piksel yüksek "çubukları" ve onun aşağı alt satırında kelime elemanın kesilmesi ile birlikte kendi kenarlarında onları kesme:

after extracting "i"s

Şimdi dikey iken bu resimde sözcük öğeleri arasında çekim hatlarının geçiş yatay olanlar çok geniş "çubukları" olarak algılar ve genişliğinin ortasında onları dikey kesmek amacıyla: Bu, herhangi bir OCR-motor yardımcı olmalıdır

after splitting grown-together characters

bu özel görüntü üzerinde daha iyi sonuçlar sağlamak için. Bazı ticari OCR motorlarının bu yaklaşımı kullandığını, zaten test edilenlerden daha iyi bir tanıma sağlayabildiğini hayal edebiliyorum. Bu bağlamda, Ubuntu depolarında (tesseract ile karşılaştırılabilir) bulunan başka bir ücretsiz OCR motorundan bahsetmeme izin verin. Birbirlerine karşı test ederseniz, farklı sonuçlar sağladıkları ve daha sonra bilmek için kaynak kodlarına nasıl baktıklarını ve bu deneyimden ticari olanlarla ilgili bir şeyleri anlayabileceğinizi daha da fazla merak edebilirsiniz.

sudo apt-get install cuneiform gocr ocrad