2012-11-29 29 views
6

Sadece Android ocr tuslarını kullanarak bir Android OCR aracı uyguluyordum. Şimdiye kadar, normal haneli yazı tipleri ile oldukça yüksek doğruluk veriyor. Bununla birlikte, 7 segment basamağına (LCD'de bulunanlara) gelince, doğruluk çok kötü.Android Tesseract OCR 7 Segment Basamakları

Resmimi kırpmayı denedim, 0 ile 9 arasında beyaz liste ve ayrıca bazı görüntü işleme yok. Doğruluğun nasıl artırılacağı konusunda bir fikrin var mı? Ya da tesseract için belirli 7 segment haneyi eğitme konusunda bazı ipuçları kesinlikle bana çok yardımcı olacaktır.

Şimdiden teşekkürler.

+0

Yeniden eğitim almadan iyi sonuçlar alabileceğinizi düşünmüyorum. 7 bölümlük basamaklar için herkese açık bir eğitimli dosya varsa güzel olurdu, ancak baktığımda bir tane bulamadım. – rmtheis

+0

Cevabınız için teşekkür ederiz. Blogunuz gerçekten benim uygulamada çok yardımcı oldu. Yani, size çok teşekkürler. Onu eğitmeyi ve boks süreci için bbtesseract'a bakmayı planlıyorum. Biri eğitim süreci için bazı ipuçlarını paylaşabilirse çok sevinirim çünkü resmi olanın kafamı karıştırıyor. – laurie7

+0

Eğitimde kullanılacak TIFF/kutu dosyalarını düzenlemek veya oluşturmak için [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) kullanabilirsiniz. Ayrıca, antrenmanın geri kalanını otomatikleştiren bir PowerShell betiği olan 'train.ps1 'bulunmaktadır. – nguyenq

cevap

2

Sen 7 segmentler için traineddata bulabilirsiniz: aynı deposunda örnek piton kodu vardır

https://github.com/arturaugusto/display_ocr/tree/master/letsgodigital

.

+0

Traktörden sadece hanelere nasıl eğitildiğini söyleyebilir misiniz? – malaguna

+0

"lets go digital" adında bir yazı tipini kullanarak bazı resimler oluşturdum, gimp kullanarak biraz gürültü ekledim, kutu verisini üretmek için [jTessBoxEditor] (http://vietocr.sourceforge.net/training.html) kullanıldı ve kullanıldı [bu] Eğitim için (https://github.com/this-is-ari/python-tesseract-3.02-training) aracı. Daha fazla bilgi için [tesseractocr SSS] 'ı okuyun (https://github.com/tesseract-ocr/tesseract/wiki/FAQ). Ayrıca [eğitim kaynaklarını] paylaştım (https://github.com/arturaugusto/display_ocr/tree/master/training_source) – art