2013-03-27 22 views
15

Word Lens gibi bir uygulama geliştirmeyi planlıyorum. Herhangi biri kullanabileceğim iyi bir kütüphane önerebilir mi? veya herhangi bir kişi Word Lens Uygulamasının arkasındaki teknolojiyi açıklıyor mu? zaman görüntü eşlemesi mi, yoksa OCR mi? OpenCV, tesseract gibi bazı görüntü işleme kitaplıklarını biliyorum ... Herhangi bir yardım büyük beğeni topladı ...Reel TIme Image Processing (OCR)

cevap

42

Ben Word Lens'in yaratıcılarından biriyim. Dışarıda (tesseract gibi) bazı OCR kütüphaneleri olmasına rağmen, daha iyi sonuçlar ve performans elde etmek için kendi başımıza karar verdik. Kameradan

  1. kopya resim ve metin gibi görünen şeylerin etrafında arka planı açıkça
  2. beraberlik kutuları dikkat çekiyor böylece gri tonlama bileşeni imajını
  3. seviyesini çıkmak: Bizim genel algoritma böyle gider karakterler & için cümleler
  4. do OCR: her kutudaki pikselleri bir karakter veri tabanına karşı eşleştirin - bu gerçekten oldukça zor!
  5. kendisidir tarafından

Görüntü eşleştirme resmin üzerine geri çekiliş sonuçları (OCR hatalar olacaktır, çünkü bu çok zor) bir sözlükte aramak, kelimelere karakterleri toplamak yeterince iyi değil, çünkü orada çok sayıda yazı tipi, kelime ve dil var.

OpenCV, genel olarak bilgisayar görüşü hakkında bilgi edinmek ve birlikte çalışmak için harika bir kütüphanedir. Örneklerini inşa etmeyi ve oralarda oynamanızı tavsiye ederim. İyi eğlenceler!

+0

4 ve 5'i bir şekilde birleştirerek daha iyi sonuçlar alır mısınız? OCR’ye dışarıdan gelen bir kişi olarak, zor durumlarda faydalı olabilecek “5” bilgisini kaybettiniz. –

+1

martin: oldukça doğru; Örneğin, bir 'O', bir '0' ya da bir '8' ve bir 'B' 'ye çok benzerdir, bu yüzden olasılık listelerini tutmaya yardımcı olur, daha sonra daha anlaşılır bilgi mevcut olduğunda aşağıdaki aşamalarda bunları kırpın. (Basit bir geri bildirim) –

+0

(@jd. Yorumunuz için teşekkürler .. Word Lens oluşturmak için ne kadar sürdüğünü biliyor olabilir miyim? OCR için iyi dersler önerir misiniz? –