2017-04-17 26 views
8

Oyun kartı resimlerinin değerini ve takımını nasıl daha güvenilir bir şekilde tanıyabildiğimi merak ediyorum. İşte iki örnek:Yazı tipi olmayan semboller için eğitilebilir mi?

enter image description here enter image description here

Orada görüntülerde biraz gürültü olabilir, ama ben eğitim için kullanabilirsiniz görüntülerin geniş bir veri kümesi sahip olabilirler (bütün değerler dahil kabaca 10k pngs, & takım elbise) .

Bir karma yöntem kullanarak bilinen bir tam eşleşme varsa, el ile sınıflandırdığım görüntüleri güvenilir bir şekilde tanıyabilirim. Ancak, içeriklerine göre görüntüleri paylaştığımdan beri, en küçük ses karmayı değiştirir ve bilinmeyen olarak algılanan bir görüntü ile sonuçlanır. Daha fazla otomasyonla güvenilir bir şekilde ilgilenmek istediğim şey bu. https://github.com/tesseract-ocr/tesseract/wiki/Training-Tesseract#automated-method

sadece yazı bulunan resimlerle eğitilmelidir tesseract Can:

Ben eğitim tesseract üzerinde 3.05 belgeleri inceledikten oldum? Ya da bu kartlar için kıyafetleri tanımak için kullanabilir miyim?

Bu klasördeki tüm görüntülerin 4c'ye (ör., Yukarıdaki örnek görüntüler) karşılık geldiğini söyleyebilirim ve bu durumda, görüntünün gelecekteki herhangi bir örneğinde benzerlik görecektir (gürültüden bağımsız olarak) ve ayrıca 4c olarak. Mümkün mü? Buradaki herkesin deneyimi var mı?

cevap

0

Bu, benim için daha iyi bir yol olduğunu kanıtlayana kadar, bunun çözüm olmayan çözümümdür.

çalışan bu zor kısım olduğunu Başlarken ben kurulum ettik. Ardından, yeni bir caffe ağı eğitmek için veri kümemi kullandım. Tek bir derinlik klasör yapısı içine benim veri kümesi hazırlanmış: Rakamlar içinde

./card 
./card/2c 
./card/2d 
./card/2h 
./card/2s 
./card/3c 
./card/3d 
./card/3h 
./card/3s 
./card/4c 
./card/4d 
./card/4h 
./card/4s 
./card/5c 
./card/5d 
./card/5h 
./card/5s 
./card/6c 
./card/6d 
./card/6h 
./card/6s 
./card/7c 
./card/7d 
./card/7h 
./card/7s 
./card/8c 
./card/8d 
./card/8h 
./card/8s 
./card/9c 
./card/9d 
./card/9h 
./card/9s 
./card/_noise 
./card/_table 
./card/Ac 
./card/Ad 
./card/Ah 
./card/As 
./card/Jc 
./card/Jd 
./card/Jh 
./card/Js 
./card/Kc 
./card/Kd 
./card/Kh 
./card/Ks 
./card/Qc 
./card/Qd 
./card/Qh 
./card/Qs 
./card/Tc 
./card/Td 
./card/Th 
./card/Ts 

, ben seçti:

  1. Veri Setleri sekmesi
  2. Yeni Veri kümesi Görüntüler
  3. Sınıflandırma ben bunu işaret
  4. benim kart klasörü, ör.:/yol/to/kart
  5. Buradaki tartışmayı temel alarak doğrulama% 'yi% 13.0' a ayarlıyorum: https://stackoverflow.com/a/13612921/880837
  6. Veri kümesini oluşturduktan sonra, modelleri açtım
  7. Yeni veri kümemi seçtim.
  8. Standart Ağlar altında GoogLeNet'i seçtik ve eğitmek için onu bıraktı.

Veri kümesinde yeni görüntülerim olduğunda bunu defalarca yaptım., 2c, 7h ( https://github.com/BVLC/caffe/blob/master/examples/cpp_classification/classification.cpp

sonuç bir kart ya şunlardır: Bu mantığı kullanarak, Her öğrenme oturumu 6-10 saat sürdü, ancak bu aşamada ben programlı her resim olması bekleniyor neler tahmin etmek benim caffemodel kullanabilirsiniz vb), gürültü veya masa. % 90'dan büyük bir doğrulukta tahminler büyük olasılıkla doğrudur. En son koşum, sadece 3 hatayla 400 görüntüden 300 tanesini doğru olarak kabul etti. Veri kümesine yeni görüntüler ekliyorum ve mevcut modeli yeniden test ederek sonuç doğruluğunu daha fazla ayarlıyorum. Umarım bu diğerleri için değerlidir! Burada üst düzey adımları isterken

bu her David Humphrey ve onun github mesaja büyük sayesinde yapıldığını, gerçekten öğrenmeye ilgileniyorsanız okumayı ve bunu denemek tavsiye daha: https://github.com/humphd/have-fun-with-machine-learning