Basit bir metinden kalın ve italik sözcükleri ayıklamak için OCR kullanarak ilgileniyorum. Örneğin, eğer giriş şöyle metin ile net bir resim: "tembel köpeğin üstünden atlar hızlı kahverengi tilki"Yazı tipi stilini (kalın, italik) algılamak için OCR kullanabilir miyim?
Öyle şöyle bir çıktı elde etmek istiyorum: kalın, ("atlar" "kahverengi") italik ("tembel") Ben OCRopus veya Tesseract ile bunu içine baktım
ama belgelerdir fakir ve mümkün mü, yoksa nasıl yapılacağını söyleyemem.
Yeni url: https://github.com/tesseract-ocr/tesseract/blob/3.01/api/resultiterator.h#L95 –