++ c Alman png resimleri okuma teserakt ocr kullanarak iam ve ben tesseract OCR Alman Özel Karakterler
gibi bazı özel karakterler ile ilgili sorunlar var ß ä ö ü vb.Bu doğru okumak için tesseract eğitmem gerekiyor mu, yoksa ne yapılması gerekiyor?
This is the part of the original image read by tesseract
tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();
GÜNCELLEME
SetConsoleOutputCP(1252);//changed to german.
SetConsoleCP(1252);//changed to german
wcout << "ÄÖÜ?ß" << endl;
// Open input image with leptonica library
Pix *image = pixRead("D:\\Images\\Document.png");
api->Init("D:\\TesseractBeispiele\\Tessaractbeispiel\\Tessaractbeispiel\\tessdata", "deu");
api->SetImage(image);
api->SetVariable("save_blob_choices", "T");
api->SetRectangle(1000, 3000, 9000, 9000);
api->Recognize(NULL);
// Get OCR result
wcout << api->GetUTF8Text());
After changing the Code below the Update sert kodlu umlauts doğru gösterilir, ancak resim issnt metin doğru, ne ben değiştirmek gerekir?
teserakt sürüm 3.0.2 leptonica sürüm 1.68
neredeyse kesin UTF-8 için yapılandırılmamış konsol. – MSalters
Konsolu utf8 için nasıl konfigüre edersiniz? – Cazzador