Herkese merhaba dostlar. Ben TRKByte. Bu konuda Ocr Tesseract kütüphanesi ile resim üzerindeki yazıyı okumayı öğreneceğiz. Gerekli kütüphaneleri konunun sonunda bırakacağım. Projeye başlamadan oradan indirin.
Öncelikle bir proje oluşturup içerisine PictureBox, Button, RichTextBox ve OpenFileDialog ekleyin.
Daha sonra
Tesseract kütüphanemizi Nuget Yöneticisinden veya
Paket Yönetici konsolundan verdiğim linke girerek ekleyin.
Projeye bir kere derleyip kapatın ve projenin
bin/debug klasörüne girin.
Klasöre tessdata adında bir klasör oluşturun ve içerisine konunun sonunda verdiğim linke girerek seçtiğiniz dili içerisine atın.
Bunları yaptıysanız kodları yazmaya geçelim.
İlk önce projemize Tesseract kütüphanemizi tanıtalım.
Daha sonra buttona çift tıklayıp şu kodu içerisine ekleyelim.
C#:
if (openFileDialog1.ShowDialog() == DialogResult.OK)
{
var img = new Bitmap(openFileDialog1.FileName); // img tagına ofdden seçtiğimiz resmi tanıttık.
pictureBox1.Image = img; // Seçilen resmi PictureBoxa aktardık.
var ocr2 = new TesseractEngine("./tessdata", "tur"); // bin/debug klasörüne açtığımız "tessdata" klasörünü Tesseract modülüne tanıtıp hangi dil olduğunu söyledik.
var sonuc = ocr2.Process(img); // sonuc tagına seçtiğimiz imgi ocr ile okuttuk.
richTextBox1.Text = sonuc.GetText(); //Richtextboxa yazdırdık.
}
Her şey tamam. Projeyi derleyip test edebilirsiniz.
DİPNOT: Konuyu herkesin anlayabilmesi için basitleştirilerek ve en sade şekilde anlattım. Açıklamalara bakıp yanlış söylemişsin, yanlış teleffuz etmişsin gibi boş şeyler yazmayın. Teşekkür ederim.
Kütüphaneler
Tesseract Nuget:
Tesseract tessdata: