Optik Karakter Tanıma Nedir? bilgisayarınızda bir belge almak ve bir yazıcıyla fiziksel bir kopya almak kolay olsa da, diğer tarafa gitmek genellikle daha zordur. Tarayıcılar mevcut olsa ve taranan belgeleri görüntü olarak kaydedebilse de, belgeyi düzenlemek istiyorsanız bu özellikle yararlı değildir. Bir belgeyi düzenleyebilmek için Optik Karakter Tanıma veya OCR adlı bir teknoloji kullanmak istiyorsunuz.
Optik karakter tanıma nasıl çalışır?
OCR, belgeleri doğru bir şekilde okumak için bir dizi teknik kullanır. OCR yazılımı belgeyi ve potansiyel kelimeleri bile doğru hizalanacak şekilde ayarlar. Görüntü, gri tonları arasında ayrım yapmaktan daha kolay olduğu için saf siyah beyaz formata dönüştürülür. Metin olmayan öğeleri tanımlamak ve kaldırmak için de analiz yapılır.
İki ana OCR algoritması türü kullanılır: matris eşleştirme ve özellik çıkarma. Matris eşleşmesi, tek bir karakterin görüntüsünü alır ve ardından piksel bazında yapılandırılmış fontlarla algoritmalarla karşılaştırır. Bu teknik, karakterin diğer tüm içeriklerden doğru şekilde izole edilmesini ve yazı tipinin OCR yazılımına dahil edilmesini gerektirir. Bu tür OCR, el yazısını tanımak için de çalışmaz.
Özellik çıkarma algoritmaları her karakteri çizgiler, eğriler ve çizgi kesişimleri gibi özelliklere böler. Bu teknik, bilinen yazı tipleriyle eğitilen algoritmaya olan bağımlılığı önemli ölçüde azaltır. Özellik ayıklama, yeni yazı tiplerini tanıma ve bunları yazıya dökmenin yanı sıra bazı el yazısı da kullanabilir, ancak doğruluk bilinen yazı tipleri kadar iyi değildir.
Bazı daha gelişmiş yazılımlar, net olmayan harfleri tanımlamak için çevredeki harflerin içeriğini kullanır. Örneğin, “köpek” kelimesi basılırsa ve OCR algoritması “o” nun “a” veya “o” olup olmadığından emin olamazsa, potansiyel karakterlerin herhangi bir kombinasyonunun olup olmadığını görmek için bir sözlük kullanabilir bilinen bir kelime yapar. Bu durumda, OCR algoritması “a” olasılığını azaltır, çünkü “dag” bir kelime değildir, “dog” ise.
OCR nerede kullanılır?
OCR’nin ana kullanımlarından biri posta sistemindedir. OCR, harflerin ve paketlerin adresini otomatik olarak tanımlamak için kullanılır; bu, insanların yapabileceğinden çok daha hızlı yapabileceği bir görevdir. OCR sisteminin etiketin adresini okuyamadığı durumlarda, bunun yerine bir insanın manuel olarak işlenmesi ayrılacaktır.
OCR, bir metin-konuşma aracıyla birleştirildiğinde görme engelli kişiler için erişilebilirlik aracı olarak yararlıdır. Google translate, resimlerdeki metni tercüme etme sürecinin bir parçası olarak OCR’yi de uygular.