Soru:
Bir üniversite kütüphanesi, el yazması bir şer'iye sicil defterini dijitalleştirerek araştırmacıların kullanımına sunmak istiyor. Bu süreçte aşağıdaki adımlardan hangisi, metinlerin aranabilir ve analiz edilebilir hale gelmesi için gerekli olan Optik Karakter Tanıma (OCR) işleminden sonra atılması gereken bir adım değildir?
- A) Dijitalleştirilen görüntü dosyalarının yüksek çözünürlükte taranması
- B) OCR yazılımı ile metnin makine tarafından okunabilir hale (örn. PDF veya TXT) getirilmesi
- C) Tanınan metnin, orijinal el yazısındaki hataları veya eski sözcükleri içerebileceğinden, düzeltme ve doğrulama işlemlerinin yapılması
- D) Düzeltilmiş metni, belirli etiketler (örn. kişi adları, yer adları, tarihler) kullanarak yapılandırılmış veri formatına (örn. XML/TEI) dönüştürülmesi
Çözüm:
💡 Soruda, OCR işleminden SONRA atılması gereken OLMAYAN adım sorulmaktadır. OCR, bir belgeyi tarayıp dijital görüntüye aldıktan sonra uygulanan bir işlemdir.
- ➡️ A Seçeneği: Bu işlem, belgenin dijital bir kopyasının oluşturulmasıdır ve OCR işleminden ÖNCE yapılması gereken temel adımdır. Dolayısıyla, OCR sonrası bir adım değildir.
- ➡️ B Seçeneği: Bu, OCR işleminin kendisinin tanımıdır ve doğru bir adımdır.
- ➡️ C Seçeneği: OCR sonrası metin genellikle hatalar içerir, bu nedenle düzeltme (proofreading) yapılması kritik bir sonraki adımdır.
- ➡️ D Seçeneği: Metnin analiz edilebilirliğini artırmak için yapılandırılmış veri formatlarına dönüştürülmesi, düzeltme sonrasında atılan gelişmiş bir dijital adımdır.
✅ Doğru cevap A seçeneğidir, çünkü yüksek çözünürlüklü tarama, dijitalleştirme sürecinin başında, OCR'den önce gerçekleştirilir.