Soru:
Tarihçi Dr. Ayşe Hanım, dijital bir arşivde yer alan ve Osmanlıca harflerle yazılmış \( n \) adet gazete küpüründen, "hürriyet" kelimesinin geçtiği tüm makaleleri otomatik olarak bulmak istiyor. Bunun için bir dizi dijital işlem uygulaması gerekiyor. Aşağıdaki işlem adımlarını doğru sıralayınız.
- a) Transkripsiyon (Osmanlıca'dan Latin harfli Türkçe'ye çeviri)
- b) Gazete sayfalarının yüksek çözünürlüklü taranması
- c) Metin madenciliği yazılımı ile "hürriyet" kelimesinin taranması
- d) OCR (Optik Karakter Tanıma) işlemi
Çözüm:
💡 Bu soru, birincil kaynağın ham halinden aranabilir metne dönüşüm sürecindeki mantıksal sırayı sorgulamaktadır.
- ➡️ 1. Adım (b): İlk adım, fiziksel gazete küpürlerini dijital görüntülere dönüştürmek, yani yüksek çözünürlüklü tarama yapmaktır.
- ➡️ 2. Adım (d): Dijital görüntüdeki yazıları, bilgisayarın okuyabileceği bir metin formatına dönüştürmek için OCR işlemi uygulanır. Ancak bu aşamada metin hala Osmanlıca harflerle olacaktır.
- ➡️ 3. Adım (a): OCR ile elde edilen Osmanlıca metin, Latin harfli Türkçe'ye transkribe edilir (çevrilir). Bu adım, "hürriyet" gibi bir kelimenin aranabilmesi için şarttır.
- ➡️ 4. Adım (c): Artık Latin harfli Türkçe metin elde edildiğine göre, bir metin madenciliği aracı veya basit bir metin tarama yazılımı kullanılarak "hürriyet" kelimesi taranabilir.
✅ Doğru sıralama: b → d → a → c şeklindedir. Bu sıra, dijital bir belgenin işlenmesindeki temel mantığı yansıtır: Fiziksel → Dijital Görüntü → Dijital Metin (OCR) → Okunabilir/Arşanabilir Metin (Transkripsiyon) → Analiz (Arama).