Dijital tarihçilik nedir

Örnek 08 / 08
Soru:

Dijital bir kütüphanede, 1923-1950 yılları arasında yayınlanmış ve tarayıcılar tarafından "resim" olarak kaydedilmiş 50 farklı gazete sayfası bulunuyor. Bir araştırmacı, bu gazetelerde "kadın hakları" ile ilgili haber ve makalelerin sayısının yıllara göre değişimini analiz etmek istiyor. Gazetelerin fiziksel olarak tek tek elle taranması çok uzun sürecektir. Bu süreci hızlandırmak ve otomatikleştirmek için hangi dijital araç ve işlem sırası kullanılmalıdır?

Çözüm:

💡 Bu soru, dijital tarihçilikte sıkça kullanılan Optik Karakter Tanıma (OCR) ve metin madenciliği işlem akışını anlamayı gerektirir.

  • ➡️ 1. Adım: Görüntü Ön İşleme (Image Pre-processing): Tarayıcıdan elde edilen gazete sayfası görüntüleri, OCR doğruluğunu artırmak için iyileştirilir. Bu adımda eğrilik düzeltme, kontrast artırma ve lekelerin temizlenmesi gibi işlemler yapılır.
  • ➡️ 2. Adım: Optik Karakter Tanıma (OCR) İşlemi: İyileştirilmiş görüntüler, bir OCR yazılımına (örneğin Tesseract OCR) beslenir. Bu yazılım, görüntüdeki yazılı alanları tespit eder ve harf harf tanıyarak dijital, taranabilir ve kopyalanabilir bir metin dosyasına (genellikle .txt veya .pdf) dönüştürür. Osmanlı Türkçesi veya eski Latin harfli metinler için özel eğitilmiş OCR modelleri gerekebilir.
  • ➡️ 3. Adım: Metin Madenciliği ve Analiz: Tüm gazeteler dijital metne dönüştürüldükten sonra, bir metin analiz yazılımı veya programlama dili (örneğin Python) kullanılarak bu büyük metin koleksiyonu taranır. "Kadın", "hak", "seçim", "eşitlik", "çalışma" gibi önceden tanımlanmış anahtar kelimeler aranır. Yazılım, bu kelimeleri içeren makaleleri sayar ve hangi gazetenin hangi yılında kaç tane ilgili haber yaptığını hesaplar.
  • ➡️ 4. Adım: Görselleştirme: Elde edilen sayısal veriler (yıllara göre haber sayısı), bir çubuk grafik veya çizgi grafik haline getirilerek, 1923-1950 dönemindeki "kadın hakları" konusunun medyadaki seyri görsel olarak ortaya konulur.

✅ Sonuç, elle taramanın aylar sürebileceği bir araştırma sorusunun, dijital araçlarla saatler veya günler içinde cevaplanabilmesi ve niceliksel bir eğilim analizinin elde edilmesidir.

1 2 3 4 5 6 7 8
Konuya Geri Dön: