Risale-i Nur'da Sıklıkla Kullanılan Kelimelerin Periyodik Olarak Tekrarlanma Oranı (Frekansı)
Risale-i Nur okuyanların en fazla yaşadığı problem, birçok kelimeyi bilmemek veya anlamını hatırlayamamaktır. Aslında eserlerde geçen pek çok kelimeyi, Türkçe bilen hemen hemen herkesin bilmesine rağmen kelimeleri çok az kullandığından, zihninde anlamı oturtması için tekrar etmesi gerekiyor. Bu durumdan dolayı yorulan kimseler ümitsizliğe kapılıp eseri okumayı terk edebiliyorlar. Burada amaçladığm, kelimelerin öğrenme sürecini ALFABETİK sıraya göre değil kelimelerin sıklık sırasına göre düzenlemek. Böylelikle her yeni okuyucu çok hızlı bir şekilde eserlerden tek başına daha doğru istifade edebilmeye başlayacaktır.
Yaptığım çalışmada aşağıdaki değerlere ulaştım. Bu değerlere göre örneğin Sözler adlı kitaptaki 13629 farklı kelimeyi (bunların bir kısmı eklerle türetilmiştir; hakiki, hakikat, hakaik gibi) bilebilseydik 56385 defa sayfa altına bakma ihtiyacı duymazdık. Tabi bu kadar kelimeyi öğrenmek zaman alacaktır fakat başlangıç için en çok kullanılan kelimelerin ilk 100 adeti acaba bize ne kazandırırdı? En çok tekrarlanan ilk 300 veya 500 kelime toplamda kaç tekrar gücüne sahip? Bizi kaç defa sayfa altlarına bakmaktan kurtarabilir?
Bu şu demek; 100 kelimeyi bildiğinizden emin olduğunuzda, bir sözlüğe veya sayfa altı lügate bakma ihtiyacınız Sözler'de 12234 defa azalmış olacaktır.
Kitap | Toplam Kelime | Özgün Kelime | 100 Kelime | 200 Kelime | 300 Kelime | 400 Kelime | 500 Kelime | 1000 Kelime | 2000 Kelime |
---|---|---|---|---|---|---|---|---|---|
Sözler | 56385 | 13629 | 12234 | 17185 | 20647 | 23231 | 25288 | 32042 | 39050 |
Mektubat | 33331 | 9473 | 7074 | 9953 | 12007 | 13616 | 14930 | 19229 | 23570 |
Lem_alar | 32288 | 8151 | 7467 | 10538 | 12712 | 14351 | 15689 | 20118 | 24364 |
Şuâlar | 46138 | 9227 | 11551 | 16019 | 19227 | 21752 | 23740 | 30135 | 35967 |
Asâ-yı Mûsâ | 17228 | 4839 | 4868 | 6667 | 7908 | 8843 | 9595 | 12033 | 14344 |
Barla Lâhikası | 23344 | 7953 | 5273 | 7362 | 8753 | 9824 | 10700 | 13554 | 16533 |
Kastamonu Lâhikası | 15357 | 4854 | 4532 | 6109 | 7169 | 7972 | 8606 | 10587 | 12503 |
Emirdağ Lâhikası | 29171 | 6689 | 7666 | 10844 | 13014 | 14618 | 15888 | 19867 | 23590 |
İman ve Küfür Muvazeneleri | 12218 | 4380 | 3086 | 4318 | 5168 | 5833 | 6372 | 8143 | 9838 |
Tarihçe-i Hayat | 39720 | 9745 | 7987 | 11592 | 14232 | 16294 | 18014 | 23633 | 29012 |
Bu şu demek; 100 kelimeyi bildiğinizden emin olduğunuzda, bir sözlüğe veya sayfa altı lügate bakma ihtiyacınız Sözler'de yüzde 21.7 oranında azalmış olacaktır.
Kitap | Toplam Kelime | 100 % | 200 % | 300 % | 400 % | 500 % | 1000 % | 2000 % |
---|---|---|---|---|---|---|---|---|
Sözler | 56385 | 21.7% | 30.5% | 36.6% | 41.2% | 44.8% | 56.8% | 69.3% |
Mektubat | 33331 | 21.2% | 29.9% | 36.0% | 40.9% | 44.8% | 57.7% | 70.7% |
Lem_alar | 32288 | 23.1% | 32.6% | 39.4% | 44.4% | 48.6% | 62.3% | 75.5% |
Şuâlar | 46138 | 25.0% | 34.7% | 41.7% | 47.1% | 51.5% | 65.3% | 78.0% |
Asâ-yı Mûsâ | 17228 | 28.3% | 38.7% | 45.9% | 51.3% | 55.7% | 69.8% | 83.3% |
Barla Lâhikası | 23344 | 22.6% | 31.5% | 37.5% | 42.1% | 45.8% | 58.1% | 70.8% |
Kastamonu Lâhikası | 15357 | 29.5% | 39.8% | 46.7% | 51.9% | 56.0% | 68.9% | 81.4% |
Emirdağ Lâhikası | 29171 | 26.3% | 37.2% | 44.6% | 50.1% | 54.5% | 68.1% | 80.9% |
İman ve Küfür Muvazeneleri | 12218 | 25.3% | 35.3% | 42.3% | 47.7% | 52.2% | 66.6% | 80.5% |
Tarihçe-i Hayat | 39720 | 20.1% | 29.2% | 35.8% | 41.0% | 45.4% | 59.5% | 73.0% |
Aşağıdaki kod yaptığım çalışmada kullandığım bir parça. Kodların tamamını yukarıdaki "Risale_i_Nur_Kelime_Analizleri_2022_07_28.ipynb" dosyasında bulabilirsiniz.
Buradan yola çıkarak kelimelerin pek çoğunun ilgili konuya özel ve sadece yerinde kullanıldığını görebiliriz. Ayrıca sayfa altlarında bulunan kelimeleri derleme şeklimiz %100 doğru sonuca ulaşmamızı engellediğini de belirtmek gerekli. Çünkü sayfa altındaki kelime listesine erisale.com gibi sitelerden derledik. Bir sayfada birden fazla tekrarı olmuş olsa bile sayfa altında bir defa geçtiğinden frekans değeri etkilenmiş olacaktır. Fakat ilk 500 kelime listesi içinde sırası değişse de liste içinde kalacağını (%90+) söyleyebiliriz.
Şimdi en çok kullanılan kelimelerin tekrarlarına odaklanalım. İlk 100, 200 ... 1000 ve 2'den fazla tekrarlananların toplam değerini bulalım.
ozgun = sozler['kelime'].value_counts()
for x in [100, 200, 300, 400, 500, 1000, 2000]:
print(f"Sözler'deki ilk {x} kelimenin tekrar toplamı : ", ozgun.head(x).sum())
Yukarıdaki kod çıktı olarak aşağıdaki sonuçları vermektedir.
Sözler'deki ilk 100 kelimenin tekrar toplamı : 12234
Sözler'deki ilk 200 kelimenin tekrar toplamı : 17185
Sözler'deki ilk 300 kelimenin tekrar toplamı : 20647
Sözler'deki ilk 400 kelimenin tekrar toplamı : 23231
Sözler'deki ilk 500 kelimenin tekrar toplamı : 25288
Sözler'deki ilk 1000 kelimenin tekrar toplamı : 32042
Sözler'deki ilk 2000 kelimenin tekrar toplamı : 39050
Sözler adlı kitapta sayfa altlarındaki sözlükte bulunan kelime sayısı, tekrarlar dahil 56385
Sözler adlı kitapta sayfa altlarındaki sözlükte bulunan kelime sayısı, tekrarlar hariç 13629
Evet 100 kelime tekrarların yaklaşık %25'ini karşılıyor. Başlangıç için çok iyi öyle değil mi?
Kitap | 100 Kelime | 200 Kelime | 300 Kelime | 400 Kelime | 500 Kelime | 1000 Kelime | 2000 Kelime |
---|---|---|---|---|---|---|---|
Sözler | 21.7% | 30.5% | 36.6% | 41.2% | 44.8% | 56.8% | 69.3% |
Mektubat | 21.2% | 29.9% | 36.0% | 40.9% | 44.8% | 57.7% | 70.7% |
Lem_alar | 23.1% | 32.6% | 39.4% | 44.4% | 48.6% | 62.3% | 75.5% |
Şuâlar | 25.0% | 34.7% | 41.7% | 47.1% | 51.5% | 65.3% | 78.0% |
Asâ-yı Mûsâ | 28.3% | 38.7% | 45.9% | 51.3% | 55.7% | 69.8% | 83.3% |
Barla Lâhikası | 22.6% | 31.5% | 37.5% | 42.1% | 45.8% | 58.1% | 70.8% |
Kastamonu Lâhikası | 29.5% | 39.8% | 46.7% | 51.9% | 56.0% | 68.9% | 81.4% |
Emirdağ Lâhikası | 26.3% | 37.2% | 44.6% | 50.1% | 54.5% | 68.1% | 80.9% |
İman ve Küfür Muvazeneleri | 25.3% | 35.3% | 42.3% | 47.7% | 52.2% | 66.6% | 80.5% |
Tarihçe-i Hayat | 20.1% | 29.2% | 35.8% | 41.0% | 45.4% | 59.5% | 73.0% |
Kelime sayısı arttıkça sıklık azalıyor. 300 kelime %40'ı karşılıyor! 1000 kelime ise %60+ kelimeyi karşılıyor ve lügata bakmaktan kurtarıyor.
Sonuç olarak yeni başlayanlar ve çocuklar için ilk 300-500 kelimenin öğrenileceği basit bir sözlük çok elverişli olacağı apaçık ortadadır. Peki ilk 100 kelimede neler var? Burada çok yer tutacağından python kodlarını ve zamanla sonuçları da haricen yüklemek niyetindeyim.
Aşağıdaki 100 kelimeden acaba bildikleriniz kaç tanesi? Örneğin nazar, zemin, aciz, kainat, alem gibi bildiklerinizi de düşünürseniz 1000 kelimeyi öğrenmek sizce ne kadar zaman alır?
suret, hakikat, kâinat, hikmet, nefis, mevcudat, kudret, âlem, nazar, nihayetsiz, mazhar, rahmet, zemin, cihet, hadsiz, hakikî, şehadet, sair, beyan, saadet, intizam, icad, temsil, nevi, nuranî, nam, umum, Hâlık, muntazam, muhtelif, arz, Kur’ân-ı Hakîm, âhiret, Cenâb-ı Hak, mahiyet, mâlik, beşer, cilve, mahlûkat, vücud, lisan, cüz’î, tabiat, lâtif, zîhayat, kat’î, Sâni, medar, ulvî, ziya, acz, âciz, zerre, küllî, dalâlet, ubûdiyet, mahlûk, kemâl, nisbet, haşir, esmâ, istidat, âyine, kelâm, saadet-i ebediye, esbab, ebedî, Sâni-i Hakîm, azîm, ihsan, acip, mukabil, ziyade, delâlet, taife, Sâni-i Zülcelâl, muvazene, nihayet, câmid, inkâr, mizan, elhasıl, muhabbet, hak, ihtiyar, nev’, zikretmek, burhan, haşiye, ekser, Aleyhissalâtü Vesselâm, irade, bekà, menzil, muhal, Zât-ı Zülcelâl, vahdet, semâ, musahhar, eşya >
İnşallah pek yakında güncellenmeye devam edecek...