20-ci həftənin sualı Azərbaycan dilində imla yoxlayıcısı ilə bağlı idi. Bizim də üzərində çalışmaqda olduğumuz bir problem olan imla yoxlayıcısı məsələsi, eyni zamanda dil və onu necə istifadə etdiyimiz barədə düşünmək üçün oxucularımıza yaxşı imkan verir. Bu suala ən yaxşı cavabın müəllifi Elnur Hacıyev olmuşdur. Elnur cavabında imla yoxlayıcısının düzgün işləməsi üçün lazımi komponentləri göstərmişdir. Bunlara dildəki sözləri ehtiva edən lüğət bazası, şəkilçilər siyahısı, şəkilçilərin sözlərə birləşmə qaydaları daxildir. Lakin Azərbaycan dilinin morfoloji zənginliyi təkcə bu komponentlərlə imla yoxlayıcısı hazırlamağa imkan vermir.
Azərbaycan dilinin morfoloji zənginliyi ondadır ki, sözlərin çoxu bir sıra şəkilçilər qəbul edə bilir və beləcə, bir söz minlərlə söz-forma yarada bilir. Sözlər şəkilçi qəbul edərək fərqli nitq hissəsinə, fərqli cümlə üzvünə çevrilə bilir. Buna görə də adekvat işləyən imla yoxlayıcısı ilk öncə söz səviyyəsində morfoloji analiz aparıb, sözü parçalara ayıra bilməlidir.
Lakin imla yoxlayıcısının işi təkcə səhvləri tapmaq deyil, eyni zamanda düzgün alternativləri təklif etməkdir. Buna görə də, bir çox imla yoxlayıcısı həm də insanların tez-tez etdikləri səhvləri modelləşdirən səhvetmə modeli də ehtiva edir. Bu model sayəsində səhvin hansı növ səhv olduğunu təyin edib, düzgün alternativləri təklif etmək olur.
İmla yoxlayıcısının işi heç bununla da bitmir. Belə ki, imla yoxlayıcısı ideal olaraq təkcə söz səviyyəsində deyil, eyni zamanda, cümlə səviyyəsində işləməli, sözün cümlədəki işlənmə tərzini, yerini də analiz edib, məsələn, doğru yazılmış sözün cümlədə qrammatik olaraq doğru istifadə olunub-olunmadığını təyin etməlidir. Bunun üçün dil modellərindən geniş istifadə olunur. Dil modelləri geniş bir dil toplusunda sözlər arasındakı statistik əlaqələri təsbit edir, müəyyən bir söz ardıcıllığından (və ya tək bir sözdən) sonra hansı sözün gələcəyinin ehtimalını hesablayır. Dil modellərindən dilin istifadə edildiyi demək olar ki, hər yerdə, o cümlədən, müasir smartfonların yazı sistemlərində də istifadə olunur.
Qısacası, Azərbaycan dilində imla yoxlayıcısının əsas vəzifəsi sözlərin morfoloji analizi, onların cümlədəki yerini və istifadəsini yoxlamaq, səhvlərin növünü təyin edib, potensial doğru variantlar təklif etməkdir. Bu vəzifələri yerinə yetirmək üçün bizə görə ən başlıca lazım olan komponentlər morfoloji analizator, lüğət, dil və səhvetmə modelləridir.
Mövzu ilə maraqlananların nəzərinə, Türk dili üçün imla yoxlayıcısı mövzusunda yazılmış bu məqalədə müxtəlif yanaşmaların müqayisəsi verilmişdir:
Torunoglu-Selamet, D., Bekar, E., Ilbay, T., & Eryigit, G. (2016). Exploring Spelling Correction Approachesfor Turkish. In Proceedings of the 1st International Conference on Turkic Computational Linguistics at CICLING, Konya (pp. 7-11).