XXI Əsr üçün Statistik Düşüncə - Fəsil 2: Data ilə İşləmək

2.1 Data nədir?

Data ¹ ilə əlaqəli ilk vacib məsələ data sözünün cəmdə olmasıdır (bəzi insanlar bu barədə mənimlə razılaşmır). Bir digər məsələ “data” sözünü necə tələffüz etdiyinizdir – şəxsən mən “dey-ta” deyirəm, amma “da-ta” deyən bir çox insan tanıyıram və buna baxmayaraq onlarla dost qalmağı bacarıram. Amma cəmdə yox, təkdə “data” desələr, onda başqa məsələ…

2.1.1 Keyfiyyət datası

Data dəyişənlərdən ibarətdir; dəyişən dedikdə unikal ölçü və ya miqdar nəzərdə tutulur. Bəzi dəyişənlər keyfiyyəti əks etdirir, yəni nəyinsə miqdarını yox necəliyini. Məsələn, adətən statistika kurslarımda sinifdə istifadə etmək və tələbələr haqqında daha ətraflı məlumat əldə etmək üçün bir başlanğıc sorğusu keçirirəm. Verdiyim suallardan biri “Sevdiyiniz qida nədir?” sualıdır ki, bu suala verilən cavablar arasında belələri var: qaragilə, şokolad, makaron, pizza və manqo. Bu data mahiyyətcə kəmiyyəvi yox, keyfiyyəvidir; cavabların hər birinə rəqəm verə bilərik (1 = qaragilə, 2 = şokolad, və s.), ancaq bu zaman rəqəmləri həqiqi rəqəmlər kimi yox, etiket kimi istifadə etmiş olacağıq; məsələn, belə vəziyyətdə rəqəmləri toplamaq məntiqli olmazdı (şokoladın üstünə qaragilə gəlmək, kulinar mənada məntiqli olsa da, riyazi mənada məntiqsizdir). Lakin, daha sonra görəcəksiniz ki, işimizi asanlaşdırmaq üçün tez-tez keyfiyyət datasını rəqəmlərlə kodlaşdıracağıq.

2.1.2 Kəmiyyət datası

Statistikada daha çox kəmiyyət datası ilə işləyəcəyik, yəni ədədlərlə ifadə oluna bilən data ilə. Məsələn, burada Cədvəl 2.1 statistikaya giriş dərsimdə verilmiş başqa bir sualın nəticələrini göstərir: “Niyə bu sinfi götürürsən?”

Cədvəl 2.1: “Niyə bu sinfi götürürsən?” sualına verilmiş fərqli cavabların sayı.

Niyə bu sinfi götürürsən?	Tələbələrin sayı
Dərəcə planı tələbini yerinə yetirir	105
Ümumi təhsil həcminin tələbini yerinə yetirir	32
Tələb olunmur, amma mövzu ilə maraqlanıram	11
Digərləri	4

Tələbələrin cavabları keyfiyyəvi data olsa da, hər cavabdan neçə dəfə verildiyini hesablayaraq kəmiyyəvi icmal yaratmış olduq.

2.1.2.1 Ədədlərin növləri

Statistikada istifadə etdiyimiz bir neçə ədəd növü var. Bunlar arasındakı fərqləri anlamaq vacibdir, çünki R kimi proqramlaşdırma dilləri tez-tez onları bir-birindən ayırır. ²

İkili (binar) ədədlər. Ən sadə ədədlərdir – sıfır və ya bir. İkili ədədlərdən çox vaxt bir şeyin doğru və ya yanlış olduğunu, mövcud və ya olmadığını göstərmək üçün istifadə edəcəyik. Məsələn, 5 nəfərdən miqrenli baş ağrısı keçirib-keçirmədiklərini soruşa bilərəm. Cavabları aşağıdakı kimi olarsa:

# miqren sualına verilən cavablardan ibarət dəyişən yaradaq

 NeVaxtsaMiqrenOlub <- c ('Bəli','Xeyr','Bəli','Xeyr','Xeyr')

 NeVaxtsaMiqrenOlub

 ##  [1] "Bəli" "Xeyr"  "Bəli" "Xeyr"  "Xeyr"

bu cavabları bərabərliyi təyin edən == simvolundan istifadə edərək, həqiqət dəyərlərinə uyğun kodlaşdıra bilərik. Müqayisə olunan iki şey bərabər olarsa TRUE, olmazsa FALSE olur:

# NeVaxtsaMiqrenOlub dəyişənindən həqiqət dəyərləri əldə edək

 NeVaxtsaMiqrenOlubTF <- NeVaxtsaMiqrenOlub == 'Bəli'

 NeVaxtsaMiqrenOlubTF

 ##  [1]  TRUE FALSE  TRUE FALSE FALSE

R həqiqət dəyərlərini və ikili rəqəmləri eyni şəkildə qiymətləndirir:

# bir sıra ifadənin həqiqiliyini yoxlayaq

 # 1 ədədi TRUE-ya bərabərdir, ona görə də cavab olaraq bunun doğru olduğunu, yəni TRUE almalıyıq

 TRUE == 1

 ## [1] TRUE



 # 0 ədədi FALSE-a bərabərdir; cavab TRUE olmalıdır (yəni, 0 doğrudan da FALSE-a bərabərdir).

 FALSE == 0

 ## [1] TRUE



 # 0 dəyəri TRUE-ya bərabərdir - cavab FALSE olmalıdır (çünki 0 FALSE-a bərabərdir)

 TRUE == 0

 ## [1] FALSE

Həqiqət dəyərləri siyahımızı tam ədədlərə çevirə bilərik:

# as.integer() funksiyasından istifadə edərək həqiqət dəyərlərindən tam ədəd siyahısı yaradaq.

 NeVaxtsaMiqrenOlubIkili <- as.integer(NeVaxtsaMiqrenOlubTF)

 NeVaxtsaMiqrenOlubIkili 

 ##  [1] 1 0 1 0 0

Ehtimallar nəzəriyyəsinə gələndə, dəyərləri bu cür ifadə etməyin çox faydalı ola biləcəyini görəcəyik.

Tam ədədlər. Tam ədədlər kəsr hissəsi olmayan ədədlərdir. Tam ədədlərlə adətən əşyaları sayanda qarşılaşsaq da, onlardan psixoloji ölçmələrdə də tez-tez istifadə olunur. Məsələn, mənim giriş sorğumda, tələbələrə statistikaya olan münasibətlərini göstərən seçimlər verib (“Statistika mənim üçün çox sirli görünür”), bu fikirlə nə qədər razılaşdıqlarını göstərmək üçün 1-dən (“Qətiyyən razı deyiləm”) 7-yə (“Tamamilə razıyam”) qədər qalxan şkala verirəm.

Həqiqi ədədlər. Statistikada əsasən, kəsr hissəsi olan həqiqi ədədlərlə işləyirik. Məsələn, mikroqramdan tutmuş kiloqramadək istənilən dəqiqlik dərəcəsi ilə kiminsə çəkisini ölçə bilərik.

2.2 Ölçü şkalaları

Bütün dəyişənlər ən azı iki fərqli dəyərə malik olmalıdır (əks halda dəyişən yox, sabit olardılar), lakin dəyişənin müxtəlif dəyərləri bir-birilə müxtəlif şəkillərdə əlaqələnir və buna ölçü şkalası deyirik. Dəyişənin dəyərlərinin bir-birindən fərqlənməsinin dörd yolu var:

Kimlik : Dəyişənin hər bir dəyəri unikal bir məna daşıyır.
Böyüklük: Dəyişənin dəyərləri fərqli ölçüdə olub və bir-birilə sıralı əlaqədədir, yəni bəzi dəyərlər daha böyük, bəziləri isə daha kiçikdir.
Bərabər fasilələr: Ölçü şkalası boyunca yerləşən vahidlər bir-birinə bərabərdir. Yəni, məsələn, 1 və 2 arasındakı fərq 19 və 20 arasındakı fərqə bərabərdir.
Mütləq sıfır: Şkala həqiqi sıfır nöqtəsinə malikdir. Məsələn, hündürlük və ya çəki kimi fiziki ölçülər üçün bu ölçülən şeyin yerli-dibli olmaması mənasına gəlir.

Dəyişən dəyərlərinin bir-birindən fərqlənə bildiyi bu dörd müxtəlif yola uyğun dörd ölçü şkalası mövcuddur.

Nominal şkala. Nominal dəyişən kimlik meyarını təmin edir, yəni, dəyişənin hər bir dəyəri fərqli bir şeyi təmsil edir və ədədlər sadəcə, yuxarıda da müzakirə olunduğu kimi, keyfiyyət etiketləri kimi xidmət edir. Məsələn, insanlardan hansı siyasi partiya üzvü olduqlarını soruşa bilərik və partiyaları ədədlərlə kodlaşdıra bilərik: 1 = “Respublikaçı”, 2 = “Demokrat”, 3 = “Libertarian” və s. Buradakı fərqli ədədlər arasında sıra əlaqəsi yoxdur (yəni 1, 3-dən böyük deyil).

Ordinal şkala. Ordinal dəyişən kimlik və böyüklük kriteriyalarına cavab verir, yəni, dəyərlər böyüklüklərinə görə düzülə bilər. Məsələn, xroniki ağrısı olan bir şəxsdən hər gün 1-7 şkalası üzərindən ağrılarının nə qədər pis olduğunu dəyərləndirib form doldurmağını xahiş edə bilərik. Qeyd edək ki, şəxs “3” cavabı verdiyi gün “6” cavabı verdiyi günlə müqayisədə daha az ağrı hiss etmiş olsa da, həmin gün ağrısının iki dəfə az olduğunu söyləmək məntiqli olmaz; sıra bizə nisbi ölçü haqda məlumat versə də, dəyərlər arasındakı fərqlər (yəni, 3 ilə 4, 4 ilə 5 arasındakı fərq) ölçü baxımından bərabər deyil.

İnterval şkalası. Bir interval şkalası ordinal şkalanın sahib olduğu bütün xüsusiyyətlərə sahibdir və bunlara əlavə olaraq, burada ölçü şkalasındakı vahidlər arasındakı fasilələr bir-birinə bərabərdir. Buna standart bir nümunə kimi Celsius və Farenheitlə ölçülən fiziki temperaturu göstərmək olar; 10 ilə 20 dərəcə arasındakı fiziki fərq, 90 ilə 100 dərəcə arasındakı fiziki fərqlə eynidir və bu şkalalarda mənfi dəyərlər də var.

Nisbət şkalası. Nisbət şkalası ilə ölçülən dəyişəndə yuxarıda göstərilən xüsusiyyətlərdən dördü də var: kimlik, böyüklük, bərabər fasilələr və mütləq sıfır. Nisbət şkalalı dəyişən ilə interval şkalalı dəyişən arasındakı fərq, birincidə həqiqi bir sıfır nöqtəsinin olmasıdır. Nisbət şkalalı dəyişənlərə nümunə kimi, Kelvinlə ölçülən temperaturu, fiziki boy və çəkini göstərmək olar.

2.2.1 Ölçü şkalaları nə üçün vacibdir?

Dəyişənin ölçü şkalasına diqqət etməyin iki əhəmiyyətli səbəbi var. Birincisi, şkalanın nə olduğu dataya tətbiq edilə biləcək riyazi əməliyyatların növünü müəyyənləşdirir (bax: Cədvəl 2.2) Nominal dəyişən yalnız bərabərliyi təyin etmək üçün müqayisə edilə bilər; yəni, bu dəyişən üzərinə edilmiş iki müşahidə eyni ədədi dəyərə malikdirmi? Digər riyazi əməliyyatları nominal dəyişənlərə tətbiq etmək məntiqli olmazdı, çünki nominal dəyişənin dəyərləri ədəd kimi işləmir, sadəcə etiketlər kimi fəaliyyət göstərirlər. Ordinal dəyişənlərlə, bir dəyərin başqa birinə nisbətən daha yüksək və ya az olduğunu yoxlaya bilərik, lakin hər hansı bir aritmetik əməliyyat (toplama, çıxma və s.) apara bilmərik. İnterval və nisbi dəyişənlər bizə aritmetik əməliyyatlar aparmağa imkan verir; interval dəyişənləri ilə dəyərləri yalnız toplaya və ya çıxa bilərik, nisbi dəyişənlərlə isə dəyərləri vurmaq və ya bölmək olar.

Cədvəl 2.2: Ölçü şkalaları dəstəklədikləri riyazi əməliyyatlara görə bir-birindən fərqlənir

	Bərabərdir / bərabər deyil	Böyükdür / kiçikdir	Toplama / çıxma	Vurma/ bölmə
Nominal	+
Ordinal	+	+
İnterval	+	+	+
Nisbət	+	+	+	+

Bu məhdudiyyətlər hər bir dəyişən növü üzrə hesablaya biləcəyimiz bəlli statistik məlumatların olduğunu göstərir. Sadəcə müxtəlif dəyərlərin sayılmasını tələb edən statistik göstərici (məsələn, mod kimi bilinən və data qrupumuzda ən çox rastlanan dəyərin göstəricisi) bütün dəyişən növləri üçün hesablana bilər. Digər statistik göstəricilər dəyərlərin böyüklüyünə görə sıralanmasına əsaslanır (məsələn, bütün dəyərlər böyüklüyünə görə sıralandıqda ən ortada yerləşən dəyər olan median) və buna görə də, sözügedən dəyərlərin ən azı ordinal şkalada olmasını tələb edir. Nəhayət, dəyərlərin toplanmasını tələb edən statistik göstəricilər (məsələn, ədədi orta və ya ortalama), dəyişənlərin ən azı interval şkalasında olmasını tələb edir. Bunu baxmayaraq qeyd etmək lazımdır ki, tədqiqatçılar tez-tez ordinal şkalada olan dəyişənlərin də ədədi ortasını hesablasalar da, (məsələn, şəxsiyyət testlərinə cavabları) bu, bəzən problemli ola bilər.

2.3 Yaxşı bir ölçmə nə deməkdir?

Psixologiya kimi bir çox sahədə, ölçdüyümüz şey fiziki bir xüsusiyyət yox, müşahidə olunmayan nəzəri anlayış olur ki, buna adətən qurğu deyirik. Məsələn, deyək ki, yuxarıda təsvir edilən dörd ölçü şkalası arasındakı fərqləri nə qədər yaxşı başa düşdüyünüzü sınamaq istəyirəm. Bu anlayışlar barədə sizə bir neçə sual verib neçəsinə düzgün cavab verdiyinizi saya bilərəm. Bu test maraqlandığımız qurğunu (yəni, sizin həqiqi anlayışınızı) ölçməyin düzgün yolu ola da bilər, olmaya da bilər – məsələn, testi qarışıq bir şəkildə yazarsam və ya anlamadığınız dili istifadə etsəm, reallıqda sözügedən anlayışları başa düşsəniz belə, testin nəticələri bunun əksini göstərər. Digər tərəfdən, çox açıq-aşkar yanlış bəndləri olan test imtahanı düzəltsəm, o zaman, materialı əslində başa düşməmiş olsanız belə, testdən yaxşı nəticə əldə edə bilərsiniz.

Adətən heç bir qurğunu müəyyən qədər xəta olmadan ölçmək mümkün deyil. Məsələn, yuxarıdakı nümunədə, cavabı bilsəniz belə sualı yanlış oxuyub səhv etmiş ola bilərsiniz. Digər hallarda, xəta ölçülən şeyin öz təbiətindən qaynaqlana bilər: məsələn, sadə bir reaksiya sürətini ölçən testdə iştirakçının göstərdiyi nəticə müxtəlif səbəblərdən (məsələn, diqqətin testdə olmaması, yuxululuq miqdarı, və s.) sınaqdan sınağa dəyişə bilər. Ölçmə xətamızın mümkün qədər aşağı olmasını istəyirik.

Bəzən fərqli ölçmə metodlarını “qızıl standart” deyilən müəyyən bir etalonla müqayisə etmək olur – məsələn, yuxunu müxtəlif yollarla (məsələn, yataqda hərəkəti ölçən cihazlarla) ölçmək mümkündür, lakin bunların heç biri qızıl standart sayılan polisomnoqrafiyadan (beyin dalğalarından istifadə edərək hər yuxu mərhələsində keçirilən vaxtın miqdarını ölçə bilən metod) daha dəqiq sayılmır. Qızıl standartla ölçmələr aparmaq adətən daha çətin və ya bahalı olduğundan, ucuz üsul daha çox xətalı olsa belə ondan istifadə olunur.

Yaxşı bir ölçmə haqqında düşünərkən, əsasən iki fərqli məsələni ayırd edirik.

2.3.1. Etibarlılıq

Etibarlılıq ölçmələrimizin bir-birilə nə qədər uyuşduğunu ölçür. “Test-təkrar-test etibarlılığı” kimi bilinən etibarlıq forması eyni ölçməni iki dəfə yerinə yetirəndə alınan nəticələrin nə dərəcədə üst-üstə düşdüyünü ölçür. Məsələn, bu gün statistikaya olan münasibətinizə dair bir sorğu keçirə bilərəm və sabah eyni anketimi təkrarlayıb hər iki gündə aldığım cavabları müqayisə edə bilərəm; görmək istədiyimiz nəticə odur ki, hər iki gündə alınan cavablar aşağı-yuxarı eynidir (əlbəttə, əgər bu iki gün arasında nə isə baş verməyibsə–məsələn, arada bu kitabı oxumamısınızsa).

Subyektiv mühakimə ehtiva edən datanın istifadə olunduğu hallarda etibarlılığı ölçməyin başqa bir metodu var. Məsələn, deyək ki, bir tədqiqatçı müəyyən növ müalicənin autistik uşağın digər uşaqlarla necə ünsiyyət qurduğuna təsir edib-etmədiyini öyrənmək istəyir; burada ünsiyyəti uşağı müşahidə edib onun ünsiyyətini qiymətləndirən mütəxəssislər ölçür. Belə bir vəziyyətdə, dəyərləndirmənin yalnız qiymətləndiricidən asılı olmadığından əmin olmaq istəyirik, yəni, qiymətləndiricilər arası etibarlılığın yüksək olmasını istəyirik. Bu növ etibarlılığın nə qədər yüksək olduğunu təyin etmək üçün birdən çox qiymətləndiricidən (mütəxəssisdən) istifadə edib, verdikləri dəyərləndirmənin bir-birilə nə qədər üst-üstə düşdüyünü hesablamaq olar.

Bir ölçməni digərilə müqayisə etmək istəyirsinizsə etibarlılıq vacibdir. Fərqli növ ölçmələr arasındakı əlaqə, ölçmə nəticələrinizin daxili əlaqəsindən (yəni, eyni növ ölçmənin təkrar-təkrar aparılmasından, başqa sözlə, etibarlılığından) daha güclü ola bilməz. Buna görə də, etibarsız bir ölçmə metodu başqa heç bir ölçmə metodu ilə güclü statistik əlaqəyə malik ola bilməz. Bu səbəbdən, yeni bir ölçmə metodu (məsələn, yeni bir anket) hazırlayan tədqiqatçılar metodun etibarlılığını təyin etmək üçün çoxsaylı testlər aparırlar.

**Şəkil 2.1 Etibarlılıq və əsaslılıq arasındakı fərqi nişan bənzətməsi ilə göstərən şəkil.** Etibarlılıq atışların düşdüyü yerin bir-birilə nə dərəcədə uzlaşdığını ifadə edir, əsaslılıq isə atışların nişanın mərkəzinə nəzərən dəqiqliyini ölçür. A-da atışlar təkrar-təkrar bir-birinə yaxın və nişanın mərkəzinə atılıb. B-də atışlar ortalama olaraq mərkəzə düşsə də (əsaslılıq) bir-birinə yaxın düşmür (etibarsızlıq). C-də atışlar bir-birinə yaxın düşür (etibarlılıq), lakin həmişə nişandan kənara düşür (əsassızlıq). D-də isə nişanlar həm nişandan (əsassızlıq), həm də bir-birindən kənara düşür (etibarsızlıq).

2.3.2 Əsaslılıq

Etibarlılıq vacibdir, lakin təkbaşına kifayət deyil: Nəticədə, fərdin necə cavab verdiyindən asılı olmayaraq, hər cavabı eyni nömrə ilə kodlaşdıraraq şəxsiyyət testi üçün yüksək etibarlılığı olan bir ölçmə metodu yarada bilərəm (yəni, iştirakçı reallıqda nə deyirsə desin, cavabları 1 rəqəmi ilə kodlaşdırdığımdan, mənim üçün cavab həmişə 1 olacaq və belədə ölçmələrim həmişə bir-birilə uzlaşacaq). Buna görə də, ölçmələrimizin əsaslı olması da vacibdir, yəni, həqiqətən də, ölçdüyümüzü düşündüyümüz qurğunu ölçdüyümüzdən əmin olmalıyıq (Şəkil 2.1). Tez-tez müzakirə olunan bir sıra əsaslılıq növü var; burada onlardan üçünə nəzər salacağıq.

Zahiri əsaslılıq. Ölçmə zahirən məntiqli gəlirmi? Məsələn, əgər bir adamın qan təzyiqini onun dilinin rənginə baxaraq ölçmək istədiyimi desəm, yəqin ki, bunun əsaslı bir ölçmə metodu olmadığını düşünərdiniz. Digər tərəfdən, manjet istifadə etsəm bu zahirən sizə əsaslı bir yanaşma kimi görünəcək. Zahiri əsaslılıq dəyərləndirməsini, əsaslılığın daha mürəkkəb aspektlərinə nəzər salmazdan əvvəl ilkin reallıq testi kimi görmək olar.

Qurğu əsaslılığı. Ölçmə digər ölçmə metodları ilə müvafiq şəkildə əlaqələnibmi? Burada adətən iki məsələni vurğulaya bilərik. Konvergent əsaslılıq, bir ölçmənin eyni qurğunu əks etdirən digər ölçmələrlə yaxından əlaqəli olması deməkdir. Deyək ki, müsahibə və ya anket yolu ilə şəxsin nə qədər ünsiyyətcil olduğunu ölçmək istəyirəm. Bu müxtəlif ölçmələrin (anket və müsahibənin) verdiyi nəticələr bir-birilə üst-üstə düşərsə ölçmə metodlarımızın konvergent əsaslılıq nümayiş etdirdiyini deyə bilərik. Digər tərəfdən, fərqli qurğuları əks etdirən ölçmələr bir-birilə əlaqəli olmamalıdır, buna divergent əsaslılıq deyirik. Məsələn, mənim şəxsiyyət nəzəriyyəmə görə ünsiyyətcillik və vicdanlılıq fərqli qurğulardırsa, ünsiyyətcilliyi ölçmə metodum vicdanlılığı ölçmə metodu ilə əlaqəli olmamalıdır.

Proqnoz əsaslılığı. Ölçmələrimiz həqiqətən də əsaslıdırsa, onda onlar digər nəticələri də müəyyən ölçüdə proqnozlaşdıra bilməlidir. Məsələn, deyək ki, psixoloji özəllik sayıla bilən sensasiyaya maraq (yəni, yeni təcrübələr yaşamaq istəyi) real dünyada riskalma meylliliyi ilə əlaqəlidir. Sensasiya olan marağı ölçmək üçün istifadə etdiyimiz metodun proqnoz əsaslılığını ölçmək üçün, bu testdə alınan nəticələrin riskalmanı ölçən başqa bir testin nəticələrini nə dərəcədə yaxşı təxmin etdiyinə baxmaq olar (yəni, bir metodla alınan nəticələrə baxaraq, başqa əlaqəli bir qurğunu ölçən testdən alınan nəticələri nə qədər yaxşı təxmin edə bilərik?).

2.4 Tövsiyyə olunan mətnlər

An introduction to psychometric theory with applications in R – Psixoloji ölçmələr üzərinə onlayn pulsuz dərslik.

2.5 Tərcümədə istifadə olunan mətnlər

Poldrack, A.S. (2019). Statistical Thinking for the 21st Century: Chapter 2 Working with data.
İsgəndərzadə, E. B. və Aslanov, Z.Y. (2017). Ölçmə və Nəzarətin Üsul və Vasitələri. Vektor Nəşriyyatı.

2.6 Qeydlər

1) Data sözü Azərbaycan dilində bəzən verilən(lər) olaraq tərcümə olunsa da bu terminin həddən artıq uzun və anlaşılması çətin olduğunu düşündüyümə görə bu sözü elə “data” olaraq saxlamağı qərara aldım.

2) Kitab boyu statistikada ən çox istifadə olunan proqramlaşdırma dili olan R dilində kod parçaları veriləcək. R-la işləməyi öyrənmək istəyirsinizsə R-Studio proqramını buradan yükləyərək asanlıqla mətndəki kodu öz kompüterinizdə işlədə bilərsiniz.

XXI Əsr üçün Statistik Düşüncə – Fəsil 2: Data ilə İşləmək