İstatistiksel bir araştırmada, istatistiksel karakter birden fazla değer alabildiğinde (büyüklük, alan, maaş, vb.), İstatistiksel karakterin sürekli olduğu kabul edilir .
İstatistiksel araştırmanın sonuçları, sıralı değerler listesinin okunabilir olması için çok fazla olduğunda, bilgilerin kaybedilmesi ve verilerin sınıf adı verilen aralıklarla düzenlenmesi tercih edilir . Bu nedenle, her sınıfta değerlerin dağılımının düzenli olması gereklidir. Aksi takdirde, hassaslaştırmanız ve daha küçük dersler almanız gerekir. Sınıfların aynı genlikte olması zorunlu değildir, ancak daha sonra herhangi bir işlemeyi engelleyecek olan "... 'dan fazla" formunun sınıflarını tanımlamamak tercih edilir (histogram, ortalama ...). Daha sonra karakterin değerinin aralıkta düştüğü sayıları sayarız , bu sayıya sınıfın efektifliği denir .
İstatistiksel sınıf tablosu örneği : 4.370 kişilik bir nüfusta yıllık gelirin binlerce Euro olarak dağılımı.
Ücretler | 0 (dahil) ile 8 (hariç) arasında |
8 (dahil) ile 12 (hariç) arasında |
12 (dahil) ile 16 (hariç) arasında |
16 (dahil) ile 20 (hariç) arasında |
20 (dahil) ile 30 (hariç) arasında |
30 (dahil) ile 40 (hariç) arasında |
40 (dahil) ile 60 (hariç) arasında |
Toplam |
İşgücü | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
Buradaki sayılar, dağılım hakkında basit bir fikir edinmemiz için çok büyük, bu yüzden yüzde veya frekans olarak çalışmayı tercih ediyoruz ve böylece yüzdeler için 100'e veya frekanslar için 1'e iniyoruz.
Ücretler | 0 (dahil) ile 8 (hariç) arasında |
8 (dahil) ile 12 (hariç) arasında |
12 (dahil) ile 16 (hariç) arasında |
16 (dahil) ile 20 (hariç) arasında |
20 (dahil) ile 30 (hariç) arasında |
30 (dahil) ile 40 (hariç) arasında |
40 (dahil) ile 60 (hariç) arasında |
Toplam |
Frekanslar | 0.07 | 0.05 | 0.09 | 0.27 | 0.34 | 0.13 | 0.05 | 1 |
Her sınıftaki dağılımın düzenli olduğu düşünüldüğünden, sınıfın ortasının sınıfı temsil ettiği söylenebilir. Bu nedenle değiştirmek için gidiyoruz sınıfın bireyleri tarafından kimin istatistiksel karakter değer kazanacak bireyler . Ardından , ayrık değişken durumunda olduğu gibi ortalamayı hesaplıyoruz :
Ücretler | 0 (dahil) ile 8 (hariç) arasında |
8 (dahil) ile 12 (hariç) arasında |
12 (dahil) ile 16 (hariç) arasında |
16 (dahil) ile 20 (hariç) arasında |
20 (dahil) ile 30 (hariç) arasında |
30 (dahil) ile 40 (hariç) arasında |
40 (dahil) ile 60 (hariç) arasında |
Toplam |
İşgücü | 306 | 231 | 385 | 1180 | 1468 | 568 | 232 | 4370 |
Her sınıfın ortalama maaşı |
4 | 10 | 14 | 18 | 25 | 35 | 50 | toplam ücret |
Her sınıf için toplam maaş |
1224 | 2310 | 5390 | 21240 | 36700 | 19880 | 11600 | 98344 |
Bu örneklemdeki ortalama maaş bu nedenle 98.344 / 4.370 = 22.5 veya yılda yaklaşık 22.500 Euro'dur.
Burada kullanılan formül:
Ortalama biridir pozisyon kriterlerinin .
Bu istatistiksel anketi grafik olarak temsil etmek için, çubuk grafik uygun değildir. Aslında, sınıf ne kadar büyükse, büyük olma riski de o kadar büyüktür. Bu nedenle, her sınıfın boyutunu, tabanı sınıfın genliği olan ve alanı boyut veya frekansla orantılı olan bir dikdörtgenle temsil etmeliyiz. Bu diyagrama histogram denir.
Örnek :% 1, 1 birim kare ile temsil ediliyorsa.
Ücretler | 0 (dahil) ile 8 (hariç) arasında |
8 (dahil) ile 12 (hariç) arasında |
12 (dahil) ile 16 (hariç) arasında |
16 (dahil) ile 20 (hariç) arasında |
20 (dahil) ile 30 (hariç) arasında |
30 (dahil) ile 40 (hariç) arasında |
40 (dahil) ile 60 (hariç) arasında |
Frekanslar | 0.07 | 0.05 | 0.09 | 0.27 | 0.34 | 0.13 | 0.05 |
Genlikler |
8 | 4 | 4 | 4 | 10 | 10 | 20 |
Yükseklik |
0.9 | 1.3 | 2.2 | 6.8 | 3.4 | 1.3 | 0.3 |
Geriye sadece histogramı çizmek kalıyor:
Not: Sınıfların genlikleri aynıysa, dikdörtgenlerin yükseklikleri sayılarla veya frekanslarla orantılıdır.
Her sınıftaki dağılımın düzenli olduğu varsayıldığından, yüzdelerin artmasının doğrusal bir fonksiyon olduğunu varsayabiliriz. Daha sonra, tüm x'ler için sınıf yüzdesini okumayı mümkün kılan artan kümülatif yüzdelerin çokgenini çizeriz .
Önceden, kümülatif yüzdeler tablosunu doldurmalısınız:
0 | 8 | 12 | 16 | 20 | 30 | 40 | 60 | |
Kümülatif artan yüzdeler | 0 | 7 | 12.3 | 21.1 | 48.1 | 81.7 | 94.7 | 100 |
Geriye sadece çokgeni çizmek kalıyor:
Kümülatif yüzdelerin azalan poligonu da aynı şekilde oluşturulabilir.
Daha önce ayrı değişkenler için kurulan formüller değiştirilmesi koşuluyla geçerli kalır ile sınıfın ortasında :
Standart sapma, dağılım kriterlerinden biridir