Güven aralığı. Matematiksel beklenti için güven aralığı Aralık, güven olasılığı güven aralığını tahmin eder

Bugün gerçekten çok kolay: Bir bilgisayarın başına geçebilir ve ne yaptığınız hakkında çok az veya hiç bilgi sahibi olmadan, gerçekten şaşırtıcı bir hızla aklı başında ve saçma sapan şeyler yaratabilirsiniz. (J.Kutu)

Güvenilirlik aralığı

genel inceleme

Popülasyondan bir örnek alarak, ilgilendiğimiz parametrenin bir nokta tahminini elde edeceğiz ve tahminin doğruluğunu belirtmek için standart hatayı hesaplayacağız.

Ancak çoğu durumda standart hata kabul edilemez. Bu kesinlik ölçüsünü popülasyon parametresi için bir aralık tahmini ile birleştirmek çok daha faydalıdır.

Bu, parametre için bir güven aralığı (CI - Güven Aralığı, CI - Güven Aralığı) hesaplamak için örnek istatistiğinin (parametre) teorik olasılık dağılımı bilgisi kullanılarak yapılabilir.

Genel olarak, güven aralığı, (belirli bir parametrenin) standart hatanın bazı katları kadar tahminleri her iki yönde de genişletir; aralığı tanımlayan iki değer (güven sınırları) genellikle virgülle ayrılır ve parantez içine alınır.

Ortalama için güven aralığı

Normal dağılımı kullanma

Örneklem büyüklüğü büyükse örnek ortalaması normal bir dağılıma sahiptir, bu nedenle örnek ortalaması dikkate alınırken normal dağılım bilgisi uygulanabilir.

Özellikle, örnek ortalamalarının dağılımının %95'i, popülasyon ortalamasının 1,96 standart sapması (SD) dahilindedir.

Yalnızca bir örneğimiz olduğunda, buna ortalamanın standart hatası (SEM) deriz ve ortalama için %95 güven aralığını aşağıdaki gibi hesaplarız:

Bu deney birkaç kez tekrarlanırsa, aralık zamanın %95'inde gerçek popülasyon ortalamasını içerecektir.

Bu genellikle, gerçek popülasyon ortalamasının (genel ortalama) %95 güven düzeyine sahip olduğu değer aralığı gibi bir güven aralığıdır.

Güven aralığını bu şekilde yorumlamak çok katı olmasa da (popülasyon ortalaması sabit bir değerdir ve bu nedenle onunla ilgili bir olasılığa sahip olamaz), kavramsal olarak anlaşılması daha kolaydır.

kullanım t- dağıtım

Popülasyondaki varyansın değerini biliyorsanız normal dağılımı kullanabilirsiniz. Ayrıca, örneklem büyüklüğü küçük olduğunda, popülasyonun altında yatan veriler normal olarak dağılıyorsa, örnek ortalaması normal bir dağılım izler.

Popülasyonun altında yatan veriler normal olarak dağılmıyorsa ve/veya genel varyans (popülasyon varyansı) bilinmiyorsa, örneklem ortalaması aşağıdakilere uyar. Öğrencinin t-dağılımı.

Popülasyon ortalaması için %95 güven aralığını aşağıdaki gibi hesaplayın:

Nerede - yüzde noktası (yüzdelik) t-(n-1) serbestlik dereceli öğrenci dağılımı, bu da 0,05'lik iki kuyruklu bir olasılık verir.

Genel olarak, normal dağılım kullanıldığında olduğundan daha geniş bir aralık sağlar, çünkü popülasyon standart sapmasını tahmin ederek ve/veya küçük örneklem boyutundan kaynaklanan ek belirsizliği hesaba katar.

Örnek boyutu büyük olduğunda (100 veya daha fazla mertebesinde), iki dağılım arasındaki fark ( t-öğrenci ve normal) ihmal edilebilir. Ancak, her zaman kullanın t-örneklem büyüklüğü büyük olsa bile güven aralıkları hesaplanırken dağılım.

Genellikle %95 CI belirtilir. Ortalama için %99 GA gibi diğer güven aralıkları hesaplanabilir.

Standart hata ve tablo değerinin çarpımı yerine t- 0,05'lik iki kuyruklu olasılığa karşılık gelen dağılım, onu (standart hata) iki kuyruklu 0,01 olasılığa karşılık gelen bir değerle çarpar. Bu, %95 durumundan daha geniş bir güven aralığıdır çünkü aralığın gerçekten de popülasyon ortalamasını içerdiğine dair artan güveni yansıtır.

Orantı için güven aralığı

Oranların örnekleme dağılımı bir binom dağılımına sahiptir. Ancak, eğer örneklem büyüklüğü n oldukça büyükse, orantı numunesi dağılımı ortalama ile yaklaşık olarak normaldir.

Örnekleme oranına göre tahmin p=r/n(nerede r- bizi ilgilendiren özelliklere sahip örneklemdeki bireylerin sayısı) ve standart hata tahmin edilir:

Oran için %95 güven aralığı tahmin edilir:

Örnek boyutu küçükse (genellikle np veya n(1-p) daha küçük 5 ), o zaman kesin güven aralıklarını hesaplamak için binom dağılımı kullanılmalıdır.

Dikkat edin, eğer p yüzde olarak ifade edilir, daha sonra (1-p) ile ikame edilmiş (100p).

Güven aralıklarının yorumlanması

Güven aralığını yorumlarken aşağıdaki sorularla ilgileniyoruz:

Güven aralığı ne kadar geniş?

Geniş bir güven aralığı, tahminin kesin olmadığını gösterir; dar, iyi bir tahmini gösterir.

Güven aralığının genişliği, standart hatanın boyutuna bağlıdır, bu da örneklem boyutuna bağlıdır ve verilerin değişkenliğinden sayısal bir değişken düşünüldüğünde, az sayıdaki büyük bir veri setinin çalışmalarından daha geniş güven aralıkları verin. değişkenler.

CI, özellikle ilgi çekici herhangi bir değer içeriyor mu?

Bir popülasyon parametresi için olası değerin bir güven aralığı içinde olup olmadığını kontrol edebilirsiniz. Evet ise, sonuçlar bu olası değerle tutarlıdır. Değilse, parametrenin bu değere sahip olması olası değildir (%95 güven aralığı için, şans neredeyse %5'tir).

Genellikle değerleme uzmanı, değerleme nesnesinin bulunduğu segmentin emlak piyasasını analiz etmek zorundadır. Pazar gelişmişse, sunulan nesnelerin tamamını analiz etmek zor olabilir, bu nedenle analiz için bir nesne örneği kullanılır. Bu örnek her zaman homojen değildir, bazen aşırı uçlardan temizlenmesi gerekir - çok yüksek veya çok düşük piyasa teklifleri. Bu amaçla uygulanan güven aralığı. Bu çalışmanın amacı, estimatica.pro sisteminde farklı örneklerle çalışırken güven aralığını hesaplamak için iki yöntemin karşılaştırmalı analizini yapmak ve en iyi hesaplama seçeneğini seçmektir.

Güven aralığı - örnek bazında hesaplanır, bilinen bir olasılıkla genel popülasyonun tahmini parametresini içeren özniteliğin değer aralığı.

Güven aralığını hesaplamanın anlamı, tahmin edilen parametrenin değerinin bu aralıkta olduğu belirli bir olasılıkla ileri sürülebilmesi için örnek verilere dayalı böyle bir aralık oluşturmaktır. Başka bir deyişle, belirli bir olasılıkla güven aralığı, tahmin edilen miktarın bilinmeyen değerini içerir. Aralık ne kadar geniş olursa, yanlışlık o kadar yüksek olur.

Güven aralığını belirlemek için farklı yöntemler vardır. Bu yazıda 2 yolu ele alacağız:

  • medyan ve standart sapma yoluyla;
  • t-istatistiğinin kritik değeri aracılığıyla (Öğrenci katsayısı).

CI hesaplamak için farklı yöntemlerin karşılaştırmalı analizinin aşamaları:

1. bir veri örneği oluşturun;

2. istatistiksel yöntemlerle işliyoruz: ortalama değeri, medyanı, varyansı vb. hesaplıyoruz;

3. Güven aralığını iki şekilde hesaplıyoruz;

4. Temizlenen numuneleri ve elde edilen güven aralıklarını analiz edin.

Aşama 1. Veri örneklemesi

Örnek, estimatica.pro sistemi kullanılarak oluşturulmuştur. Örnek, "Kruşçev" planlama tipi ile 3. fiyat bölgesinde 1 odalı daire satışı için 91 teklif içeriyordu.

Tablo 1. İlk numune

1 metrekare fiyatı, c.u.

Şekil 1. İlk örnek



Aşama 2. İlk örneğin işlenmesi

İstatistiksel yöntemlerle numune işleme, aşağıdaki değerlerin hesaplanmasını gerektirir:

1. Aritmetik ortalama

2. Medyan - örneği karakterize eden bir sayı: örnek öğelerin tam olarak yarısı medyandan büyük, diğer yarısı medyandan küçük

(tek sayıda değere sahip bir örnek için)

3. Aralık - numunedeki maksimum ve minimum değerler arasındaki fark

4. Varyans - verilerdeki varyasyonu daha doğru bir şekilde tahmin etmek için kullanılır

5. Numune için standart sapma (bundan sonra RMS olarak anılacaktır), aritmetik ortalama etrafındaki ayarlama değerlerinin dağılımının en yaygın göstergesidir.

6. Varyasyon katsayısı - ayar değerlerinin dağılım derecesini yansıtır

7. salınım katsayısı - numunedeki fiyatların uç değerlerinin ortalama etrafında göreceli dalgalanmasını yansıtır

Tablo 2. Orijinal örneğin istatistiksel göstergeleri

Verilerin homojenliğini karakterize eden varyasyon katsayısı %12,29'dur, ancak salınım katsayısı çok büyüktür. Böylece orijinal örneğin homojen olmadığını söyleyebiliriz, bu yüzden güven aralığını hesaplamaya geçelim.

Aşama 3. Güven aralığının hesaplanması

Yöntem 1. Medyan ve standart sapma yoluyla hesaplama.

Güven aralığı şu şekilde belirlenir: minimum değer - medyandan standart sapma çıkarılır; maksimum değer - standart sapma medyana eklenir.

Böylece güven aralığı (47179 CU; 60689 CU)

Pirinç. 2. Güven aralığı içindeki değerler 1.



Yöntem 2. t istatistiklerinin kritik değeri aracılığıyla bir güven aralığı oluşturma (Öğrenci katsayısı)

S.V. Gribovsky, "Mülkiyetin değerini değerlendirmek için matematiksel yöntemler" kitabında, Öğrenci katsayısı aracılığıyla güven aralığını hesaplamak için bir yöntem açıklar. Bu yöntemle hesaplarken, tahmincinin kendisi, güven aralığının oluşturulma olasılığını belirleyen ∝ önem düzeyini belirlemelidir. 0.1'lik önem seviyeleri yaygın olarak kullanılır; 0.05 ve 0.01. 0,9'luk güven olasılıklarına karşılık gelirler; 0.95 ve 0.99. Bu yöntemle, matematiksel beklenti ve varyansın gerçek değerlerinin pratik olarak bilinmediği kabul edilir (pratik değerlendirme problemlerini çözerken neredeyse her zaman doğrudur).

Güven aralığı formülü:

n - örnek boyutu;

Önemlilik düzeyi ∝ olan t-istatistiklerinin kritik değeri (Öğrenci dağılımları), özel istatistik tabloları veya MS Excel kullanılarak belirlenen serbestlik derecesi sayısı n-1 (→"İstatistiksel"→ STUDRASPOBR);

∝ - anlamlılık düzeyi, ∝=0.01 alıyoruz.

Pirinç. 2. Güven aralığı içindeki değerler 2.

Adım 4. Güven aralığını hesaplamanın farklı yollarının analizi

Güven aralığını hesaplamanın iki yöntemi - medyan ve Öğrenci katsayısı aracılığıyla - aralıkların farklı değerlerine yol açtı. Buna göre iki farklı saflaştırılmış numune elde edilmiştir.

Tablo 3. Üç örnek için istatistiksel göstergeler.

Gösterge

İlk örnek

1 seçenek

seçenek 2

Anlamına gelmek

Dağılım

Coef. varyasyonlar

Coef. salınımlar

Kullanımdan kaldırılan nesnelerin sayısı, adet.

Yapılan hesaplamalardan yola çıkarak farklı yöntemlerle elde edilen güven aralıklarının değerlerinin kesiştiğini söyleyebiliriz, bu nedenle değerleme uzmanının takdirine bağlı olarak hesaplama yöntemlerinden herhangi birini kullanabilirsiniz.

Bununla birlikte, estimatica.pro sisteminde çalışırken, piyasa gelişiminin derecesine bağlı olarak güven aralığını hesaplamak için bir yöntem seçmenizin tavsiye edilir olduğuna inanıyoruz:

  • piyasa gelişmemişse, bu durumda emekli nesnelerin sayısı az olduğundan, medyan ve standart sapma yoluyla hesaplama yöntemini uygulayın;
  • pazar gelişmişse, büyük bir başlangıç ​​örneği oluşturmak mümkün olduğundan, hesaplamayı t-istatistiğinin kritik değeri (Öğrenci katsayısı) üzerinden uygulayın.

Makalenin hazırlanmasında kullanıldı:

1. Gribovsky S.V., Sivets S.A., Levykina I.A. Mülkün değerini değerlendirmek için matematiksel yöntemler. Moskova, 2014

2. estimatica.pro sisteminden gelen veriler

Güvenilirlik aralığı ( ingilizce Güvenilirlik aralığı) belirli bir önem düzeyi için hesaplanan istatistiklerde kullanılan aralık tahmin türlerinden biri. Genel popülasyonun bilinmeyen bir istatistiksel parametresinin gerçek değerinin, seçilen istatistiksel anlamlılık düzeyi tarafından verilen bir olasılıkla elde edilen değerler aralığında olduğuna dair bir açıklama yapmamıza izin veriyorlar.

Normal dağılım

Veri popülasyonunun varyansı (σ 2 ) bilindiğinde, güven sınırlarını (güven aralığının sınır noktaları) hesaplamak için bir z-skoru kullanılabilir. Bir t-dağılımı kullanmakla karşılaştırıldığında, bir z-skoru kullanmak sadece daha dar bir güven aralığı sağlamakla kalmayacak, aynı zamanda Z-skoru normal bir dağılıma dayalı olduğundan, ortalama ve standart sapma (σ) hakkında daha güvenilir tahminler de sağlayacaktır.

formül

Veri popülasyonunun standart sapması biliniyorsa, güven aralığının sınır noktalarını belirlemek için aşağıdaki formül kullanılır.

L = X - Z α/2 σ
√n

Misal

Örnek boyutunun 25 gözlem olduğunu, örneklem ortalamasının 15 olduğunu ve popülasyon standart sapmasının 8 olduğunu varsayalım. α=%5'lik bir anlamlılık düzeyi için Z-skoru Z α/2 =1.96'dır. Bu durumda güven aralığının alt ve üst sınırları aşağıdaki gibi olacaktır.

L = 15 - 1,96 8 = 11,864
√25
L = 15 + 1.96 8 = 18,136
√25

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla 11.864 ile 18.136 aralığına düşeceğini söyleyebiliriz.

Güven aralığını daraltma yöntemleri

Aralığın çalışmamızın amaçları için çok geniş olduğunu varsayalım. Güven aralığı aralığını azaltmanın iki yolu vardır.

  1. İstatistiksel anlamlılık düzeyini azaltın α.
  2. Örnek boyutunu artırın.

İstatistiksel anlamlılık düzeyini α=%10'a indirgeyerek, Z α/2 =1.64'e eşit bir Z-puanı elde ederiz. Bu durumda, aralığın alt ve üst sınırları olacaktır.

L = 15 - 1.64 8 = 12,376
√25
L = 15 + 1.64 8 = 17,624
√25

Ve güven aralığının kendisi şu şekilde yazılabilir:

Bu durumda, genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığa düşeceği varsayımını yapabiliriz.

α istatistiksel anlamlılık seviyesini korumak istiyorsak, o zaman tek alternatif örneklem büyüklüğünü artırmaktır. 144 gözleme çıkararak, aşağıdaki güven sınırlarının değerlerini elde ederiz.

L = 15 - 1,96 8 = 13,693
√144
L = 15 + 1.96 8 = 16,307
√144

Güven aralığının kendisi şöyle görünecektir:

Bu nedenle istatistiksel anlamlılık düzeyini düşürmeden güven aralığını daraltmak ancak örneklem büyüklüğünü artırmakla mümkündür. Örnek boyutunu artırmak mümkün değilse, güven aralığının daraltılması yalnızca istatistiksel anlamlılık düzeyinin azaltılmasıyla sağlanabilir.

Normal olmayan bir dağılım için bir güven aralığı oluşturma

Popülasyonun standart sapması bilinmiyorsa veya dağılım normal değilse, bir güven aralığı oluşturmak için t-dağılımı kullanılır. Bu teknik, Z-skoruna dayalı tekniğe kıyasla daha geniş güven aralıklarında ifade edilen daha tutucudur.

formül

Aşağıdaki formüller, t-dağılımına dayalı güven aralığının alt ve üst sınırlarını hesaplamak için kullanılır.

L = X - ta σ
√n

Öğrenci dağılımı veya t-dağılımı yalnızca bir parametreye bağlıdır - bireysel özellik değerlerinin sayısına eşit olan serbestlik derecesi sayısı (örnekteki gözlem sayısı). Belirli bir serbestlik derecesi (n) için Student t-testinin değeri ve istatistiksel anlamlılık düzeyi α, arama tablolarında bulunabilir.

Misal

Örnek boyutunun 25 ayrı değer olduğunu, örneğin ortalama değerinin 50 ve örneğin standart sapmasının 28 olduğunu varsayın. İstatistiksel anlamlılık düzeyi α=%5 için bir güven aralığı oluşturmanız gerekir.

Bizim durumumuzda, serbestlik derecesi sayısı 24'tür (25-1), bu nedenle, istatistiksel anlamlılık düzeyi α=%5 için Student t-testinin karşılık gelen tablo değeri 2.064'tür. Bu nedenle, güven aralığının alt ve üst sınırları

L = 50 - 2.064 28 = 38,442
√25
L = 50 + 2.064 28 = 61,558
√25

Ve aralığın kendisi şu şekilde yazılabilir:

Böylece genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralığında olacağını söyleyebiliriz.

Bir t-dağılımı kullanmak, istatistiksel anlamlılığı azaltarak veya örnek boyutunu artırarak güven aralığını daraltmanıza olanak tanır.

Örneğimizin koşullarında istatistiksel anlamlılığı %95'ten %90'a düşürerek, Student's t-test 1.711'in ilgili tablo değerini elde ederiz.

L = 50 - 1.711 28 = 40,418
√25
L = 50 + 1.711 28 = 59,582
√25

Bu durumda genel popülasyonun matematiksel beklentisinin %90 olasılıkla aralığında olacağını söyleyebiliriz.

İstatistiksel anlamlılığı azaltmak istemiyorsak, tek alternatif örneklem büyüklüğünü arttırmaktır. Diyelim ki, örneğin ilk koşulundaki gibi 25 değil, 64 bireysel gözlem. Student's t-testinin 63 serbestlik derecesi (64-1) ve istatistiksel anlamlılık düzeyi α=5 için tablo değeri 1.998'dir.

L = 50 - 1.998 28 = 43,007
√64
L = 50 + 1.998 28 = 56,993
√64

Bu bize, genel popülasyonun matematiksel beklentisinin %95 olasılıkla aralıkta olacağını iddia etme fırsatı verir.

Büyük Örnekler

Büyük örnekler, 100'den fazla bireysel gözleme sahip bir veri popülasyonundan alınan örneklerdir.İstatistiksel çalışmalar, popülasyonun dağılımı normal olmasa bile daha büyük örneklerin normal dağılma eğiliminde olduğunu göstermiştir. Ek olarak, bu tür örnekler için, z-skoru ve t-dağılımı kullanımı, güven aralıkları oluşturulurken yaklaşık olarak aynı sonuçları verir. Bu nedenle, büyük örnekler için, normal dağılım için t-dağılımı yerine z-skorunun kullanılması kabul edilebilir.

Özetliyor

İstatistiksel problemleri çözme yöntemlerinden biri güven aralığının hesaplanmasıdır. Örnek boyutu küçük olduğunda nokta tahminine tercih edilen bir alternatif olarak kullanılır. Güven aralığını hesaplama sürecinin oldukça karmaşık olduğuna dikkat edilmelidir. Ancak Excel programının araçları, onu biraz basitleştirmenize izin verir. Bunun pratikte nasıl yapıldığını öğrenelim.

Bu yöntem, çeşitli istatistiksel niceliklerin aralık tahmininde kullanılır. Bu hesaplamanın asıl görevi nokta tahmininin belirsizliklerinden kurtulmaktır.

Excel'de bu yöntemi kullanarak hesaplama yapmak için iki ana seçenek vardır: varyans bilindiğinde ve bilinmediğinde. İlk durumda, fonksiyon hesaplamalar için kullanılır. GÜVEN NORMASI, ve ikincisinde GÜVEN.ÖĞRENCİ.

Yöntem 1: GÜVENLİK NORM işlevi

Şebeke GÜVEN NORMASIİstatistiksel işlev grubunu ifade eden , ilk olarak Excel 2010'da ortaya çıktı. Bu programın önceki sürümleri, eşdeğerini kullanır. GÜVEN. Bu operatörün görevi, popülasyon ortalaması için normal dağılıma sahip bir güven aralığı hesaplamaktır.

Sözdizimi aşağıdaki gibidir:

GÜVEN NORM(alfa; standart_dev; boyut)

"Alfa" güven düzeyini hesaplamak için kullanılan anlamlılık düzeyini gösteren bir argümandır. Güven düzeyi aşağıdaki ifadeye eşittir:

(1-"Alfa")*100

"Standart sapma"özü adından belli olan bir argümandır. Bu, önerilen örneğin standart sapmasıdır.

"Boyut"örneğin boyutunu belirleyen bir argümandır.

Bu işleç için tüm bağımsız değişkenler gereklidir.

İşlev GÜVENöncekiyle tamamen aynı argümanlara ve olanaklara sahiptir. Sözdizimi:

GÜVEN(alfa; standart_geliştirme; boyut)

Gördüğünüz gibi, farklılıklar sadece operatör adınadır. Bu özellik, uyumluluk nedenleriyle Excel 2010'da ve daha yeni sürümlerde özel bir kategoride tutulmuştur. "Uyumluluk". Excel 2007 ve önceki sürümlerinde, istatistiksel operatörlerin ana grubunda bulunur.

Güven aralığı sınırı, aşağıdaki formun formülü kullanılarak belirlenir:

X+(-)GÜVEN NORM

Neresi X seçilen aralığın ortasında bulunan örnek ortalamadır.

Şimdi belirli bir örnek kullanarak güven aralığının nasıl hesaplanacağına bakalım. Tabloda listelenen farklı sonuçlarla sonuçlanan 12 test gerçekleştirilmiştir. Bu bizim bütünlüğümüzdür. Standart sapma 8'dir. Güven aralığını %97 güven düzeyinde hesaplamamız gerekir.

  1. Veri işleme sonucunun görüntüleneceği hücreyi seçin. Düğmeye tıklayarak "İşlev Ekle".
  2. görünür İşlev Sihirbazı. Kategoriye git "İstatistiksel" ve adı vurgulayın "GÜVEN.NORM". Bundan sonra düğmeye tıklayın TAMAM.
  3. Argümanlar penceresi açılır. Alanları doğal olarak argümanların adlarına karşılık gelir.
    İmleci ilk alana ayarlayın - "Alfa". Burada önem derecesini belirtmeliyiz. Hatırladığımız gibi güven seviyemiz %97. Aynı zamanda şöyle hesaplandığını söylemiştik:

    (1-güven düzeyi)/100

    Yani, değeri değiştirerek şunu elde ederiz:

    Basit hesaplamalarla, argümanın "Alfa" eşittir 0,03 . Bu değeri alana girin.

    Bildiğiniz gibi, standart sapma eşittir 8 . Bu nedenle sahada "Standart sapma" sadece o numarayı yaz.

    alanında "Boyut" gerçekleştirilen testlerin eleman sayısını girmeniz gerekir. Hatırladığımız gibi, onlar 12 . Ancak formülü otomatikleştirmek ve her yeni test yapıldığında düzenlememek için bu değeri sıradan bir sayıya değil, operatörü kullanarak ayarlayalım. KONTROL. Böylece, imleci alana yerleştirdik "Boyut" ve ardından formül çubuğunun solunda bulunan üçgene tıklayın.

    Son kullanılan işlevlerin bir listesi görüntülenir. operatör ise KONTROL Son zamanlarda kullandığınız, bu listede olması gerekir. Bu durumda, sadece adına tıklamanız gerekir. Aksi takdirde, bulamazsanız, konuya gidin "Daha fazla özellik...".

  4. Bize zaten tanıdık geliyor İşlev Sihirbazı. Gruba geri dönüyoruz "İstatistiksel". Oradaki adı seçiyoruz "KONTROL". düğmesine tıklayın TAMAM.
  5. Yukarıdaki operatör için bağımsız değişken penceresi görünür. Bu işlev, belirtilen aralıkta sayısal değerler içeren hücre sayısını hesaplamak için tasarlanmıştır. Sözdizimi aşağıdaki gibidir:

    SAYI(değer1, değer2,…)

    argüman grubu "Değerler" sayısal verilerle dolu hücre sayısını hesaplamak istediğiniz aralığa bir başvurudur. Toplamda, bu tür 255'e kadar argüman olabilir, ancak bizim durumumuzda yalnızca birine ihtiyacımız var.

    İmleci alana ayarlayın "Değer1" ve sol fare düğmesini basılı tutarak, popülasyonumuzu içeren sayfadaki aralığı seçin. Daha sonra adresi alanda görüntülenecektir. düğmesine tıklayın TAMAM.

  6. Bundan sonra uygulama hesaplamayı yapacak ve sonucu bulunduğu hücrede gösterecektir. Bizim özel durumumuzda, formül şu şekilde ortaya çıktı:

    GÜVEN NORM(0.03,8,COUNT(B2:B13))

    Hesaplamaların genel sonucu, 5,011609 .

  7. Ama hepsi bu kadar değil. Hatırladığımız gibi, güven aralığının sınırı, hesaplama sonucunun ortalama örnek değerinden toplama ve çıkarma ile hesaplanır. GÜVEN NORMASI. Bu şekilde sırasıyla güven aralığının sağ ve sol sınırları hesaplanır. Örnek ortalamanın kendisi operatör kullanılarak hesaplanabilir ORTALAMA.

    Bu operatör, seçilen sayı aralığının aritmetik ortalamasını hesaplamak için tasarlanmıştır. Aşağıdaki oldukça basit sözdizimine sahiptir:

    ORTALAMA(sayı1, sayı2,…)

    Argüman "Sayı" tek bir sayısal değer veya hücrelere bir başvuru veya hatta onları içeren tüm aralıklar olabilir.

    Bu nedenle, ortalama değerin hesaplanmasının görüntüleneceği hücreyi seçin ve düğmesine tıklayın. "İşlev Ekle".

  8. açılır İşlev Sihirbazı. Kategoriye geri dön "İstatistiksel" ve listeden bir isim seçin "ORTALAMA". Her zaman olduğu gibi, düğmeye tıklayın TAMAM.
  9. Argümanlar penceresi başlatılır. İmleci alana ayarlayın "1 numara" ve sol fare düğmesi basılıyken, tüm değer aralığını seçin. Koordinatlar alanda görüntülendikten sonra düğmesine tıklayın. TAMAM.
  10. Daha sonra ORTALAMA hesaplamanın sonucunu bir sayfa elemanına verir.
  11. Güven aralığının doğru sınırını hesaplıyoruz. Bunu yapmak için ayrı bir hücre seçin, işareti koyun «=» ve fonksiyonların hesaplanmasının sonuçlarının bulunduğu sayfa elemanlarının içeriğini ekleyin ORTALAMA ve GÜVEN NORMASI. Hesaplamayı gerçekleştirmek için düğmesine basın. Giriş. Bizim durumumuzda, aşağıdaki formülü aldık:

    Hesaplama sonucu: 6,953276

  12. Aynı şekilde güven aralığının sol sınırını da ancak bu sefer hesaplama sonucundan hesaplıyoruz. ORTALAMA operatörün hesaplama sonucunu çıkarın GÜVEN NORMASI. Aşağıdaki türdeki örneğimiz için formül ortaya çıkıyor:

    Hesaplama sonucu: -3,06994

  13. Güven aralığını hesaplamak için tüm adımları ayrıntılı olarak açıklamaya çalıştık, bu nedenle her formülü ayrıntılı olarak açıkladık. Ancak tüm eylemleri tek bir formülde birleştirebilirsiniz. Güven aralığının sağ sınırının hesaplanması aşağıdaki gibi yazılabilir:

    ORTALAMA(B2:B13)+GÜVEN(0.03,8;SAYI(B2:B13))

  14. Sol sınırın benzer bir hesaplaması şöyle görünür:

    ORTALAMA(B2:B13)-GÜVEN.NORM(0.03,8,COUNT(B2:B13))

Yöntem 2: GÜVEN.ÖĞRENCİ işlevi

Ek olarak, Excel'de güven aralığının hesaplanmasıyla ilgili başka bir işlev daha vardır - GÜVEN.ÖĞRENCİ. Yalnızca Excel 2010'dan beri kullanılmaktadır. Bu operatör, Öğrenci dağılımını kullanarak popülasyon güven aralığının hesaplanmasını gerçekleştirir. Varyansın ve buna bağlı olarak standart sapmanın bilinmediği durumlarda kullanılması çok uygundur. Operatör sözdizimi şöyledir:

GÜVEN.ÖĞRENCİ(alfa,standart_dev,boyut)

Gördüğünüz gibi, bu durumda operatörlerin adları değişmeden kaldı.

Bir önceki yöntemde ele aldığımız aynı popülasyon örneğini kullanarak bilinmeyen bir standart sapma ile güven aralığının sınırlarını nasıl hesaplayacağımızı görelim. Geçen seferki gibi güven seviyesini %97 alacağız.

  1. Hesaplamanın yapılacağı hücreyi seçin. düğmesine tıklayın "İşlev Ekle".
  2. açılan İşlev Sihirbazı kategoriye git "İstatistiksel". Bir isim seç "GÜVEN.ÖĞRENCİ". düğmesine tıklayın TAMAM.
  3. Belirtilen operatör için bağımsız değişken penceresi başlatılır.

    alanında "Alfa", güven seviyesi %97 olduğu için sayıyı yazıyoruz 0,03 . İkinci kez bu parametreyi hesaplama ilkeleri üzerinde durmayacağız.

    Bundan sonra, imleci alana ayarlayın "Standart sapma". Bu sefer bu gösterge bizim için bilinmiyor ve hesaplanması gerekiyor. Bu, özel bir işlev kullanılarak yapılır - STDEV.V. Bu operatörün penceresini çağırmak için formül çubuğunun solundaki üçgene tıklayın. Açılan listede istenen ismi bulamazsak, o zaman öğeye gidin. "Daha fazla özellik...".

  4. çalışıyor İşlev Sihirbazı. Kategoriye taşınıyor "İstatistiksel" ve adını işaretleyin "STDEV.B". Ardından düğmeye tıklayın TAMAM.
  5. Argümanlar penceresi açılır. operatör görevi STDEV.Vörneklemede standart sapmanın tanımıdır. Sözdizimi şöyle görünür:

    STDEV.V(sayı1,sayı2,…)

    argüman olduğunu tahmin etmek kolaydır. "Sayı" seçim öğesinin adresidir. Seçim tek bir diziye yerleştirilirse, yalnızca bir argüman kullanarak bu aralığa bir bağlantı verebilirsiniz.

    İmleci alana ayarlayın "1 numara" ve her zaman olduğu gibi sol fare düğmesini basılı tutarak seti seçin. Koordinatlar alana girdikten sonra düğmeye basmak için acele etmeyin. TAMAMçünkü sonuç yanlış olacaktır. İlk önce operatör argümanları penceresine dönmemiz gerekiyor GÜVEN.ÖĞRENCİ son argümanı yapmak için. Bunu yapmak için formül çubuğunda uygun isme tıklayın.

  6. Zaten tanıdık olan işlevin argüman penceresi tekrar açılır. İmleci alana ayarlayın "Boyut". Yine, operatör seçimine gitmek için zaten aşina olduğumuz üçgene tıklayın. Anladığınız gibi, bir isme ihtiyacımız var "KONTROL". Bu fonksiyonu bir önceki yöntemde hesaplamalarda kullandığımız için bu listede mevcut, bu yüzden üzerine tıklamanız yeterli. Bulamazsanız, ilk yöntemde açıklanan algoritmayı izleyin.
  7. Argüman penceresine girmek KONTROL, imleci alana getirin "1 numara" ve fare düğmesini basılı tutarak koleksiyonu seçin. Ardından düğmeye tıklayın TAMAM.
  8. Bundan sonra program, güven aralığının değerini hesaplar ve görüntüler.
  9. Sınırları belirlemek için yine örnek ortalamasını hesaplamamız gerekecek. Ancak, formülü kullanan hesaplama algoritması göz önüne alındığında ORTALAMAönceki yöntemle aynı ve sonuç değişmedi bile, bunun üzerinde ikinci kez ayrıntılı olarak durmayacağız.
  10. Hesaplama sonuçlarını toplama ORTALAMA ve GÜVEN.ÖĞRENCİ, güven aralığının doğru sınırını elde ederiz.
  11. Operatörün hesaplama sonuçlarından çıkarma ORTALAMA hesaplama sonucu GÜVEN.ÖĞRENCİ, güven aralığının sol sınırına sahibiz.
  12. Hesaplama bir formülde yazılırsa, bizim durumumuzda sağ sınırın hesaplanması şöyle görünecektir:

    ORTALAMA(B2:B13)+ÖĞRENCİ GÜVENİ(0.03,STDV(B2:B13),SAYI(B2:B13))

  13. Buna göre, sol sınırı hesaplama formülü şöyle görünecektir:

    ORTALAMA(B2:B13)-ÖĞRENCİ GÜVENİ(0.03,STDV(B2:B13),SAYI(B2:B13))

Gördüğünüz gibi, Excel programının araçları, güven aralığının ve sınırlarının hesaplanmasını önemli ölçüde kolaylaştırmayı mümkün kılıyor. Bu amaçlar için, varyansı bilinen ve bilinmeyen örnekler için ayrı operatörler kullanılır.

İstatistikte iki tür tahmin vardır: nokta ve aralık. Puan Tahmini bir popülasyon parametresini tahmin etmek için kullanılan tek bir örnek istatistiktir. Örneğin, örnek ortalama popülasyon ortalamasının nokta tahmini ve örnek varyansı S2- popülasyon varyansının nokta tahmini σ2. örnek ortalamasının, popülasyon beklentisinin yansız bir tahmini olduğu gösterildi. Örnek ortalaması tarafsız olarak adlandırılır çünkü tüm örnek ortalamalarının ortalaması (aynı örneklem büyüklüğü ile) n) genel popülasyonun matematiksel beklentisine eşittir.

Örnek varyansı için S2 popülasyon varyansının tarafsız bir tahmincisi oldu σ2, örnek varyansının paydası şuna eşit olmalıdır: n – 1 , Ama değil n. Başka bir deyişle, popülasyon varyansı, olası tüm örnek varyanslarının ortalamasıdır.

Anakütle parametreleri tahmin edilirken, aşağıdaki gibi örnek istatistiklerin akılda tutulması gerekir. , belirli örneklere bağlıdır. Bu gerçeği dikkate almak, elde etmek için aralık tahmini genel popülasyonun matematiksel beklentisi, örnek ortalamaların dağılımını analiz eder (daha fazla ayrıntı için bkz.). Oluşturulan aralık, genel popülasyonun gerçek parametresinin doğru tahmin edilmesi olasılığı olan belirli bir güven düzeyi ile karakterize edilir. Bir özelliğin oranını tahmin etmek için benzer güven aralıkları kullanılabilir R ve genel nüfusun ana dağıtılmış kütlesi.

Notu veya biçiminde indirin, örnekler biçiminde

Bilinen bir standart sapma ile genel popülasyonun matematiksel beklentisi için bir güven aralığının oluşturulması

Genel popülasyondaki bir özelliğin oranı için bir güven aralığı oluşturma

Bu bölümde, bir güven aralığı kavramı kategorik verilere genişletilir. Bu, özelliğin genel popülasyondaki payını tahmin etmenizi sağlar. Rörnek bir paylaşımla RS= X/n. Değerler belirtildiği gibi nR ve n(1 - p) 5 sayısını aşarsa, binom dağılımı normal dağılıma yaklaşabilir. Bu nedenle, bir özelliğin genel popülasyondaki payını tahmin etmek için R güven düzeyi şuna eşit olan bir aralık oluşturmak mümkündür. (1 - α)x100%.


nerede pS- özelliğin örnek payı, eşit X/n, yani örneklem büyüklüğüne bölünen başarı sayısı, R- özelliğin genel popülasyondaki payı, Z standartlaştırılmış normal dağılımın kritik değeridir, n- örnek boyut.

Örnek 3 Son bir ayda tamamlanan 100 faturadan oluşan bilgi sisteminden bir örnek çıkarıldığını varsayalım. Diyelim ki bu faturalardan 10 tanesi yanlış. Böylece, R= 10/100 = 0.1. %95 güven seviyesi, Z = 1,96 kritik değerine karşılık gelir.

Bu nedenle, faturaların %4,12 ila %15,88'inin hata içerme olasılığı %95'tir.

Belirli bir örneklem büyüklüğü için, özelliğin genel popülasyondaki oranını içeren güven aralığı, sürekli bir rastgele değişkene göre daha geniş görünmektedir. Bunun nedeni, sürekli bir rastgele değişkenin ölçümlerinin, kategorik verilerin ölçümlerinden daha fazla bilgi içermesidir. Başka bir deyişle, yalnızca iki değer alan kategorik veriler, dağılımlarının parametrelerini tahmin etmek için yetersiz bilgi içerir.

ATsonlu bir popülasyondan alınan tahminlerin hesaplanması

Matematiksel beklenti tahmini. Nihai popülasyon için düzeltme faktörü ( fpc) standart hatayı bir faktör kadar azaltmak için kullanıldı . Popülasyon parametresi tahminleri için güven aralıkları hesaplanırken, örneklerin değiştirilmeden çizildiği durumlarda bir düzeltme faktörü uygulanır. Böylece, güven düzeyi şuna eşit olan matematiksel beklenti için güven aralığı (1 - α)x100%, şu formülle hesaplanır:

Örnek 4 Sonlu bir nüfus için bir düzeltme faktörünün uygulamasını göstermek için, yukarıdaki Örnek 3'te tartışılan ortalama fatura tutarı için güven aralığını hesaplama sorununa dönelim.Bir şirketin ayda 5.000 fatura düzenlediğini varsayalım ve X= 110.27 ABD Doları, S= 28,95 dolar N = 5000, n = 100, α = 0.05, t99 = 1.9842. Formül (6)'ya göre şunları elde ederiz:

Özelliğin payının tahmini. Geri dönüş yok seçilirken, güven düzeyi şuna eşit olan özelliğin oranı için güven aralığı (1 - α)x100%, şu formülle hesaplanır:

Güven aralıkları ve etik konular

Bir popülasyonu örneklendirirken ve istatistiksel çıkarımları formüle ederken, genellikle etik sorunlar ortaya çıkar. Bunlardan en önemlisi, örnek istatistiklerin güven aralıklarının ve nokta tahminlerinin nasıl uyuştuğudur. Uygun güven aralıklarını (genellikle %95 güven seviyelerinde) ve bunların türetildiği örneklem boyutunu belirtmeden nokta tahminlerini yayınlamak yanıltıcı olabilir. Bu, kullanıcıya, tüm popülasyonun özelliklerini tahmin etmek için tam olarak ihtiyaç duyduğu şeyin bir nokta tahmini olduğu izlenimini verebilir. Bu nedenle, herhangi bir araştırmada nokta değil, aralık tahminlerinin ön plana çıkarılması gerektiğini anlamak gerekir. Ayrıca örneklem büyüklüklerinin doğru seçilmesine özellikle dikkat edilmelidir.

Çoğu zaman, istatistiksel manipülasyonların nesneleri, çeşitli siyasi konularda nüfusun sosyolojik araştırmalarının sonuçlarıdır. Aynı zamanda, anketin sonuçları gazetelerin ön sayfalarına yerleştirilir ve örnekleme hatası ve istatistiksel analiz metodolojisi ortada bir yere yazdırılır. Elde edilen nokta tahminlerinin geçerliliğini kanıtlamak için, elde edildikleri bazında örneklem büyüklüğünü, güven aralığının sınırlarını ve önem düzeyini belirtmek gerekir.

Sonraki not

Yöneticiler için Levin ve diğerleri İstatistikleri kitabından materyaller kullanılmaktadır. - E.: Williams, 2004. - s. 448-462

Merkezi Limit Teoremi yeterince büyük bir örneklem boyutu için, ortalamaların örnek dağılımının normal bir dağılımla yaklaşık olarak tahmin edilebileceğini belirtir. Bu özellik, nüfus dağılımının türüne bağlı değildir.