Miary tendencji centralnej – teoria

Miary centralne, to takie które wskazują na centralne(bliskie środka) wartości cechy w rozkładzie. Są jedną z podstawowych grup statystyki opisowej – pozostałe to miary rozproszenia oraz symetrii rozkładu. Do miar tendencji centralnej zaliczamy średnią, dominantę oraz medianę.

Średnia

Teoria

Średnia jest najprostszą miarą stosowaną w analizie danych. Często jest kojarzona jako wartość leżąca blisko środka danej zbiorowości. Informuje nas o tym jakiej wartości możemy się spodziewać przy analizie losowej obserwacji. Jednakże średnia nie zawsze zwraca wartość możliwą w rzeczywistości.

Np. Co oznacza sformułowanie, że średnia liczba samochodów posiadanych przez rodzinę jest równa 1.23 ?

Możemy zinterpretować to stwierdzenie w ten sposób, że przeciętna rodzina ma ok. 1 samochodu, ale pewna część rodzin posiada co najmniej 2 auta(prawdopodobnie istnieją także rodziny posiadające 0, zaniżające średnią).
Musimy jednak pamiętać, że istnieje również możliwość, że żadna z rodzin nie posiada 1 samochodu, a istnieją wyłącznie rodziny z 0 lub kilkoma samochodami. Dzieje się tak, ponieważ średnie są silnie narażone na działanie wartości skrajnych.

Wzory

Rodzaje szeregów:

a) SZCZEGÓŁOWY

$\overline{X} = \frac{1}{n} \sum\limits_{i=1}^n X_{i}$

b) ROZDZIELCZY-ILOŚCIOWY

$\overline{X} = \frac{1}{n} \sum X_{i} \cdot n_{i}$

c) ROZDZIELCZY-CZESTOŚCIOWY

$\overline{X}= \sum X_{i} \cdot \omega_{i}$

d) PRZEDZIAŁOWY – ILOŚCIOWY

$\overline{X} = \frac{1}{n} \sum \overline{X}_{i} \cdot n_{i}$

e) PRZEDZIAŁOWY – CZĘSTOŚCIOWY

$\overline{X}= \sum \overline{X}_{i} \cdot \omega_{i}$

Oznaczenia:

n – ilość obserwacji

X_i – wartość i-tej obserwacji

w_i – częstość i-tej obserwacji lub przedziału

$\overline{X}_{i}$

– wartość środkowa i-tego przedziału

Wideo

Średnia arytmetyczna

Mediana

Teoria

Mediana często określana również jako wartość środkowa, wartość przeciętna, drugi kwartyl. Jest środkową wartością zbioru danych obserwacji. Oznacza to, że 50% wszystkich obserwacji leży na lewo od niej oraz 50% na prawo.
Aby wyznaczyć medianę trzeba wcześniej uporządkować wszystkie dane rosnąco. Następnie należy policzyć liczbę danych. Jeśli ich liczba jest nieparzysta to mediana jest wartością środkową. W przypadku gdy liczba danych jest parzysta mediana to średnia arytmetyczna dwóch środkowych wartości.

Mediana jest częściej używana w statystyce niż średnia arytmetyczna ze względu na większą odporność na wartości skrajne. Ma swoje zastosowanie także w innych dziedzinach np. grafice, przetwarzaniu obrazu w celu odszumiania.

Wzory

Rodzaje szeregów:

a) SZCZEGÓŁOWY

$f(n) = \begin{cases} \frac{1}{2}(X_{\frac{n}{2}} + X_{\frac{n}{2}+1}) , & n\mbox{ - parzyste} \\ X_{\frac{n+1}{2}}, & n\mbox{ - nieparzyste} \end{cases}$

b) ROZDZIELCZY-ILOŚCIOWY

$f(n) = \begin{cases} \frac{1}{2}(X_{\frac{n}{2}} + X_{\frac{n}{2}+1}) , & n\mbox{ - parzyste} \\ X_{\frac{n+1}{2}}, & n\mbox{ - nieparzyste} \end{cases}$

c) PRZEDZIAŁOWY-ILOŚCIOWY

$Me = X_{Me}+ \frac{ poz.Me - n_{Me sk - 1} }{n_{Me}} \cdot h_{Me}$

d) PRZEDZIAŁOWY-CZĘSTOŚCIOWY

$Me = X_{Me}+ \frac{ poz.Me - \omega_{Me sk - 1} }{\omega_{Me}} \cdot h_{Me}$

Oznaczenia:

x_Me – lewy koniec przedziału z Medianą
n_Me – liczebność przedziału z Medianą
n_Mesk−1 – liczebność skumulowana przedziału przed przedziałem z Medianą
ω_Me – częstość przedziału z Medianą
ω_Mesk−1 – częstość skumulowana przedziału przed przedziałem z Medianą
h_Me – długość przedziału z Medianą

Wideo

Mediana

Dominanta

Teoria

Dominanta(modalna), jest to wartość najczęściej występująca w zbiorze danych, czyli ta której prawdopodobieństwo wystąpienia jest najwyższe. Dla zmiennej losowej ciągłej modalna to argument, dla którego funkcja gęstości prawdopodobieństwa osiąga maksimum. Istnieje możliwość aby więcej niż jedna wartość była dominantą

np. 2,2,2,3,4,5,5,5,6,7

W tym zestawieniu zarówno 2 jak i 5 jest dominantą.