Przedziały ufności i testowanie hipotez – teoria

Przedziały ufności

Przedział ufności na poziomie ufności 1α dla parametru t to przedział, w którym na (1α)100% leży wartość parametru t, tzn.

P(L<t<P)=1α

gdzie L i P to wartości krytyczne (czyli krańcowe) dla przedziału ufności.

Poziom istotności α

Poziom istotności α jest to maksymalne prawdopodobieństwo, że popełnimy błąd pierwszego rodzaju, tzn. prawdopodobieństwo odrzucenia hipotezy zerowej, mimo że była ona prawdziwa. Mówiąc prościej jest to prawdopodobieństwo, że stwierdzimy, że nasz przedział ufności nie zawiera szukanego parametru mimo że w go zawierał.

Co to jest poziom ufności?

Poziom ufności to procent, który mówi nam jak bardzo dokładny jest przedział ufności, czyli jak często mamy rację. Im większy poziom ufności (bliższy 100%) tym częściej mamy rację co do oszacowania parametru.

Poziom istotności a poziom ufności:

Relacja między tymi pojęciami jest prosta.

poziom istotności : α

poziom ufności : 1α

Typowe poziomy ufności:

Najczęściej spotykanymi poziomami ufności są 99%, 98%, 95% oraz 90%. Im większy poziom ufności tym szerszy przedział – skoro chcemy mieć większą pewność, że wartość parametru leży w naszym przedziale to musimy go zwiększyć.

Po co nam przedział ufności?

Przedział ufności informuje nas na ile możemy ufać naszym wyliczeniom, np. dotyczącymi średniej. Załóżmy, że chcemy wyliczyć średnią wagę studentów w Polsce. Jeżeli chcielibyśmy wyliczyć dokładną wartość musielibyśmy przebadać wszystkich studentów w Polsce. Oczywiście dałoby się to zrobić ale badania byłyby kosztowne i czasochłonne. Dlatego chcemy wybrać reprezentatywną grupę studentów i estymować (oszacować) wartość średniej. Jednak wybierając grupę, może się zdarzyć, że trafiliśmy lepiej lub gorzej. Z tego powodu zamiast podawać dokładną wartość możemy podać przedział i powiedzieć, że na 99% średnia jest w tym przedziale a to już daje nam obraz wagi całej populacji studentów

Przedział ufności dla średniej:

    \[Dla\; znanej\; \sigma\; i\; dowolnego\; n:( \overline{X} - u_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} , \overline{X} + u_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} )\]

    \[Dla\; nieznanego\; \sigma\; i\; n\leq 30:( \overline{X} - u_{1- \frac{\alpha}{2}} \frac{s}{\sqrt{n}} , \overline{X} + u_{1-\frac{\alpha}{2}} \frac{s}{\sqrt{n}} )\]

    \[Dla\; nieznanego\; \sigma\; i\; n> 30:( \overline{X} - t_{\alpha,n-1} \frac{s}{\sqrt{n}} , \overline{X} + t_{\alpha,n-1} \frac{s}{\sqrt{n}} )\]

Przedział ufności dla odsetka/frakcji/wskaźnika struktury:

    \[p \in (\frac{m}{n} - u_{\frac{\alpha}{2}} \frac{\sqrt{\frac{m}{n}\cdot(1-\frac{m}{n})}}{\sqrt{n}},\frac{m}{n} + u_{\frac{\alpha}{2}} \frac{\sqrt{\frac{m}{n}\cdot(1-\frac{m}{n})}}{\sqrt{n}} )\]

gdzie m- ilość zdarzeń sprzyjających, n- ilość wszystkich zdarzeń

Przedział ufności dla wariancji:

    \[\sigma \in ( \frac{nS^{2}}{ \chi_{1-\frac{\alpha}{2} , n-1}},\frac{nS^{2}}{ \chi_{\frac{\alpha}{2} , n-1}} )\]

Minimalna liczebność próby:

    \[n \geq \frac{u_{\alpha}^{2}\sigma^{2}}{d^{2}}\]

Przedział ufności

Minimalna liczebność próby

Minimalna liczebność próby mówi nam ile danych potrzebujemy, aby maksymalny błąd oszacowania (na poziomie ufności 1α ) wyniósł co najwyżej d.

Im więcej mamy obserwacji tym nasze oszacowanie jest bardziej trafne przez co przedział ufności będzie węższy. Z powodu kosztowności pomiarów nie możemy za bardzo powiększyć ilości obserwacji więc należy znaleźć złoty środek między dokładnością, a ilością obserwacji.

Definicja:

    \[\large n \geq u_{1 - \frac{\alpha}{2}}^{2}\frac{\sigma^{2}}{d^{2}}\]

    \[\large d \geq u_{1 -\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}}\]

n – liczebność próby

σ2 – wariancja rozkładu

d – maksymalny błąd pomiaru

u1−(α/2) – odwrotna dystrybuanta rozkładu normalnego dla 1−(α/2) tzn. taki punkt x dla którego dystrybuanta rozkładu normalnego wynosi 1−(α/2), co zapisujemy: Φ(x)=1−(α/2)

Testowanie hipotez

Hipoteza statystyczna to dowolne przypuszczenie dotyczące rozkładu. Testować można zarówno typ rozkładu jak i jego parametry. Przykładowe hipotezy które da się przetestować:

  • średnia rozkładu wynosi 44
  • Jaki jest typ rozkładu np. czy dany rozkład jest normalny
  • odchylenie standardowe jest równe 17

Prawdziwość danej hipotezy weryfikujemy za pomocą dostępnych obserwacji, tj. Na podstawie posiadanej próby losowej wyciągamy wnioski na temat całej populacji.
Oczywiście w taki sposób nie możemy być w 100% pewni czy otrzymany wynik będzie odzwierciedlał wyniki w całej populacji(wraz ze wzrostem wielkości próby, nasza pewność(poziom ufności) wzrasta), jednakże często badanie całej populacji jest zbyt kosztowne.
Badając hipotezę możemy popełnić dwa rodzaje błędów:

  • Błąd pierwszego rodzaju : odrzucamy hipotezę zerową, mimo że jest ona prawdziwa.
  • Błąd drugiego rodzaju: nie odrzucamy hipotezy zerowej, mimo, że nie jest prawdziwa.

Aby przetestować hipotezę należy:

  1. Zdefiniować hipotezę zerową oraz alternatywną
    Hipoteza zerowa H0 to hipoteza którą chcemy zweryfikować
    Hipoteza alternatywna H1/Ha to hipoteza którą przyjmujemy gdy okaże się, że hipoteza zerowa jest nieprawdziwa
  2. Wyznaczyć statystykę testową T
  3. Wyznaczyć przedział [tl,tp]
  4. Jeżeli wartość statystyki testowej T należy do przedziału [tl,tp] to przyjmujemy hipotezę zerową
    Jeśli wartość ta nie należy do przedziału to odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej.

Ad2.

    \[H_{0}-srednia=m\]

    \[T = \frac{\overline{X} - m}{\sigma} \cdot \sqrt{n}\leftarrow jezeli\; \sigma \; jest\; znane\]

    \[T = \frac{\overline{X} - m}{s} \cdot \sqrt{n}\leftarrow jezeli\; \sigma \; nie\; jest\; znane\]

Gdzie 

    \[s^{2} = \frac{1}{n-1} \sum\limits_{i=1}^n (X_{i}- \overline{X})^{2}\]

Ad3. Jeżeli nie znamy σ oraz n ≤ 30 to aby wyznaczyć wartości graniczne korzystamy z rozkładu t-studenta.
W pozostałych przypadkach(σ jest znana lub n>30) korzystamy z rozkładu normalnego.
Przy wyznaczaniu [tl,tp] musimy wiedzieć czy mamy do czynienia z testem jednostronnym czy obustronnym.
Test jednostronny występuje gdy:
1) HA:średnia<m
Wtedy przedział [tl,tp] ma postać [tl,∞]
Dla znanego σ lub n>30

    \[t_{l} = u_{\alpha} = - u_{1 - \alpha}\]

Dla nieznanego σ i n>30

    \[t_{l} = t_{\alpha, n-1} = -t_{1 - \alpha, n-1}\]

2)HA:średnia>m
Wtedy przedział [tl,tp] ma postać [∞,tp]
Dla znanego σ lub n>30:

    \[t_{p} = u_{1-\alpha}\]

Dla nieznanego σ i n>30 :

    \[t_{p} = t_{1 -\alpha, n-1}\]

Test obustronny występuje gdy:
HA:średnia≠m
Wtedy przedział [tl,tp] ma postać [-tp,tp]
Dla znanego σ lub n>30:

    \[t_{p} = u_{1-\frac{\alpha}{2}}\]

Dla nieznanego σ i n>30 :

    \[t_{p} = t_{1 -\frac{\alpha}{2}, n-1}\]

Przedział ufności dla średniej:

    \[Znane\: \sigma,n-dowolne\Rightarrow ( \overline{X} - u_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} , \overline{X} + u_{1-\frac{\alpha}{2}} \frac{\sigma}{\sqrt{n}} )\]

    \[Nieznane\: \sigma,n\leq 30\Rightarrow ( \overline{X} - u_{1- \frac{\alpha}{2}} \frac{s}{\sqrt{n}} , \overline{X} + u_{1-\frac{\alpha}{2}} \frac{s}{\sqrt{n}} )\]

    \[Nieznane\: \sigma,n> 30\Rightarrow ( \overline{X} - t_{\alpha,n-1} \frac{s}{\sqrt{n}} , \overline{X} + t_{\alpha,n-1} \frac{s}{\sqrt{n}} )\]

Przedział ufności dla odsetka/frakcji/wskaźnika struktury:

    \[p \in (\frac{m}{n} - u_{\frac{\alpha}{2}} \frac{\sqrt{\frac{m}{n}\cdot(1-\frac{m}{n})}}{\sqrt{n}},\frac{m}{n} + u_{\frac{\alpha}{2}} \frac{\sqrt{\frac{m}{n}\cdot(1-\frac{m}{n})}}{\sqrt{n}} )\]

m-ilość zdarzeń sprzyjających
n-ilość wszystkich zdarzeń

Przedział ufności dla wariancji:

    \[\sigma \in ( \frac{nS^{2}}{ \chi_{1-\frac{\alpha}{2} , n-1}},\frac{nS^{2}}{ \chi_{\frac{\alpha}{2} , n-1}} )\]

Minimalna liczebność próby:

    \[n \geq \frac{u_{\alpha}^{2}\sigma^{2}}{d^{2}}\]

Testowanie hipotez

Przedzialy ufnosci i testowanie hipotez - napis