Przedziały ufności i testowanie hipotez – zadania

Aby zobaczyć rozwiązania zadań 2-11 należy wykupić abonament

W 25- elementowej próbie prostej, złożonej z drzew losowo wybranych z lasu, otrzymano:

    \[\overline{X} = 37.3cm\]

    \[s^{2} =13.5 cm^{2}\]

Zakładamy, że rozkład średnicy drzew w tym lesie jest w przybliżeniu normalny. Wyznaczyć 96%-ową realizację przedziału ufności dla przeciętnej liczby drzew w tym lesie.

Zwróćmy uwagę na to, że n < 30 a wariancja została otrzymana(wyliczona) z próby 25 elementowej więc skorzystamy z dystrybuanty rozkładu t-studenta.

1α=0.96
α=0.04

    \[\large t_{0.04, 24} =2.492\]

Teraz wystarczy podstawić do wzoru, czyli

    \[( 37.3 - 2.492\cdot \frac{\sqrt{13.5}}{\sqrt{25}}, 37.3 + 2.492\cdot \frac{\sqrt{13.5}}{\sqrt{25}} )\]

    \[( 37.3 - 1.83, 37.3 + 1.83 ) = ( 35.47 , 39.13 )\]

Odp: 96% przedział ufności przeciętnej liczby drzew w tym lesie wynosi (35.47 , 39.13).

Teraz odczytujemy z tablicy rozkładu t-studenta wartość dla

Ankieter zapytał szesnastu studentów ile litrów kawy każdy z nich wypił w tygodniu poprzedzającym kolokwium z statystyki. Przedział ufności dla wartości oczekiwanej na poziomie 0.1 z pobranej próby wyniósł (2,8).
Oblicz średnią i wariancję ilości litrów wypitej kawy w tej próbie, zakładając że pochodzi z rozkładu normalnego.

Wybierz pakiet:
Zaloguj się lub Wykup
Sprawdź Wykup
Anuluj
Abonament 30 dni
Abonament 90dni

Abonament 30 dni

Dostęp do wszystkich treści serwisu przez 30dni
29,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość

Abonament 90 dni

Dostęp do wszystkich treści serwisu przez 90dni
49,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość
Anuluj

Średnia cena 50 losowo wybranych podręczników akademickich wyniosła 28.40 PLN. Wiadomo, ze odchylenie standardowe cen podręczników wynosi 4.75 PLN. Wyznaczyć 95% przedział ufności dla średniej ceny podręcznika akademickiego zakładając, ze rozkład cen jest rozkładem normalnym.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

W grupie 3600 losowo wybranych pasażerów warszawskiego metra 1584 osoby stwierdziły, że metro jest dla nich jedynym środkiem dojazdu do pracy. Wyznacz 90%- realizację przedziału ufności dla odsetka osób, dla których metro jest jedynym środkiem dojazdu do pracy.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

W celu oszacowania jak duży jest odsetek rodzin 3 osobowych, w których kobieta pracuje zawodowo, zbadano 500 takich rodzin uzyskując wynik 180 pracujących kobiet. Przyjmując 1α=0.98  oszacować odsetek ogółu kobiet, w których kobieta pracuje zawodowo.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Wiadomo, że rozkład wagi wśród tabliczek czekolady pochodzących od pewnego producenta ma rozkład normalny z odchyleniem standardowym wynoszącym 5g. Ile co najmniej tabliczek czekolady należy wylosować, aby na podstawie danych dotyczących ich wagi można było na poziomie ufności 0.9 oszacować przedziałowo przeciętną wagę tabliczek czekolady pochodzących od tego producenta z maksymalnym błędem wynoszącym 6g.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Prowadzone są bardzo czasochłonne i cenne badania laboratoryjne. Jaka powinna być minimalna ilość n niezależnych pomiarów, aby uzyskać dokładność nieprzekraczającą 2 jednostek pomiarowych, dla oszacowania wartości przeciętnej w rozkładzie normalnym o znanej wariancji = 8 a poziomie ufności równym 0.97.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Wylosowano 400 osób, których zapytano o to, czy palą papierosy. Wśród ankietowanych 160 odpowiedziało twierdząco. Czy wylosowana próba jest wystarczająca do budowy przedziału ufności dla współczynnika udziału palących na poziomie ufności 95% przy maksymalnym błędzie wynoszącym 4%?

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Chcemy zbadać hipotezę, że średni czas przejazdu linii tramwajowej Y wynosi 28 minut.
W tym celu wykonaliśmy 100 pomiarów czasu przejazdu i otrzymaliśmy następujące wyniki:

    \[\overline{X} = 30, s = 10\]

Przetestuj hipotezę na trzech poziomach ufności:
a) 90%
b) 95%
c) 99%

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Norma techniczna przewiduje średnio 64 sekundy na ułożenie w kartonie 100 tabliczek czekolady. Czas trwania tej czynności jest zmienną losową o rozkładzie normalnym z odchyleniem standardowym 10 sekund. Ponieważ robotnicy często skarżyli się, że norma jest źle ustalona, dokonano pomiaru czasu trwania tej czynności u losowo wybranych 225 robotników i otrzymano, że średni czas trwania czynności jest równy 65 s.
Czy na poziomie istotności 0,07 można stwierdzić, że średni czas czynności jest większy niż norma?
Przy jakim poziomie istotności decyzja weryfikacyjna ulegnie zmianie?

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Sprawdzano, czy poziom samooceny w badanej grupie studentów różni się od przeciętnego poziomu samooceny w ogólnej populacji studentów.
Poziom samooceny mierzony był na skali ilościowej – im wyższa wartość, tym wyższa samoocena.
Wyniki w badanej próbie: 6, 7, 7, 8, 8, 9, 9, 9, 10, 10
Przeciętny poziom samooceny w populacji wynosi m = 7.10

Proszę sprawdzić, czy średni poziom samooceny w badanej grupie studentów różni się od średniej w populacji na poziomie istotności 2%.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Pojęcie przedziału ufności

W wyniku pobrania próby losowej z populacji i obliczenia na tej podstawie wartości estymatora θ szacowanego parametru θ uzyskuje się tzw. punktową ocenę parametru. Prawdopodobieństwo tego, że estymator przyjmie wartość równą wartości szacowanego parametru, jest – przynajmniej w przypadku populacji ciągłych – zawsze równe zeru. Oznacz to, że przy estymacji punktowej z prawdopodobieństwem równym 1 popełniamy błąd. Jest to jeden z powodów stosowania tzw. estymacji przedziałowej, polegającej na tym, że zamiast jednej oceny wartości parametru podaje się pewien przedział, który z określonym z góry prawdopodobieństwem pokrywa nieznaną wartość szacowanego parametru. Pojęcie przedziału ufności zostało wprowadzone do statystyki przez matematyka i statystyka polskiego pochodzenia J. Spławę-Neymana.
Niech cecha X ma w populacji rozkład z nieznanym parametrem θ. Załóżmy, że ma podstawie losowej próby (X1, X2, …, Xn) pochodzącej z tej populacji możemy wyznaczyć takie dwie funkcje θ(X1, X2, …, Xn) i Ō(X1, X2, …, Xn), że dla każdego (x1, x2, …, xn) jest θ<Ō i dla, z góry przyjętego, prawdopodobieństwa 1-α zachodzi:

    \[P(\Theta (X_{1},X_{2},...,X_{n})<\Theta <\bar{\Theta (X_{1},X_{2},...,X_{n})})=1-\alpha\]

Losowy przedział (θ,Ō) będziemy nazywać przedziałem ufności parametru θ, natomiast ustalone z góry prawdopodobieństwo 1-α, z jakim ten przedział pokrywa nieznaną wartość parametru θ, określamy jako współczynnik ufności(rzadziej poziom ufności).
Dla danego α można znaleźć nieskończenie wiele przedziałów spełniających powyższą relację. Statystyka zajmuje się na ogół tylko takimi, których długość jest najmniejsza. Długość przedziału ufności określa bowiem długość estymacji przedziałowej.
Zwróćmy tu jeszcze uwagę na interpretację wyników estymacji przedziałowej. Granice przedziału ufności są funkcjami zmiennych losowych X1, X2, …, Xn stanowiących próbę, a więc są także zmiennymi losowymi, które dla różnych konkretnych prób przyjmować będą różne wartości. Relację przedstawioną wyżej możemy więc interpretować w ten sposób, że przy wielokrotnym pobieraniu prób n-elementowych i wyznaczaniu na ich podstawie wartości funkcji w średnio (1-α)*100% przypadków otrzymamy przedziały pokrywające nieznaną wartość θ. Oznacza to jednocześnie, że w średnio α*100% przypadków otrzymamy przedziały niepokrywające wartości θ.
Oczywiście w praktyce poprzestajemy na pobraniu tylko jednej próby i na wyznaczeniu tylko jednego przedziału ufności(jego granice są liczbami). Jest zrozumiałe, że w tym konkretnym przypadku nie będziemy pewni tego, czy wartość szacowanego parametru θ należy do otrzymanego przedziału. Będziemy jednak „ufali”, że tak jest, jeśli tylko prawdopodobieństwo 1-α będzie dostatecznie duże. Z tego względu w zastosowaniach praktycznych przyjmuje się współczynniki ufności 1-α bliskie jedności (0,9; 0,95 lub 0,99). Przyjęcie bardzo wysokiego współczynnika ufności nie jest jednak zbyt korzystne. Oczywiście, im większą wartość przyjmuje współczynnik ufności, tym szerszy jest przedział ufności, a więc tym samym dokładność estymacji jest mniejsza. W skrajnym przypadku, gdy współczynnik jest równy jedności, przedział ufności musi obejmować cały dopuszczalny zakres wartości parametru θ.

Testowanie hipotez statystycznych

Drugim, oprócz teorii estymacji, podstawowym działem wnioskowania statystycznego jest teoria weryfikacji hipotez statystycznych.

Przez hipotezę statystyczną rozumie się dowolne przypuszczenie co do rozkładu populacji generalnej (jego postaci funkcyjnej lub wartości parametrów). Prawdziwość tego przypuszczenia jest oceniana na podstawie wyników próby losowej.\

Określiliśmy, hipotezę jako dowolne przypuszczenie, ale zwykle mamy pewne informacje o populacji generalnej, ograniczające zbiór możliwych przypuszczeń. Przykładowo, jeśli wiemy, że badana zmienna losowa w populacji generalnej jest zmienną ciągłą, to bezpodstawne jest sprawdzanie hipotezy, że populacja generalna ma rozkład Poissona. Te informacje o populacji generalnej wyznaczają tzw. zbiór hipotez dopuszczalnych, który będziemy oznaczać symbolem Ω. Zbiór hipotez dopuszczalnych jest zbiorem rozkładów, o których wiemy, że mogą charakteryzować populację. W zależności od tego, co wiemy z góry o populacji, rozkłady należące do zbioru hipotez dopuszczalnych mogę różnić się zarówno funkcją, jak i wartością parametrów.

Każda hipoteza statystyczna jest więc podzbiorem hipotez dopuszczalnych, co będziemy zapisywali jako H:F(X)∈ω, gdzie ω∈Ω, natomiast F(x) jest dystrybuantą rozkładu zmiennej losowej w populacji generalnej. Jeśli podzbiór ω zbioru hipotez dopuszczalnych Ω składa się z jednego elementu(rozkładu) tzn. jeśli hipoteza jednoznacznie specyfikuje rozkład populacji generalnej, to hipotezę tę nazywamy prostą. W przypadku gdy podzbiór ω zawiera więcej niż jeden rozkład, hipotezę nazywamy złożoną.
Ponadto, jeśli sformułowane przypuszczenie dotyczy wartości parametrów rozkładu, to jest to hipoteza parametryczna, natomiast pozostałe hipotezy są nazywane nieparametrycznymi.

Po sformułowaniu odpowiedniej hipotezy dotyczącej populacji generalnej niezbędne jest określenie zasad weryfikacji tej hipotezy, tzn. zasad postępowania umożliwiającego stwierdzenie na podstawie wyników próby, czy hipotezę tę możemy uznać za słuszną, czy też nie.

Testem statystycznym nazywamy regułę postępowania, która każdej możliwej próbie przyporządkowuje decyzję przyjęcia lub odrzucenia hipotezy. Oznacza to, że test statystyczny jest regułą rozstrzygającą, jakie wyniki próby pozwalają uznać sprawdzaną hipotezę za prawdziwą, jakie natomiast – za fałszywą

Przedmiotem teorii weryfikacji hipotez statystycznych jest zatem konstrukcja odpowiednich testów statystycznych dla różnego rodzaju hipotez. W zależności od tego, czy test służy do weryfikacji hipotezy parametrycznej, czy też nieparametrycznej, nazywany jest testem parametrycznym lub nieparametrycznym.

Przedzialy ufnosci i testowanie hipotez - napis