Estymacja – zadania
W zakładzie pracuje 300 robotników przy montażu urządzeń elektrycznych. Wylosowano 50 robotników, dla których średni czas montażu wynosił 18 minut, a odchylenie standardowe 2,6 minuty. Przyjmując poziom ufności 1-α=0,95 zbudować przedział ufności pokrywający średni czas montażu urządzeń elektrycznych dla wszystkich pracowników, jeżeli zakłada się normalność rozkładu czasu montażu.
JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Przyjmując poziom ufności zbudować przedział ufności pokrywający średni czas montażu urządzeń elektrycznych dla wszystkich pracowników, jeżeli zakłada się normalność rozkładu czasu montażu.”
Mamy tu zwroty: zbudować przedział ufności oraz poziom ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„W zakładzie pracuje 300 robotników przy montażu urządzeń elektrycznych.”
Dowiadujemy się, że w zakładzie pracuje 300 robotników, ale nie ma kompletnie nic na temat losowania próby, także przyjmujemy, że jest to liczebność populacji .
„Wylosowano 50 robotników, dla których średni czas montażu wynosił 18 minut, a odchylenie standardowe 2,6 minuty.”
W tym momencie zaczyna się opis próby, ponieważ pojawia się informacja o wylosowaniu konkretnej ilości pracowników, tak więc liczebność próby to . Podano też średni czas montażu dla próby czyli
i odchylenie standardowe
. Oczywiście zastosowaliśmy oznaczenia dla próby.
Przyjmując poziom ufności zbudować przedział ufności pokrywający średni czas montażu urządzeń elektrycznych dla wszystkich pracowników, jeżeli zakłada się normalność rozkładu czasu montażu.”
Podano poziom (współczynnik) ufności . Od razu wyznaczamy
.
W zadaniu występuje założenie normalności rozkładu czasu montażu i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać – rozkład normalny o nieznanej średniej
i nieznanym odchyleniu standardowym
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA 300 robotników pracujących przy montażu urządzeń elektrycznych |
PRÓBA 50 wybranych robotników |
|
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Przyjmując poziom ufności zbudować przedział ufności pokrywający średni czas montażu urządzeń elektrycznych dla wszystkich pracowników, jeżeli zakłada się normalność rozkładu czasu montażu.”
Wyraz średni oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco:
Z ufnością 0,95 średnia wartość czasu montażu urządzeń elektrycznych dla wszystkich pracowników mieści się w przedziale od 17,28 do 18,72 minut.
Przeciętne roczne spożycie pieczywa pszennego na 1 osobę w zbiorowości 257 czteroosobowych gospodarstw domowych wynosiło 16 kg, przy wariancji 16 (kg)2. Przyjmując współczynnik ufności 0,99 oszacować przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Przyjmując współczynnik ufności 0,99 oszacować przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych.”
Co prawda nie użyto bezpośrednio zwrotu przedział ufności, ale musimy oszacować przeciętne spożycie pieczywa, więc wypadałoby podać przedział ufności, bo tzw. estymacja punktowa (tzn. konkretna liczba, a nie przedział) daje wynik o prawdopodobieństwie praktycznie równym zero. Dodatkowo występuje tu wyrażenie: współczynnik ufności i w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Przeciętne roczne spożycie pieczywa pszennego na 1 osobę w zbiorowości 257 czteroosobowych gospodarstw domowych wynosiło 16 kg, przy wariancji 16 (kg)2.”
W tym momencie wiemy, że badano 257 gospodarstw, ale nie ma wyraźnych wskazówek, że jest to próba. Trochę przeskoczymy i w ostatnim zdaniu „oszacować przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych” proszą o oszacowanie spożycia dla wszystkich gospodarstw, także te 257 jest tylko częścią całej populacji. Oznaczamy zatem liczebność próby i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
Podano, że przeciętne spożycie, a więc średnią: i wariancję
. Skoro określono wariancję to od razu warto wyznaczyć odchylenie standardowe
, a więc
.
„Przyjmując współczynnik ufności 0,99 oszacować przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych.”
Podano też współczynnik ufności , od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA czteroosobowe gospodarstwa domowe |
PRÓBA 257 wybranych gospodarstw |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Przyjmując współczynnik ufności 0,99 oszacować przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych. ”
Wyrażenie przeciętne oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco:
Z ufnością 0,99 przeciętne spożycie pieczywa pszennego na 1 osobę we wszystkich gospodarstwach domowych mieści się w przedziale od 15,36 do 16,64 kg.
[/FMP]
Pewne przedsiębiorstwo brokerskie chce ustalić przeciętne dzienne obroty na podstawie obserwowanych kolejnych 36 dni roboczych. Średnia dzienna wartość sprzedaży wyniosła 139 zł z odchyleniem standardowym 12 zł. Otrzymano przedział ufności 135,08<m<142,92. Przy jakim współczynniku ufności zbudowano ten przedział?
a) 0,999 b) 0,99 c) 0,95 d) 0,90
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Zwracamy uwagę na zdanie:
„Otrzymano przedział ufności .”
Odnajdujemy w nim zwrot: przedział ufności.
„Przy jakim współczynniku ufności zbudowano ten przedział?”
W ostatnim zdaniu również występuje słowo przedział. Dodatkowym potwierdzeniem, że zadanie dotyczy estymacji przedziałowej jest wyrażenie: współczynnik ufności.
W związku z tym, że podane są końcówki przedziału ufności ( ), a szukany jest współczynnik ufności
z reguły występujący w danych, określimy to zadanie nieco kolokwialnie – „od tyłu”. Mimo to, będziemy postępować zgodnie z przyjętym schematem do zadań z estymacji i tylko na pewnym etapie obliczeń wprowadzimy modyfikacje.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Pewne przedsiębiorstwo brokerskie chce ustalić przeciętne dzienne obroty na podstawie obserwowanych kolejnych 36 dni roboczych.”
W tym momencie dowiadujemy się, że wybrano 36 dni, a więc podano liczebność próby: .
„Średnia dzienna wartość sprzedaży wyniosła 139 zł z odchyleniem standardowym 12 zł.”
Dla obserwowanej próby średnia sprzedaż wyniosła 139 zł, czyli , a odchylenie standardowe 12 zł, czyli
. Oczywiście użyliśmy oznaczeń średniej i odchylenia standardowego dla próby.
„Otrzymano przedział ufności .”
Podano końcówki przedziału ufności. Wiemy, że średnia dla populacji zawarta jest w przedziale od 135,08 zł do 142,92 zł.
„Przy jakim współczynniku ufności zbudowano ten przedział?”
Naszą niewiadomą jest współczynnik ufności .
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA ogół dni roboczych |
PRÓBA 36 wybranych dni roboczych |
|
– końcówki przedziału ufności dla średniej z populacji
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który został oszacowany przedziałem ufności, ale nie ma tu charakterystycznego zwrotu, który pozwalałby na wybór wzoru. Przyjrzyjmy się zdaniu:
„Otrzymano przedział ufności .”
Podano tu końcówki przedziału ufności dla , czyli wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Jak widać, nie możemy uzupełnić współczynnika ufności , a tym samym nieznana jest
, więc na tym etapie nie mamy możliwości odczytania odpowiedniej statystyki z tablic rozkładu normalnego (bo w formule znajduje się literka u). Znamy jednak końcówki przedziału ufności i w związku z tym możemy je pomocniczo nanieść do wzoru.
Nie znamy wartości , więc potraktujmy ją jak niewiadomą i rozwiążmy równanie aby ją wyznaczyć. Którą końcówkę przedziału wybrać tzn. 135,08 czy 142,92? Jest to całkowicie obojętne, ponieważ w obu przypadkach
jest tą samą wartością. Poza tym szukamy jednej niewiadomej, a do wyznaczenia jednej niewiadomej wystarczy jedno równanie. A więc na przykład:
Jeśli komuś z Was jest wygodniej rozwiązywać równania z literką , to może nią spokojnie na początku zastąpić symbol
.
Dopiero teraz wracamy do odczytywania z tablic, jest to tzw. „zadanie od tyłu”, więc i z tablic czytamy od tyłu, a więc szukamy wartości najbliższej , ale w środku tablicy rozkładu normalnego. Wynikiem odczytywania są obrzeża tablicy, a więc inaczej niż zwykle.
Najbliższą wartością we wnętrzu tablicy stanowi
. Odczytując sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. Sumujemy
i
czyli
. Pamiętajmy, że jest to
.

5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy współczynnik ufności: czyli odpowiedź C.
Interpretacja brzmi następująco, chociaż nie jest on w tym przypadku niezbędna:
Z ufnością 0,95 wartość ogółu nieznanych przeciętnych dziennych obrotów przedsiębiorstwa brokerskiego mieści się w przedziale od 135,08 zł do 142,192 zł.
[/FMP]
Na podstawie wielokrotnych obserwacji ustalono, że rozkład czasu dojazdu do pracy osób zatrudnionych w sklepach stołecznych jest rozkładem normalnym. W celu oszacowania nieznanej średniej w tym rozkładzie wylosowano niezależenie 100-elementową próbę pracowników. Średni czas dojazdu w tej próbie wynosił 40 min., a odchylenie standardowe stanowiło ½ czasu średniego. Jaki współczynnik ufności przyjęto przy szacowaniu średniej w rozkładzie czasu dojazdu do pracy ogółu pracowników, jeżeli długość oszacowanego przedziału wyniosła 7,84 min.?
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Jaki współczynnik ufności przyjęto przy szacowaniu średniej w rozkładzie czasu dojazdu do pracy ogółu pracowników, jeżeli długość oszacowanego przedziału wyniosła 7,84 min.?”
Odnajdujemy zwrot: oszacowanego przedziału, dodatkowo występuje wyrażenie: współczynnik ufności i w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
Z treści zadania wynika, że nie trzeba obliczać końcówek przedziału ufności, a szukany jest współczynnik ufności z reguły występujący w danych, zatem określimy to zadanie nieco kolokwialnie – „od tyłu”. Zresztą podano długość przedziału ufności. Mimo to, będziemy postępować zgodnie z przyjętym schematem do zadań z estymacji i tylko na pewnym etapie obliczeń wprowadzimy modyfikacje.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Na podstawie wielokrotnych obserwacji ustalono, że rozkład czasu dojazdu do pracy osób zatrudnionych w sklepach stołecznych jest rozkładem normalnym.”
Podano założenie normalności rozkładu czasu dojazdu i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać – rozkład normalny o nieznanej średniej
i nieznanym odchyleniu standardowym
.
„W celu oszacowania nieznanej średniej w tym rozkładzie wylosowano niezależenie 100-elementową próbę pracowników.”
W tym momencie dowiadujemy się, że wybrano 100 pracowników, a więc podano liczebność próby: .
„Średni czas dojazdu w tej próbie wynosił 40 min., a odchylenie standardowe stanowiło ½ czasu średniego.”
Podano średnią dla próby, czyli i odchylenie standardowe dla próby. Co prawda nie jest podane bezpośrednio, ale jako połowa średniej, a więc
. Oczywiście użyliśmy oznaczeń dla próby.
„Jaki współczynnik ufności przyjęto przy szacowaniu średniej w rozkładzie czasu dojazdu do pracy ogółu pracowników, jeżeli długość oszacowanego przedziału wyniosła 7,84 min.?”
Naszą niewiadomą jest współczynnik ufności . Określono również długość szacowanego przedziału ufności – 7,84 min.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA ogół pracowników |
PRÓBA 100 wybranych pracowników |
|
|
– długość przedziału ufności dla średniej z populacji
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który został oszacowany przedziałem ufności. Przyjrzyjmy się zdaniu:
„Jaki współczynnik ufności przyjęto przy szacowaniu średniej w rozkładzie czasu dojazdu do pracy ogółu pracowników, jeżeli długość oszacowanego przedziału wyniosła 7,84 min.?”
Wiemy zatem, że zbudowano przedział ufności dla średniej z populacji – przypominam, że przedział ufności jest budowany dla parametrów z populacji i dlatego nie
tylko
.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Jak widać, nie możemy uzupełnić współczynnika ufności , a tym samym nieznana jest
, więc na tym etapie nie mamy możliwości odczytania odpowiedniej statystyki z tablic rozkładu normalnego (bo w formule znajduje się literka u).
Znamy jednak długość przedziału ufności i w związku z tym należy jakoś tą informację wykorzystać.
Teraz na chwilę zapomnijmy o zadaniu i przypomnijmy sobie w jaki sposób oblicza się jego długość. Weźmy przykładowo przedział i naszkicujmy go na osi.

Aby obliczyć długość przedziału należy od końcówki odjąć jego początek, a więc .
Podobnie z przedziałem z zadania, a więc , można oczywiście zapisać go w taki sposób
. Co prawda przedział nie jest uzupełniony do końca, ale postępujemy analogicznie:
Opuszczamy nawiasy:
Dopiero teraz wracamy do odczytywania z tablic, jest to tzw. „zadanie od tyłu”, więc i z tablic czytamy od tyłu, a więc szukamy wartości najbliższej , ale w środku tablicy rozkładu normalnego. Wynikiem odczytywania są obrzeża tablicy, a więc inaczej niż zwykle.
Najbliższą wartością we wnętrzu tablicy stanowi
. Odczytując sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. Sumujemy
i
czyli
. Pamiętajmy, że jest to
.

5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy współczynnik ufności: .
Interpretacja nie jest konieczna, zresztą i tak nie znamy końcówek przedziału ufności tylko jego długość.
[/FMP]
Poddano analizie wydatki na odzież w wiejskich rodzinach czteroosobowych. Z populacji tych rodzin wylosowano próbę 324-elementową. Na bazie przeprowadzonych obserwacji ustalono przeciętną skalę wydatków na odzież zł. Badania lat ubiegłych wykazały, że rozkład wydatków na odzież jest rozkładem normalnym o stałej wariancji
. Należy:
a) wyznaczyć przedział ufności średnich miesięcznych wydatków na odzież w wiejskich rodzinach czteroosobowych, dla całej populacji, przyjmując poziom ufności ,
b) ustalić względny stopień precyzji oszacowania nieznanego parametru .
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„wyznaczyć przedział ufności średnich miesięcznych wydatków na odzież w wiejskich rodzinach czteroosobowych, dla całej populacji, przyjmując poziom ufności ”
Mamy tu wyrażenie: wyznaczyć przedział ufności i dodatkowo poziom ufności- w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
Dopiero po wybraniu wzoru na przedział ufności możemy zająć się względną precyzją szacunku.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Poddano analizie wydatki na odzież w wiejskich rodzinach czteroosobowych.”
Tu nie mamy właściwie informacji na temat konkretnych danych liczbowych, ale podano, że populacja to wiejskie rodziny czteroosobowe.
„Z populacji tych rodzin wylosowano próbę 324-elementową.”
W tym momencie wiemy, że wybrano próbę, a jej liczebność to i w związku z tym będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
„Na bazie przeprowadzonych obserwacji ustalono przeciętną skalę wydatków na odzież zł.”
Określono (oczywiście dla próby) średnią, czyli .
„Badania lat ubiegłych wykazały, że rozkład wydatków na odzież jest rozkładem normalnym o stałej wariancji ”
Dowiadujemy się, że wydatki na odzież są cechą o rozkładzie normalnym i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Ponadto możemy odczytać jeden z parametrów rozkładu tzn. wariancję dla populacji . Od razu możemy wyznaczyć odchylenie standardowe jako pierwiastek z wariancji
i ostatecznie zapisać , że badana cecha na rozkład normalny o nieznanej średniej
i znanym odchyleniu standardowym
.
„wyznaczyć przedział ufności średnich miesięcznych wydatków na odzież w wiejskich rodzinach czteroosobowych, dla całej populacji, przyjmując poziom ufności ”
Na końcu podano współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA czteroosobowe rodziny wiejskie |
PRÓBA 324 wybranych rodzin |
|
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w przedostatnim zdaniu wyłapujemy słowo:
„wyznaczyć przedział ufności średnich miesięcznych wydatków na odzież w wiejskich rodzinach czteroosobowych, dla całej populacji, przyjmując poziom ufności .”
Wyrażenie średnich oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
jest znana
i tylko model I jest odpowiedni. Liczebność próby nie jest w ogóle istotna.

Nadszedł czas by określić wzór na względną precyzję oszacowania wartości oczekiwanej .
, gdzie
(bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej
:
czyli . Powtarzam jeszcze raz, że formuła na obliczenie
zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej
.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego . Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
Z kolei względna precyzja szacunku:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco:
Z ufnością 0,95 średnie miesięczne wydatki na odzież w wiejskich rodzinach czteroosobowych dla całej populacjimieszczą się w przedziale od 116,8 zł do 123,2 zł. Względny błąd szacunku wynosi 2,67%.
[/FMP]
Na zawodach sportowych bada się czas pokonania przez sportowców dystansu 100 m. Dokonano 30 niezależnych pomiarów i otrzymano z nich średnią wynoszącą 12 sekund oraz odchylenie standardowe równe 2 sekundy. Przyjmując współczynnik ufności 0,95 oszacuj metodą przedziałową średni czas potrzebny na pokonanie wyznaczonego dystansu. Ustal względny stopień precyzji szacunku nieznanego parametru.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Zwracamy uwagę na zdanie:
„Przyjmując współczynnik ufności 0,95 oszacuj metodą przedziałową średni czas potrzebny na pokonanie wyznaczonego dystansu.”
Odnajdujemy w nim zwrot: oszacuj metodą przedziałową. Występuje też wyrażenie współczynnik ufności –w związku z tym z całą pewnością zadanie dotyczy estymacji przedziałowej. Formuła na względny błąd szacunku zostanie określona na etapie wyboru wzoru na estymację.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Na zawodach sportowych bada się czas pokonania przez sportowców dystansu 100 m. ”
Dowiadujemy się właściwie tylko, że bada się sportowców pod kątem czasu pokonania dystansu 100 m, a sam dystans nie jest (przynajmniej na razie) konkretnym parametrem do umieszczenia w danych.
„Dokonano 30 niezależnych pomiarów i otrzymano z nich średnią wynoszącą 12 sekund oraz odchylenie standardowe równe 2 sekundy.”
W tym momencie wiemy, że wylosowaliśmy próbę, a jej liczebność to . Określona jest średnia
i odchylenie standardowe z próby
. Oczywiście użyto oznaczeń symboli dla próby.
„Przyjmując współczynnik ufności 0,95 oszacuj metodą przedziałową średni czas potrzebny na pokonanie wyznaczonego dystansu.”
Podano współczynnik ufności , od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA sportowcy pokonujący dystans 100 m |
PRÓBA 30 wybranych sportowców |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i wyłapujemy słowo:
„Przyjmując współczynnik ufności 0,95 oszacuj metodą przedziałową średni czas potrzebny na pokonanie wyznaczonego dystansu.”
Wyraz średni oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
nie jest mniejsza od 30, ale równa 30 (
), zatem wybieramy model II. W danych występuje
, także interesuje nas pierwsza wersja wzoru z wybranego modelu.

Nadszedł czas by określić wzór na względną precyzję oszacowania wartości oczekiwanej .
, gdzie
(bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej
:
czyli . Powtarzam jeszcze raz, że formuła na obliczenie
zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej
.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla
i 29 stopni swobody.

Wracamy do obliczeń i podstawiamy:
Z kolei względna precyzja szacunku:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: .
Interpretacja brzmi następująco:
Z ufnością 0,95 średni czas potrzebny na pokonanie wyznaczonego dystansu 100 m mieści się w przedziale od 11,24 sekund do 12,76 sekund. Względny stopień precyzji szacunku wynosi 6,33%.
[/FMP]
Dla 100 największych polskich firm uzyskano średni roczny zysk brutto 154 mln zł oraz odchylenie standardowe zysku brutto równe 16,2 mln złotych. Przy współczynniku ufności 0,95, obliczyć względną precyzję oszacowania wartości oczekiwanej zysku brutto wszystkich polskich firm.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
W tym zadaniu nie ma słowa, które jednoznacznie wskazywałoby, że jest to zadanie dotyczące estymacji przedziałowej.
„Przy współczynniku ufności 0,95, obliczyć względną precyzję oszacowania wartości oczekiwanej zysku brutto wszystkich polskich firm.”
Co prawda występuje wyrażenie współczynnik ufności, ale to trochę za mało. Bardziej naprowadzają nas na właściwy trop słowa: oszacowania wartości oczekiwanej, ponieważ oznacza to, że wartość oczekiwaną oszacowano przedziałem ufności, którego nie określono. Bardzo rzadko stosuje się tzw. estymację punktową (czyli jedna konkretna liczba), ponieważ prawdopodobieństwo właściwego wyniku jest praktycznie równe zero. Poza tym interesuje nas względna precyzja oszacowania, a pytanie o tą wielkość dotyczy z reguły zadań z estymacji. W zadaniu nie interesuje nas przedział ufności, ale do podania wzoru na względną precyzję szacunku potrzebujemy formuły na ten przedział. W związku z tym będziemy postępować zgodnie ze znanym schematem dotyczącym estymacji przedziałowej, ale będziemy liczyć wyłącznie to co nas interesuje.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Dla 100 największych polskich firm uzyskano średni roczny zysk brutto 154 mln zł oraz odchylenie standardowe zysku brutto równe 16,2 mln złotych. ”
W tym momencie dowiadujemy się, że badano 100 największych firm, a więc uznamy to za próbę, której liczebność to firm. Określona jest średni roczny zysk czyli średnia
i odchylenie standardowe z próby
. Oczywiście użyto oznaczeń symboli dla próby.
„Przy współczynniku ufności 0,95, obliczyć względną precyzję oszacowania wartości oczekiwanej zysku brutto wszystkich polskich firm.”
Podano współczynnik ufności , od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA wszystkie polskie firmy |
PRÓBA 100 wybranych firm |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który był szacowany przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Przy współczynniku ufności 0,95, obliczyć względną precyzję oszacowania wartości oczekiwanej zysku brutto wszystkich polskich firm.”
Wyraz wartości oczekiwanej oznacza, że budowano przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

Nadszedł czas by określić wzór na względną precyzję oszacowania wartości oczekiwanej .
, gdzie
(bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej
:
czyli . Powtarzam jeszcze raz, że formuła na obliczenie
zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej
.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór , a później
konkretnymi liczbami.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego . Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: względny błąd szacunku wynosi 2,06%.
[/FMP]
Jeżeli w przypadku tzw. dużej liczebnie próby losowej, poziom ufności wzrasta od 0,95 do 0,99, to która z par wyników względnej precyzji oceny wartości oczekiwanej jest jedynie możliwa?
a) 2,632% – 2% b) 2% – 2,632% c) 2,632% – 2,632% d) 2% – 2%
[FMP]
Zadanie dotyczy bardziej części teoretycznej estymacji przedziałowej. Przypominam, że pytanie odnośnie względnej precyzji oszacowania wiąże się z zagadnieniem estymacji. W tym konkretnym zadaniu ograniczymy się do wyboru wzoru, bo nawet etap wypisania danych nic nie da, ponieważ nie ma innych informacji oprócz współczynników ufności.
Podane są współczynniki ufności:
i po wzroście
Wybierając wzór widzimy, że dokonano oceny względnej precyzji wartości oczekiwanej, a liczebność próby jest duża. Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność jest duża (
), zatem wybieramy model III.

Określmy wzór na względną precyzję oszacowania wartości oczekiwanej .
, gdzie
(bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej
:
czyli . Powtarzam jeszcze raz, że formuła na obliczenie
zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej
.
Jak widać w danych nie mamy nic oprócz współczynników ufności, ale bardzo ważne jest, że po zwiększeniu poziomu ufności wartości średniej , odchylenia standardowego
i liczebność próby
nie ulegają zmianie.
Uzupełnijmy wzór na i
dla
(czyli
)
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego . Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy :
Względna precyzja szacunku:
i nic więcej nie można zrobić.
Podobnie postępujemy dla (czyli
)
Ponownie należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego . Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy :
Względna precyzja szacunku:
i nic więcej nie można zrobić.
Porównajmy obydwa wyniki:
i
Zauważmy, że wielkości zaznaczone na czerwono w obu formułach są identyczne. Zmieniły się tylko współczynniki ufności, a tym samym wartości statystyk odczytanych z tablic. W związku z tym, że nie znamy danych zaznaczonych na czerwono możemy nieco krócej zapisać względne precyzje szacunku jako i
. Łatwo je porównać. Jak widać po zwiększeniu współczynnika ufności procentowa wartość względnej precyzji szacunku ulega zmniejszaniu i to jest uniwersalna zasada. Nie otrzymaliśmy wyników podanych w odpowiedziach, ale to są tylko przykładowe liczby, można zastąpić je innymi. Wybieramy zatem odpowiedź B.
Coś tu jednak się nie zgadza, prawda? Przecież otrzymaliśmy większą liczbę i na chłopski rozum względna precyzja uległa zwiększeniu? Z względną precyzją szacunku jest tak, że im większa wartość liczbowa otrzymana w wyniku tym gorsza precyzja oszacowania. Jeśli interpretuje się względną precyzję szacunku to wartość poniżej 5% mówi nam, że wnioskowanie o parametrze (w tym przypadku
) jest uprawnione i całkowicie bezpieczne, jeżeli
mieści się od 5% do 10% wnioskowanie jest możliwe, ale z zalecaną ostrożnością, a jeśli
przekracza 10% wnioskowanie jest niewiarygodne i należy je przerwać. Uzyskiwanie niezadowalającej (powyżej 5%, a tym bardziej powyżej 10%) względnej precyzji szacunku
może być spowodowane zbyt wysokim współczynnikiem ufności, zbyt małą liczebnością próby oraz wysokim zróżnicowaniem wyników w próbie (np. duży rozstrzał danych).
[/FMP]
W 8-osobowej losowo wybranej grupie uczniów zmierzono czas rozwiązywania pewnego zadania matematycznego. Otrzymano następujące wyniki (w minutach): 25, 16, 12, 10, 12, 21, 25, 20. Oszacować metodą przedziałową średni czas niezbędny do rozwiązania tego zadania w całej zbiorowości uczniów. Przyjąć współczynnik ufności 0,90.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu zadania zwracamy uwagę na zdania:
„Oszacować metodą przedziałową średni czas niezbędny do rozwiązania tego zadania w całej zbiorowości uczniów. Przyjąć współczynnik ufności 0,90. ”
Odnajdujemy w nich zwroty: oszacować metodą przedziałową i współczynnik ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„W 8-osobowej losowo wybranej grupie uczniów zmierzono czas rozwiązywania pewnego zadania matematycznego.”
W tym momencie wiemy, że wylosowaliśmy próbę, a jej liczebność to uczniów i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
„Otrzymano następujące wyniki (w minutach): 25, 16, 12, 10, 12, 21, 25, 20.”
Podano informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Oszacować metodą przedziałową średni czas niezbędny do rozwiązania tego zadania w całej zbiorowości uczniów. ”
W tym zdaniu nie ma żadnych wartości przydatnych na etapie wypisywania danych.
„Przyjąć współczynnik ufności 0,90. „
Podano też współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA zbiorowość uczniów rozwiązujących zadanie matematyczne |
PRÓBA 8 wybranych uczniów |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w przedostatnim zdaniu wyłapujemy słowo:
„Oszacować metodą przedziałową średni czas niezbędny do rozwiązania tego zadania w całej zbiorowości uczniów.”
Wyraz średni oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest mniejsza od 30 (
), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich
lub
. Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się
(o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i w dużej mierze nie powtarzają się – zatem średnią liczymy ze wzoru
. Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.
Znak oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem
, gdzie
będzie rosło od
aż do wartości
, a więc
.
Tak więc średnia będzie miała uproszczony wzór:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? To są konkretne wyniki z próby, a więc
. Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc
.
Obliczamy średnią:
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych indywidualnych wygląda tak:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru będzie analogiczne jak w przypadku średniej. Na początek ogólnie:
i dla :
Jak widać do policzenia wariancji i tak niezbędna jest średnia.
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdego wartości
odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję )
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla
i 7 stopni swobody.

Wracamy do obliczeń i podstawiamy :
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: .
Interpretacja brzmi następująco:
Z ufnością 0,90 średni czas niezbędny do rozwiązania tego zadania w całej zbiorowości uczniów mieści się w przedziale od 13,63 minut do 21,63 minut.
[/FMP]
W celu wyznaczenia wartości składowej poziomej natężenia pola magnetycznego ziemi w pewnym punkcie terenowym, dokonano 6 niezależnych pomiarów tej składowej natężenia pola magnetycznego i otrzymano następujące wyniki (w Oe): 0,195; 0,210; 0,189; 0,203; 0,198; 0,205. Przyjmując współczynnik ufności 0,95 wyznacz przedział ufności dla średniej wartości składowej poziomej natężenia pola magnetycznego ziemi w tym punkcie.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu zadania zwracamy uwagę na zdanie:
„Przyjmując współczynnik ufności 0,95 wyznacz przedział ufności dla średniej wartości składowej poziomej natężenia pola magnetycznego ziemi w tym punkcie. ”
Odnajdujemy w nich zwroty: wyznacz przedział ufności i współczynnik ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„W celu wyznaczenia wartości składowej poziomej natężenia pola magnetycznego ziemi w pewnym punkcie terenowym, dokonano 6 niezależnych pomiarów tej składowej natężenia pola magnetycznego i otrzymano następujące wyniki (w Oe): 0,195; 0,210; 0,189; 0,203; 0,198; 0,205.”
W tym momencie wiemy, że wylosowaliśmy próbę, a jej liczebność to i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią
, wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Przyjmując współczynnik ufności 0,95 wyznacz przedział ufności dla średniej wartości składowej poziomej natężenia pola magnetycznego ziemi w tym punkcie. ”
Podano też współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA pole magnetycznego ziemi w pewnym punkcie terenowym |
PRÓBA 6 wybranych pomiarów pola magnetycznego |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Przyjmując współczynnik ufności 0,95 wyznacz przedział ufności dla średniej wartości składowej poziomej natężenia pola magnetycznego ziemi w tym punkcie.”
Wyraz średniej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest mniejsza od 30 (
), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich
lub
. Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się
(o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku), jest ich niewiele i nie powtarzają się – zatem średnią liczymy ze wzoru
. Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – i jest to jak najbardziej prawidłowe rozwiązanie, a ten wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię wzorów rozpisując je na czynniki pierwsze.
Znak oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne obserwacje oznaczone symbolem
, gdzie
będzie rosło od
aż do wartości
, a więc
.
Tak więc średnia będzie miała uproszczony wzór:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? To są konkretne wyniki z próby, a więc
. Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie zrobić. Porządkowanie liczb nie wpływa na wynik, także może zostać tak jak jest. A więc
.
Obliczamy średnią:
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych indywidualnych wygląda tak:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru będzie analogiczne jak w przypadku średniej. Na początek ogólnie:
i dla :
Jak widać do policzenia wariancji i tak niezbędna jest średnia.
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdego wartości
odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję )
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla
i 5 stopni swobody.

Wracamy do obliczeń i podstawiamy:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: .
Interpretacja brzmi następująco:
Z ufnością 0,95 wartość nieznanej średniej wartości składowej poziomej natężenia pola magnetycznego ziemi w tym punkcie (czyli dla populacji) mieści się się w przedziale od 0,192 Oe do 0,208 Oe.
[/FMP]
Dwudziestu tynkarzy wykonuje roboty tynkarskie w wielkiej hali sportowej. Ich średnie wydajności w m2/h zaobserwowane w tym samym dniu są następujące: 5, 4, 4, 6, 4, 5, 7, 5, 6, 7, 4, 3, 5, 6, 5, 4, 5, 6, 5, 4. Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu zadania zwracamy uwagę na ostatnie zdanie:
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . ”
Odnajdujemy w nim zwroty: zbudować przedział ufności i poziom ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Dwudziestu tynkarzy wykonuje roboty tynkarskie w wielkiej hali sportowej.”
Co prawda nie określono precyzyjnie, czy mamy do czynienia z próbą, ale z późniejszej treści zadania wynika, że trzeba oszacować liczbę metrów kwadratowych tynku dla przeciętnego tynkarza. Badanych tynkarzy potraktujemy jako próbę, a jej liczebność to i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
„Ich średnie wydajności w m2/h zaobserwowane w tym samym dniu są następujące: 5, 4, 4, 6, 4, 5, 7, 5, 6, 7, 4, 3, 5, 6, 5, 4, 5, 6, 5, 4.”
Podano informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . „
Podano też współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA tynkarze |
PRÓBA 20 wybranych tynkarzy |
|
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Zbudować przedział ufności dla wartości oczekiwanej liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza na poziomie ufności . ”
Wyrażenie wartości oczekiwanej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest mniejsza od 30 (
), zatem wybieramy model II. Dysponujemy danymi indywidualnymi, więc możemy wyznaczyć z nich
lub
. Decyzja, którą opcję wybrać należy do nas, jest to właściwie obojętne, ale najczęściej wybiera się
(o ile nie zostanie narzucone inaczej), także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi indywidualnymi (wypisanymi po przecinku) i możemy korzystać ze wzorów dotyczących danych indywidualnych (podobnie jak w zadaniach 32-37). Zastanówmy się jednak, czy w tym zadaniu będzie to wygodne. Danych jest dość dużo, bo aż
i w dużej mierze powtarzają się. W związku z tym łatwiej będzie je posegregować w szereg punktowy tzn. wykonać tabelę, w której podliczymy ilości poszczególnych obserwacji.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W szeregu punktowym średnią liczymy ze wzoru . Objaśnijmy go. Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to wartości kolejnych obserwacji, a
liczebności dla tych obserwacji. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, a więc
, a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę klas (ilość wierszy w tabeli z danymi, ilość wariantów obserwacji). Tak więc średnia będzie miała uproszczony wzór:
Czym jest ,
oraz
? Wszystko to pokażmy dokładnie w tabeli:
Numer klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Uzupełniając otrzymujemy wzór:
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu punktowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą mu wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych szeregu punktowego wygląda następująco:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna – od każdej wariantu cechy odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję ).
Numer klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór .
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka t, zatem skorzystamy z tablic t-Studenta. Zapis oznacza statystykę dla
i 19 stopni swobody.

Wracamy do obliczeń i podstawiamy:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy: .
Interpretacja brzmi następująco:
Z ufnością 0,90 wartość oczekiwana liczby metrów kwadratowych tynku wykonanego w ciągu godziny przez jednego tynkarza mieści się w przedziale od 4,58 m2/h do 5,42 m2/h.
[/FMP]
W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):
Powierzchnia mieszkalna |
Liczba mieszkań |
15 – 25 |
10 |
25 – 35 |
25 |
35 – 45 |
40 |
45 – 55 |
30 |
55 – 65 |
10 |
65 – 75 |
5 |
Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Odnajdujemy w nim zwroty: zbuduj przedział ufności i poziom ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„W celu oszacowania średniej powierzchni mieszkań powstałych w 2001 w Gdańsku, wylosowano niezależnie 120 wybudowanych w tym roku mieszkań i otrzymano dla nich następujący rozkład powierzchni mieszkalnej ( w m2):”
Powierzchnia mieszkalna |
Liczba mieszkań |
15 – 25 |
10 |
25 – 35 |
25 |
35 – 45 |
40 |
45 – 55 |
30 |
55 – 65 |
10 |
65 – 75 |
5 |
W tym momencie wiemy, że wylosowano próbę, a jej liczebność to mieszkań i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90.”
Podano też współczynnik ufności , od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA mieszkania wybudowane w 2001 w Gdańsku |
PRÓBA 120 wybranych mieszkań |
dane tabelaryczne – (można obliczyć średnią |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
„Zbuduj przedział ufności dla średniej powierzchni mieszkań wybudowanych w Gdańsku w badanym roku, przyjmując współczynnik ufności 0,90. ”
Wyrażenie średniej oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej.
Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (powierzchnia mieszkalna) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
(powierzchnia mieszkalna) |
(liczba mieszkań) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację
,
(kończymy przedział na 25, następny również zaczynamy od 25), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.
W szeregu przedziałowym średnią liczymy ze wzoru .
Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając należy zsumować początek
i koniec
każdego przedziału i wynik podzielić na dwa.
Wracamy do wzoru na średnią. Znak oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów, a
liczebności dla kolejnych przedziałów. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, a więc
, a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
Czym jest ,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy również środki poszczególnych przedziałów.
Numer klasy |
(wiek pracowników) |
środki przedziałów |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Uzupełniając otrzymujemy wzór:
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy |
środki przedziałów |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna – od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję ).
Numer klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco:
Z ufnością 0,90 nieznana średnia wartość powierzchni dla populacji mieszkań wybudowanych w Gdańsku w badanym roku mieści się się w przedziale od 39,88 m2 do 43,52 m2.
Spośród kandydatów na studia ekonomiczne wybrano w losowaniu niezależnym 200 osób i zbadano je testem logicznego myślenia. Otrzymano następujące wyniki (w punktach):
Wyniki testu |
5 – 9 |
10 – 14 |
15 – 19 |
20 – 24 |
25 – 29 |
30 – 34 |
35 – 39 |
40 – 44 |
Liczba osób |
2 |
16 |
25 |
50 |
50 |
40 |
15 |
2 |
Oszacować metodą przedziałową średni wynik testu logicznego myślenia wśród kandydatów. Przyjąć współczynnik ufności 0,95 oraz 0,99. Które oszacowanie jest bardziej precyzyjne?
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdania:
„Oszacować metodą przedziałową średni wynik testu logicznego myślenia wśród kandydatów. Przyjąć współczynnik ufności 0,95 oraz 0,99.”
Odnajdujemy w nich zwroty: oszacować metodą przedziałową i współczynnik ufności. Teraz mamy pewność, że zadanie dotyczy estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
„Spośród kandydatów na studia ekonomiczne wybrano w losowaniu niezależnym 200 osób i zbadano je testem logicznego myślenia.”
W tym momencie wiemy, że wylosowano próbę, a jej liczebność to osób i w związku z tym będziemy prawdopodobnie stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
„Otrzymano następujące wyniki (w punktach):”
Wyniki testu |
5 – 9 |
10 – 14 |
15 – 19 |
20 – 24 |
25 – 29 |
30 – 34 |
35 – 39 |
40 – 44 |
Liczba osób |
2 |
16 |
25 |
50 |
50 |
40 |
15 |
2 |
Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
„Oszacować metodą przedziałową średni wynik testu logicznego myślenia wśród kandydatów.”
Z punktu widzenia analizy danych nie mamy w tym zdaniu istotnych informacji.
„Przyjąć współczynnik ufności 0,95 oraz 0,99. Które oszacowanie jest bardziej precyzyjne?”
Podano też współczynniki ufności i
, od razu wyznaczamy odpowiednio
i
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA kandydaci na studia ekonomiczne |
PRÓBA 200 wybranych osób |
dane tabelaryczne – (można obliczyć średnią |
– współczynnik ufności,
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w końcówce zadania wyłapujemy słowo:
„Oszacować metodą przedziałową średni wynik testu logicznego myślenia wśród kandydatów. ”
Słowo średni oznacza, że będziemy budować przedział ufności dla wartości średniej z populacji.
Spójrzmy w kartę wzorów. Dla średniej mamy do wyboru trzy modele wzorów. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana, a liczebność próby
jest większa od 30 (
), zatem wybieramy model III.

Ten sam wzór będzie użyty dla obydwu przyjętych współczynników ufności. Oprócz podania przedziałów ufności należy określić stopień precyzji oszacowania obu wyników. Najbardziej miarodajnym miernikiem jest względna precyzja szacunku określona wzorem
, gdzie
(bezwzględny błąd szacunku) jest wielkością odejmowaną i dodawaną do średniej
czyli . Powtarzam jeszcze raz, że formuła na obliczenie
zależy od wzoru wybranego na przedział ufności, ale zawsze jest to wielkość odejmowana i dodawana do średniej
.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych w tabeli i uzupełniamy wzór konkretnymi liczbami. Jak widać potrzebujemy średniej z próby
i odchylenia standardowego
. W związku z tym zanim zajmiemy się uzupełnianiem właściwego wzoru należy obliczyć dwa (na razie) nieznane parametry. Liczenie średniej, wariacji i odchylenia standardowego jest zagadnieniem ze statystyki opisowej.
Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (wyniki testu) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
(wyniki testu) |
(liczba osób) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. Tabela z zadania niestety nie spełnia tego wymogu np.
,
(przedział kończy się 9, następny zaczyna się od 10), itd. w związku z tym musimy nieco przebudować przedziały aby zachować ciągłość. Liczebności poszczególnych przedziałów nie ulegają zmianie. Co prawda spotkałam się z obliczeniami bez zachowania ciągłości, niemniej jednak były to wyjątki. Jeśli nie jesteśmy pewni jak mamy postępować w takim przypadku, po prostu spytajmy prowadzącego zajęcia. Z reguły zmianie ulegają końcówki przedziałów, a początki pozostają bez zmian. Zaczynamy od 5 i zamiast 9 przedział zakończymy na 10, ponieważ kolejny zaczyna się właśnie od 10 itd. Sama dziesiątka i tak nie wchodzi do pierwszego przedziału, ponieważ jest on prawostronnie otwarty. Tabela z przebudowanymi przedziałami wygląda następująco:
(wyniki testu) |
(liczba osób) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Przechodzimy do liczenia brakującej średniej i odchylenia standardowego.
W szeregu przedziałowym średnią liczymy ze wzoru .
Na początku wyjaśnijmy symbol . Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając należy zsumować początek
i koniec
każdego przedziału i wynik podzielić na dwa.
Wracamy do wzoru na średnią. Znak oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów, a
liczebności dla kolejnych przedziałów. Wszytko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, a więc
, a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
Czym jest ,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy również środki poszczególnych przedziałów.
Numer klasy |
(wiek pracowników) |
środki przedziałów |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Uzupełniając otrzymujemy wzór:
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy |
środki przedziałów |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Zostało nam jeszcze odchylenie standardowe . Na początek i tak musimy obliczyć wariancję
, bo
. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco:
. Jest też alternatywa
, ale będziemy używać pierwszej wersji. Rozpisanie wzoru analogiczne jak w przypadku średniej. Jak widać do policzenia wariancji i tak niezbędna jest średnia. Na początek ogólnie:
i dla ilości klas z zadania :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna – od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję ).
Numer klasy |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do istoty zadania i wreszcie uzupełniamy wzór . Na początku przyjmiemy współczynnik ufności
(
), a następnie
(
).
Dla otrzymujemy:
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
Z kolei dla otrzymujemy:
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u, zatem skorzystamy z tablic rozkładu normalnego. Zapis oznacza konieczność odnalezienia statystyki dla
.
Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku sumujemy
i
czyli
.

Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego)
Analogicznie określimy względną precyzję szacunku , gdzie
.
Względna precyzja szacunku dla :
, tak więc
.
Względna precyzja szacunku dla :
, tak więc
.
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy dla :
Interpretacja brzmi następująco:
Z ufnością 0,95 nieznany średni wynik testu logicznego myślenia dla ogółu kandydatów mieści się się w przedziale od 24,51 punktów do 26,49 punktów.
Ostatecznie otrzymujemy dla :
Interpretacja brzmi następująco:
Z ufnością 0,99 nieznany średni wynik testu logicznego myślenia dla ogółu kandydatów mieści się się w przedziale od 24,2 punktów do 26,8 punktów.
Po zmianie współczynnika ufności z 0,95 do 0,99 względna precyzja oszacowania zmalała z poziomu 3,88% do 5,1%. Coś tu jednak się nie zgadza, prawda? Przecież po zwiększeniu współczynnika ufności otrzymaliśmy większą liczbę i na chłopski rozum względna precyzja uległa zwiększeniu? Z względną precyzją szacunku jest tak, że im większa wartość liczbowa otrzymana w wyniku tym gorsza precyzja oszacowania. Jeśli interpretuje się względną precyzję szacunku to wartość poniżej 5% mówi nam, że wnioskowanie o parametrze (w tym przypadku
) jest uprawnione i całkowicie bezpieczne, jeżeli
mieści się od 5% do 10% wnioskowanie jest możliwe, ale z zalecaną ostrożnością, a jeśli
przekracza 10% wnioskowanie jest niewiarygodne i należy je przerwać. Uzyskiwanie niezadowalającej (powyżej 5%, a tym bardziej powyżej 10%) względnej precyzji szacunku
może być spowodowane zbyt wysokim współczynnikiem ufności, zbyt małą liczebnością próby oraz wysokim zróżnicowaniem wyników w próbie (np. duży rozstrzał danych). Tak więc oszacowanie przy współczynniku ufności 0,95 jest bardziej precyzyjne.
[/FMP]
[FMP]




POPULACJA
wszyscy ogrodnicy pewnego regionu |
PRÓBA
180 wybranych ogrodników |
![]() |


















[/FMP]
[FMP]




POPULACJA
osoby cierpiące na pewną chorobę |
PRÓBA
300 wybranych osób |
![]() |


















[/FMP]
[FMP]




POPULACJA
mieszkańcy pewnego miasta |
PRÓBA
4000 wybranych mieszkańców |
![]() |


















[/FMP]
[FMP]





POPULACJA
urządzenia elektrotechniczne produkowane przez dany zakład |
PRÓBA
![]() |
![]() |































[/FMP]
[FMP]




POPULACJA
mieszkańcy pewnego amerykańskiego miasteczka |
PRÓBA
1000 wybranych mieszkańców |
![]() ![]() |






























[/FMP]
[FMP]





POPULACJA
studenci SGH |
PRÓBA
100 wybranych studentów |
![]() ![]() |





















































[/FMP]
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Oszacuj wariancję czasu montażu na poziomie ufności 95%.
Co prawda nie użyto bezpośrednio zwrotu przedział ufności, ale musimy oszacować wariancję czasu montażu, więc wypadałoby podać przedział ufności, bo tzw. estymacja punktowa (tzn. konkretna liczba, a nie przedział) daje wynik o prawdopodobieństwie praktycznie równym zero. Dodatkowo występuje tu wyrażenie: poziom ufności i w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
W pewnym warsztacie wybrano 25 pracowników w celu ustalenia średniego czasu poświęcanego na zmontowanie jednego przyrządu.
Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości osób spośród wszystkich pracowników warsztatu. Oznaczamy więc liczebność próby .
Średnia czasu montażu była równa 25 minut, a odchylenie standardowe 4 minuty.
W poprzednim zdaniu zaczął się opis próby, więc dla wymienionych parametrów zastosujemy oznaczenia z próby. Średnia czasu montażu wynosi 25 minut, a więc , a odchylenie standardowe 4 minuty, czyli
.
Oszacuj wariancję czasu montażu na poziomie ufności 95%.
Podano współczynnik ufności . Zamieniamy go na ułamek
i od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA pracownicy warsztatu
|
PRÓBA 25 wybranych pracowników
|
![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Oszacuj wariancję czasu montażu na poziomie ufności 95%.
Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.
Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest mniejsza od 30
, zatem wybieramy model I . W danych występuje
, także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole:
oraz
. Zapis
oznacza konieczność odnalezienia w tablicach statystyki dla
i 24 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla
i 24 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,95 nieznana wariancja czasu montażu dla ogółu pracowników warsztatu mieści się w przedziale od 10,16 do 32,26 minut 2 .
Powstała dziwna jednostka – minuty 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji – jak najbardziej.
[/FMP]


[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Oszacować metodą przedziałową wariancję czasu toczenia detali na poziomie ufności , jeśli na podstawie 16-elementowej próby otrzymano wariancję równą 5 [min 2 ].
Występują tu zwroty: oszacować metodą przedziałową i poziom ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Czas toczenia detalu ma rozkład .
Zapis oznacza założenie normalności rozkładu czasu toczenia detali i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Mamy częściową informację na temat tego rozkładu, zatem możemy zapisać:
– rozkład normalny o znanej średniej
min. i nieznanym odchyleniu standardowym
.
Oszacować metodą przedziałową wariancję czasu toczenia detali na poziomie ufności , jeśli na podstawie 16-elementowej próby otrzymano wariancję równą 5 [min 2 ].
Podano poziom ufności . Od razu wyznaczamy
. W tym zdaniu zaczyna się również opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości jednostek spośród wszystkich detali. Oznaczamy więc liczebność próby
. Znana jest także wariancja dla próby, czyli
(oczywiście zastosowaliśmy oznaczenia dla próby). Dysponując wartością wariancji można od razu wyznaczyć odchylenie standardowe jako pierwiastek z wariancji:
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA wszystkie detale
|
PRÓBA 16 wybranych detali
|
![]() ![]() ![]() |
![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Oszacować metodą przedziałową wariancję czasu toczenia detali na poziomie ufności , jeśli na podstawie 16-elementowej próby otrzymano wariancję równą 5 [min 2 ].
Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.
Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest mniejsza od 30
, zatem wybieramy model I . W danych występuje
, także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole:
oraz
. Zapis
oznacza konieczność odnalezienia w tablicach statystyki dla
i 15 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla
i 15 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,9 nieznana wariancja czasu toczenia detali mieści się w przedziale od 3,20 do 11,02 [min 2 ].
Powstała dziwna jednostka – min 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji – jak najbardziej.
[/FMP]
W celu zbadania zróżnicowania wagi konserw produkowanych przez pewnego producenta wylosowano 15 konserw, dla których średnia waga wynosiła 1 kg z odchyleniem standardowym 0,15 kg. Następnie oszacowano przedział ufności pokrywający nieznaną wartość wariancji w populacji otrzymując:(0,0115 ; 0,0724) . Jaki współczynnik ufności przyjęto przy estymacji?
a) 0,99 b) 0,98 c) 0,96 d) 0,95 e) żadna odpowiedź nie jest poprawna
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Następnie oszacowano przedział ufności pokrywający nieznaną wartość wariancji w populacji otrzymując: .
Występuje tu zwrot: oszacowano przedział ufności i został on już konkretnie określony – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej. Dodatkowo w ostatnim zdaniu użyto wyrażeniawspółczynnik ufności .
Podano końcówki przedziału ufności , a szukana jest wartość współczynnika ufności z reguły występująca w danych, z tego względu określimy to zadanie nieco kolokwialnie – „od tyłu”. Mimo to, będziemy postępować zgodnie z przyjętym schematem do zadań z estymacji i tylko na pewnym etapie obliczeń wprowadzimy modyfikacje.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
W celu zbadania zróżnicowania wagi konserw produkowanych przez pewnego producenta wylosowano 15 konserw, dla których średnia waga wynosiła 1 kg z odchyleniem standardowym 0,15 kg.
Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości jednostek spośród wszystkich konserw. Zapisujemy więc liczebność próby jako . Podano również podstawowe parametry dla próby tzn. średnią
i odchylenie standardowe
. Oczywiście użyto oznaczeń dla próby.
Następnie oszacowano przedział ufności pokrywający nieznaną wartość wariancji w populacji otrzymując: .
Znamy również końcówki przedziału ufności dla wariancji.
Jaki współczynnik ufności przyjęto przy estymacji?
Niewiadomą jest współczynnik ufności, a więc .
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA wszystkie konserwy
|
PRÓBA 15 wybranych konserw
|
![]() |
– współczynnik ufności,
– końcówki przedziału ufności
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który był oszacowany przedziałem ufności i wyłapujemy słowo:
Następnie oszacowano przedział ufności pokrywający nieznaną wartość wariancji w populacji otrzymując: .
Słowo wariancja oznacza, że przedział ufności został zbudowany oczywiście dla wariancji z populacji.
Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest mniejsza od 30
, zatem wybieramy model I . W danych występuje
, także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Na tym etapie na razie poprzestajemy, ponieważ nie jesteśmy w stanie uzupełnić współczynnika ufności , a tym samym nieznana jest
, więc nie mamy możliwości odczytania odpowiedniej statystyki z tablic rozkładu chi-kwadrat, bo w formule znajduje się literka
(grecka litera czyt. chi ). Znamy jednak końcówki przedziału ufności i w związku z tym możemy je pomocniczo nanieść do wzoru.
Nie znamy wartości ani
, więc możemy odnieść wrażenie, że mamy dwie nieznane wielkości. Jednak nie jest tak do końca, ponieważ obie z nich zależą od tej samej wartości
, wobec tego na dobrą sprawę mamy do czynienia z jedną niewiadomą. Którą końcówkę przedziału wybrać tzn. 0,0115 czy 0,0724? Jest to całkowicie obojętne, ponieważ w obu przypadkach
jest przecież tą samą wartością. Poza tym szukamy jednej niewiadomej, a do wyznaczenia jednej niewiadomej wystarczy jedno równanie. Wybierzemy zapis
, ponieważ wydaje się mniej skomplikowany, oczywiście można użyć
i ostateczny wynik nie ulegnie zmianie.
Sposób rozwiązania powstałego równania zależy wyłącznie od Was, jeśli oznaczenie wydaje się przerażające można je tymczasowo zastąpić chociażby
.
I już od razu lepiej to wygląda, prawda?
Wymnażamy przez aby pozbyć się kreski ułamkowej:
Dzielimy przez 0,0115 w celu otrzymania :
(wynik został zaokrąglony do trzech miejsc po przecinku)
Ostatecznie
Dopiero teraz wracamy do odczytywania z tablic, jest to tzw. „zadanie od tyłu”, więc i z tablic czytamy od tyłu, a więc szukamy wartości najbliższej , ale w środku tablicy rozkładu chi – kwadrat, przy czym zapis
wskazuje nam, że bierzemy pod uwagę tylko wiersz z 14 stopniami swobody.
Najbliższą wartością statystki 29,348 znalezioną w tablicy na poziomie 14 stopni swobody jest 29,141. Odpowiada ona dla prawdopodobieństwa równego 0,01. Specjalnie nie używam symbolu , ponieważ na tym etapie pojawia się najwięcej błędów. Dlaczego? W zapisie
dopiero po podzieleniu przez 2 jest odczytywana z tablic, czyli
. Zatem ostatecznie
– i to ta wartość ląduje we współczynniku ufności.
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy współczynnik ufności , a więc prawidłowa jest odpowiedź B.
Interpretacja brzmi następująco (nie jest tu potrzebna): Z ufnością 0,98 nieznana wariancja wagi ogółu konserw mieści się w przedziale od 0,0115 do 0,0724 kg 2 .
Powstała dziwna jednostka – (kg) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji – jak najbardziej.
[/FMP]
Spośród osób wpłacających w okienku kasowym pewnego urzędu pocztowego należności z tytułu usług telekomunikacyjnych wylosowano 10 osób i zanotowano wysokość wpłacanej kwoty. Uzyskano następujące wyniki (w zł): 200, 180, 160, 202, 158, 176, 187, 169, 195, 173. Przyjmując, że wysokość wpłacanej kwoty jest zmienną losową o rozkładzie normalnym oraz wykorzystując uzyskane dane, zbudować przedział ufności dla wariancji wpłat, przyjmując współczynnik ufności równy 0,95.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Przyjmując, że wysokość wpłacanej kwoty jest zmienną losową o rozkładzie normalnym oraz wykorzystując uzyskane dane, zbudować przedział ufności dla wariancji wpłat, przyjmując współczynnik ufności równy 0,95.
Występują tu charakterystyczne dla tej grupy zadań zwroty: zbudować przedział ufności i współczynnik ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Spośród osób wpłacających w okienku kasowym pewnego urzędu pocztowego należności z tytułu usług telekomunikacyjnych wylosowano 10 osób i zanotowano wysokość wpłacanej kwoty.
Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to osób i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
Uzyskano następujące wyniki (w zł): 200, 180, 160, 202, 158, 176, 187, 169, 195, 173.
Podano również informacje o konkretnych wynikach z próby. Jeżeli dysponujemy wartościami wypisanymi po przecinku tzw. danymi indywidualnymi, to zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
Przyjmując, że wysokość wpłacanej kwoty jest zmienną losową o rozkładzie normalnym oraz wykorzystując uzyskane dane, zbudować przedział ufności dla wariancji wpłat, przyjmując współczynnik ufności równy 0,95.
W tym zdaniu występuje założenie normalności rozkładu wysokości wpłacanych kwot i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko przepisać – rozkład normalny o nieznanej średniej
i nieznanym odchyleniu standardowym
. Podano też współczynnik ufności
. Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA
osoby dokonujące opłat na poczcie z tytułu usług telekomunikacyjnych |
PRÓBA
10 wybranych osób |
![]() ![]() ![]() |
![]() ![]() ![]() ![]() ![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Przyjmując, że wysokość wpłacanej kwot jest zmienną losową o rozkładzie normalnym oraz wykorzystując uzyskane dane, zbudować przedział ufności dla wariancji wpłat, przyjmując współczynnik ufności równy 0,95.
Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.
Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest mniejsza od 30
, zatem wybieramy model I . W danych nie ma
ani
, więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej.
Dysponujemy danymi indywidualnymi (wynikami wypisanymi po przecinku), jest ich niewiele i nie powtarzają się, zatem wariację liczymy ze wzoru związanego z danymi indywidualnymi: lub
(obie wersje są równoważne, w praktyce pierwsza wersja jest częściej używana). Teraz okazuje się, że w formule pozwalającej wyznaczyć wariancję potrzebna jest wartość średnia
, więc to od niej należy zacząć obliczenia.
Wzór na średnią z danych indywidualnych wygląda następująco:
. Oczywiście na chłopski rozum średnią można policzyć sumując wszystkie dane, a potem dzieląc przez ilość – jest to jak najbardziej prawidłowe rozwiązanie, a podany wzór oznacza to samo. Jednak zdaję sobie sprawę, że widząc „hieroglify” tego typu wiele osób nie wie co robić, a tym bardziej jak je rozpisywać :). Mając to na uwadze postaram się przybliżyć kwestię podobnych oznaczeń rozpisując je na czynniki pierwsze.
Znak to symbol sumy. Pod nim znajduje się zapis
, a nad nim
,
to wartości kolejnych obserwacji. Wszytko razem oznacza, że będziemy dodawać kolejne obserwacje oznaczone symbolem
, gdzie
będzie rosło od
aż do wartości
, a więc
:
Tak więc średnia po rozpisaniu wygląda następująco:
Teraz przełożymy wszystko na dane z zadania. Liczebność próby wynosi , a więc wzór na średnią możemy zapisać następująco:
Czym jest ? Są to konkretne wyniki z próby, a więc
. Jeśli ktoś chciałby uporządkować dane indywidualne od najmniejszej do największej, może to spokojnie wykonać. Porządkowanie liczb nie wpływa na wartość średniej, także może zostać tak jak jest. A więc np.
.
Obliczamy średnią:
Dysponując wartością liczbową średniej możemy obliczyć wariancję . Rozpisanie wzoru wykonujemy analogicznie jak w przypadku średniej. Na początek ogólnie:
i dla :
Możemy już podstawiać liczby za , ale proponuję utworzyć tabelkę i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższym tasiemcem niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na wariancję z danych indywidualnych, a jej nagłówki zawsze wyglądają tak samo. Na początku od każdej wartości
odejmujemy średnią, a następnie wynik podnosimy do kwadratu. Sumujemy ostatnią kolumnę (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję )
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
A więc
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole:
oraz
. Zapis
oznacza konieczność odnalezienia w tablicach statystyki dla
i 9 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla
i 9 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,95 nieznana wariancja wpłat w populacji mieści się w przedziale od 117,12 do 825,19 (zł) 2 .
Powstała dziwna jednostka – (zł) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji – jak najbardziej.
[/FMP]
Dokonano badań drogowych 30 samochodów FSO 1500 pod względem osiąganej prędkości maksymalnej. Wyniki były następujące:
Prędkość maksymalna (km/godz.)
|
130 – 140
|
140 – 150
|
150 – 160
|
160 – 170
|
Liczba samochodów
|
3
|
8
|
14
|
5
|
Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny).
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny).
Występują tu charakterystyczne dla tej grupy zadań zwroty: oszacować metodą przedziałową i poziom ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Dokonano badań drogowych 30 samochodów FSO 1500 pod względem osiąganej prędkości maksymalnej.
Od razu uzyskujemy informację, że wylosowaliśmy próbę, ponieważ badamy określoną ilość samochodów. Liczebność próby to i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji.
Wyniki były następujące:
Prędkość maksymalna (km/godz.)
|
130 – 140
|
140 – 150
|
150 – 160
|
160 – 170
|
Liczba samochodów
|
3
|
8
|
14
|
5
|
Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią , wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny).
Podano też współczynnik ufności . Od razu wyznaczamy
. W tym zdaniu występuje również założenie normalności rozkładu prędkości maksymalnej i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać
– rozkład normalny o nieznanej średniej
i nieznanym odchyleniu standardowym
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA samochody FSO 1500
|
PRÓBA 30 wybranych samochodów
|
![]() ![]() ![]() |
![]() ![]() ![]() ![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Oszacować metodą przedziałową wariancję prędkości maksymalnej na poziomie ufności 0,9 (zakładamy, że rozkład prędkości maksymalnej jest normalny).
Słowo wariancja oznacza, że będziemy budować przedział ufności oczywiście dla wariancji z populacji.
Spójrzmy w kartę wzorów. Dla wariancji mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
może nie jest mniejsza od 30, ale dokładnie równa 30
, zatem wybieramy model I . W danych nie ma
ani
, więc nie ma znaczenia, którą wersję wzoru wybierzemy. Z reguły interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Jak widać brakuje tylko , więc dopóki nie znajdziemy wartości tego parametru nie możemy obliczyć końcówek przedziału ufności dla wariancji. Wyliczanie wariacji z próby jest zagadnieniem ze statystki opisowej.
Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (prędkość maksymalna) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację
,
(kończymy przedział na 140, następny również zaczynamy od 140), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.
Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: . Jest też alternatywa
, ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia.
W szeregu przedziałowym średnią liczymy ze wzoru
. Na początku wyjaśnijmy symbol
. Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów , a
liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, czyli
, a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
=
Czym jest ,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Uzupełniając wzór średniej dla otrzymujemy:
=
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:
i dla :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna – od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję).
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Wracamy do istoty zadania i wreszcie uzupełniamy wzór :
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole:
oraz
. Zapis
oznacza konieczność odnalezienia w tablicach statystyki dla
i 29 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla
i 29 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,9 nieznana wariancja prędkości maksymalnej samochodów FSO 1500 mieści się w przedziale od 52,40 do 125,93 (km/godz.) 2 .
Powstała dziwna jednostka – (km/godz.) 2 , ale w przypadku wariancji (jednostka podniesiona do kwadratu) nie jest to nic nadzwyczajnego i nie należy na to zwracać większej uwagi. Przyjęło się zresztą, że samej wariancji się nie interpretuje, ale już odchylenie standardowe, które jest pierwiastkiem z wariacji – jak najbardziej.
[/FMP]
Na podstawie próby losowej obejmującej 26 paragonów kasowych pewnego stoiska kosmetycznego otrzymano średnią kwotę zakupu wynoszącą 48,80 zł i odchylenie standardowe 15 zł. Przyjmując współczynnik ufności równy 0,90, zbudować przedział ufności dla odchylenia standardowego w zbiorowości paragonów kasowych stoiska kosmetycznego.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Przyjmując współczynnik ufności równy 0,90, zbudować przedział ufności dla odchylenia standardowego w zbiorowości paragonów kasowych stoiska kosmetycznego.
Występują tu zwroty: zbudować przedział ufności i współczynnik ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Na podstawie próby losowej obejmującej 26 paragonów kasowych pewnego stoiska kosmetycznego otrzymano średnią kwotę zakupu wynoszącą 48,80 zł i odchylenie standardowe 15 zł .
Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości jednostek spośród wszystkich paragonów kasowych. Oznaczamy więc liczebność próby . Dodatkowo podano podstawowe parametry dla próby: średnia kwota zakupu wynosi 48,80 zł, a więc
, a odchylenie standardowe 15 zł, czyli
.
Przyjmując współczynnik ufności równy 0,90, zbudować przedział ufności dla odchylenia standardowego w zbiorowości paragonów kasowych stoiska kosmetycznego.
Podano współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA paragony kasowe stoiska kosmetycznego
|
PRÓBA 26 wybranych paragonów
|
![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Przyjmując współczynnik ufności równy 0,90, zbudować przedział ufności dla odchylenia standardowego w zbiorowości paragonów kasowych stoiska kosmetycznego.
Zwrot odchylenie standardowe oznacza, że będziemy budować przedział ufności oczywiście dla odchylenia standardowego z populacji.
Spójrzmy w kartę wzorów. Dla odchylenia standardowego mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest mniejsza od 30
, zatem wybieramy model I . W danych występuje
, także interesuje nas pierwsza wersja wzoru z wybranego modelu.
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka (grecka litera czyt. chi ), zatem skorzystamy z tablic rozkładu chi-kwadrat (link). W tym przypadku będziemy odczytywać statystykę dwukrotnie, ponieważ w uzupełnionym wzorze występują dwa nieco różniące się symbole:
oraz
. Zapis
oznacza konieczność odnalezienia w tablicach statystyki dla
i 25 stopni swobody:
Z kolei zapis oznacza konieczność odnalezienia w tablicach statystyki dla
i 25 stopni swobody:
Wracamy do obliczeń i podstawiamy oraz
:
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,90 nieznane odchylenie standardowe w zbiorowości paragonów kasowych stoiska kosmetycznego mieści się w przedziale od 12,46 do 20,01 zł.
[/FMP]
W celu oszacowania dyspersji jednostkowego kosztu produkcji (w zł) pewnego artykułu wytwarzanego przez różne zakłady, wylosowano do próby w niezależny sposób 196 zakładów otrzymując m.in. zł,
zł. Wyznaczyć – przy współczynniku ufności 0,99 – przedział ufności dla odchylenia standardowego kosztów jednostkowych.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Wyznaczyć – przy współczynniku ufności 0,99 – przedział ufności dla odchylenia standardowego kosztów jednostkowych.
Występują tu zwroty: wyznaczyć przedział ufności i współczynnik ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
W celu oszacowania dyspersji jednostkowego kosztu produkcji (w zł) pewnego artykułu wytwarzanego przez różne zakłady, wylosowano do próby w niezależny sposób 196 zakładów otrzymując m.in. zł,
zł.
Od razu zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości jednostek produkcyjnych spośród wszystkich zakładów. Oznaczamy więc liczebność próby . Dodatkowo podano podstawowe parametry dla próby na podstawie przeprowadzonych pomiarów: średnią
oraz odchylenie standardowe
i nie ma tu wątpliwości co do oznaczeń.
Wyznaczyć – przy współczynniku ufności 0,99 – przedział ufności dla odchylenia standardowego kosztów jednostkowych.
Podano współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA zakłady produkcyjne
|
PRÓBA 196 wybranych zakładów
|
![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Wyznaczyć – przy współczynniku ufności 0,99 – przedział ufności dla odchylenia standardowego kosztów jednostkowych.
Wyrażenie odchylenie standardowe oznacza, że będziemy budować przedział ufności oczywiście dla odchylenia standardowego z populacji. Poza tym w pierwszym zdaniu W celu oszacowania dyspersji … , znajduje się słowo dyspersja będące synonimem zróżnicowania, co w zadaniach na estymację przekłada się na szacowanie wariancji lub odchylenia standardowego.
Spójrzmy w kartę wzorów. Dla odchylenia standardowego mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest większa od 30
, zatem wybieramy model II .
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u , zatem skorzystamy z tablic rozkładu normalnego (link). Zapis oznacza konieczność odnalezienia statystyki dla
. Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku
sumujemy
i
czyli
.
Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,99 nieznane odchylenie standardowe jednostkowego kosztu produkcji pewnego artykułu wytwarzanego przez różne zakłady mieści się w przedziale od 6,46 do 8,39 zł.
[/FMP]
W pewnym zakładzie zatrudniającym 5000 pracowników, 40% z nich jest zadłużonych w Spółdzielczej Kasie Oszczędnościowo-Kredytowej (SKOK). Spośród pracowników zadłużonych pobrano w sposób losowy niezależną próbę 7,5% osób, dla których odchylenie standardowe spłacanych rat miesięcznych wyniosło 80 zł. Zakładając, że rozkład wysokości spłacanych rat jest normalny, oszacować – z prawdopodobieństwem 0,95 – przedział ufności Neymana pokrywający odchylenie standardowe u wszystkich zadłużonych pracowników.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Zakładając, że rozkład wysokości spłacanych rat jest normalny, oszacować – z prawdopodobieństwem 0,95 – przedział ufności Neymana pokrywający odchylenie standardowe u wszystkich zadłużonych pracowników.
Występują tu zwroty: oszacować przedział ufności Neymana i prawdopodobieństwo czyli współczynnik ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
W pewnym zakładzie zatrudniającym 5000 pracowników, 40% z nich jest zadłużonych w Spółdzielczej Kasie Oszczędnościowo-Kredytowej (SKOK).
Na początku dowiadujemy się, że populacja liczy pracowników. 40% z nich jest zadłużonych w SKOKach, a więc ilościowo
. Jeszcze nic nie wspomniano na temat próby.
Spośród pracowników zadłużonych pobrano w sposób losowy niezależną próbę 7,5% osób, dla których odchylenie standardowe spłacanych rat miesięcznych wyniosło 80 zł.
Dopiero teraz zaczyna się opis próby, ponieważ pojawia się informacja na temat wylosowania konkretnej ilości osób spośród zadłużonych pracowników. Stanowią oni 7,5% osób dłużników SKOKów. Obliczamy więc liczebność próby . Jeszcze raz dla rozjaśnienia sytuacja przedstawia się następująco:
Dodatkowo podano jeden z podstawowych parametrów dla próby tzn. odchylenie standardowe (oczywiście używamy oznaczenia dla próby).
Zakładając, że rozkład wysokości spłacanych rat jest normalny, oszacować – z prawdopodobieństwem 0,95 – przedział ufności Neymana pokrywający odchylenie standardowe u wszystkich zadłużonych pracowników.
W tym zdaniu występuje założenie normalności rozkładu wysokości spłacanych rat i to już odnosi się do populacji (wcześniej wspominałam w części teoretycznej, że próba jest z reguły za mała aby stwierdzić rozkład normalny). Nie mamy informacji na temat tego rozkładu, zatem możemy tylko zapisać – rozkład normalny o nieznanej średniej
i nieznanym odchyleniu standardowym
. Podano również współczynnik ufności
. Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA 5000 pracowników zakładu
|
PRÓBA 150 wybranych pracowników
|
![]() ![]() ![]() ![]() |
![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Zakładając, że rozkład wysokości spłacanych rat jest normalny, oszacować – z prawdopodobieństwem 0,95 – przedział ufności Neymana pokrywający odchylenie standardowe u wszystkich zadłużonych pracowników.
Wyrażenie odchylenie standardowe oznacza, że będziemy budować przedział ufności oczywiście dla odchylenia standardowego z populacji.
Spójrzmy w kartę wzorów. Dla odchylenia standardowego mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest większa od 30
, zatem wybieramy model II .
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u , zatem skorzystamy z tablic rozkładu normalnego (link). Zapis oznacza konieczność odnalezienia statystyki dla
. Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku
sumujemy
i
czyli
.
Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,95 nieznane odchylenie standardowe wszystkich zadłużonych pracowników mieści się w przedziale od 71,88 do 90,19 zł.
[/FMP]
Spośród rencistów województwa podkarpackiego wylosowano 60 osób i zapytano o wysokość rocznego dochodu z tytułu pobieranej renty, a wyniki przedstawiono następująco:
Dochód (w tys. zł)
|
0 – 4
|
4 – 8
|
8 – 12
|
12 – 16
|
16 – 20
|
20 – 24
|
Liczba rencistów
|
2
|
15
|
23
|
10
|
6
|
4
|
Źródło: dane umowne
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
[FMP]
1. JAK ROZPOZNAĆ ZADANIE DOTYCZĄCE ESTYMACJI PRZEDZIAŁOWEJ ?
Po przeczytaniu całego zadania zwracamy uwagę na zdanie:
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
Występują tu zwroty: zbudować przedział ufności i współczynnik ufności – w związku z tym na pewno jest to zadanie dotyczące estymacji przedziałowej.
2. ANALIZA I PRAWIDŁOWE WYPISANIE DANYCH.
Analizujemy zdanie po zdaniu.
Spośród rencistów województwa podkarpackiego wylosowano 60 osób i zapytano o wysokość rocznego dochodu z tytułu pobieranej renty, a wyniki przedstawiono następująco:
Dochód (w tys. zł)
|
0 – 4
|
4 – 8
|
8 – 12
|
12 – 16
|
16 – 20
|
20 – 24
|
Liczba rencistów
|
2
|
15
|
23
|
10
|
6
|
4
|
Źródło: dane umowne
Od razu uzyskujemy informację, że wylosowaliśmy próbę, a jej liczebność to osób i od tego momentu będziemy stosować oznaczenia parametrów dla próby, chyba że zostanie wyraźnie określone, że będą to parametry dla populacji. Podano również wyniki z próby w tabeli. Jeżeli dysponujemy danymi dotyczącymi próby ujętymi w tabeli, to zawsze możemy policzyć średnią
, wariancję
i odchylenie standardowe
(lub
,
). Nie liczmy jednak tych parametrów od razu, ponieważ dopiero etap wyboru formuły na estymację wskaże nam czego potrzebujemy. Po prostu chodzi o to, żeby nie liczyć na zapas np. odchylenia, bo może okazać się niepotrzebne w późniejszych obliczeniach.
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowego dochodu dla populacji rencistów.
Podano też współczynnik ufności . Od razu wyznaczamy
.
Podsumowując tworzymy przejrzystą tabelę z danymi:
POPULACJA renciści województwa podkarpackiego
|
PRÓBA 60 wybranych rencistów
|
![]() ![]() ![]() ![]() |
– współczynnik ufności,
3. WYBÓR ODPOWIEDNIEGO WZORU.
Szukamy parametru, który należy oszacować przedziałem ufności i w ostatnim zdaniu wyłapujemy słowo:
Przyjmując współczynnik ufności równy 0,95, zbudować przedział ufności dla odchylenia standardowegodochodu dla populacji rencistów.
Wyrażenie odchylenie standardowe oznacza, że będziemy budować przedział ufności oczywiście dla odchylenia standardowego z populacji.
Spójrzmy w kartę wzorów. Dla odchylenia standardowego mamy do wyboru dwa modele. Teraz wracamy do danych i sprawdzamy, czy jest znana i jaka jest liczebność próby.
nie jest znana , a liczebność próby
jest większa od 30
, zatem wybieramy model II .
4. UZUPEŁNIANIE WYBRANEGO WZORU I OBLICZENIA.
Wracamy do danych z tabeli i uzupełniamy wzór konkretnymi danymi.
Jak widać do obliczenia końcówek przedziału ufności potrzebujemy odchylenia standardowego z próby. W związku z tym, zanim zajmiemy się uzupełnianiem właściwego wzoru, należy obliczyć (na razie) nieznany parametr. Liczenie odchylenia standardowego jest zagadnieniem ze statystyki opisowej. Dysponujemy danymi tabelarycznymi, gdzie warianty cechy (dochód) są w formie przedziałów tzn. od jednej wartości do drugiej wartości. Taki szereg określa się szeregiem rozdzielczym przedziałowym. Przeredagujmy zatem tabelę z zadania właśnie na tą postać szeregu.
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
W przypadku szeregu rozdzielczego przedziałowego nie ma możliwości pomyłki do tego, co jest wariantem cechy, a co liczebnością , ponieważ nie zdarza się, aby
było zapisane w formie przedziałów. Symbol
to po prostu ogólny zapis przedziału lewostronnie domkniętego i prawostronnie otwartego (chyba najczęściej używany – chociaż zależy od preferencji prowadzącego). Należy pilnować, aby końcówka każdego przedziału była początkiem następnego. W tabeli z zadania mamy właśnie przedstawioną sytuację
,
(kończymy przedział na 4, następny również zaczynamy od 4), itd. w związku z tym nie musimy nic zmieniać, zachowana jest ciągłość.
Aby otrzymać odchylenie standardowe i tak musimy obliczyć wariancję, bo odchylenie jest pierwiastkiem kwadratowym z wariacji. Wzór na wariancję z danych szeregu przedziałowego wygląda następująco: . Jest też alternatywa
, ale będziemy używać pierwszej wersji. Okazuje się, że do policzenia wariancji i tak niezbędna jest średnia.
W szeregu przedziałowym średnią liczymy ze wzoru
. Na początku wyjaśnijmy symbol
. Oznacza on środek każdego z podanych przedziałów, a obliczany jest na podstawie formuły
. Upraszczając, należy zsumować początek i koniec każdego przedziału i wynik podzielić na dwa. Wracamy do wzoru na średnią. Znak
oznacza sumę. Pod tym symbolem znajduje się zapis
, a nad nim
,
to środki kolejnych przedziałów , a
liczebności dla kolejnych przedziałów. Wszystko razem oznacza, że będziemy sumować kolejne iloczyny
, gdzie
będzie rosło od
aż do wartości
, czyli
, a więc ogólnie:
W naszym przypadku znad znaku sumy oznacza liczbę przedziałów klasowych (ilość wierszy w tabeli z danymi). Tak więc średnia będzie miała uproszczony wzór:
=
Czym jest ,
oraz
? Wszystko to zostanie pokazane dokładnie w tabeli. Obliczmy w niej również środki poszczególnych przedziałów.
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Uzupełniając wzór średniej dla otrzymujemy:
=
i oczywiście możemy uzupełnić go danymi z tabeli, ale proponuję nadal korzystać z tabeli i wykonywać w niej obliczenia. Po pierwsze jest bardziej klarowna, po drugie ułamek powstały po rozpisaniu wzoru może okazać się dłuższy niż w tym konkretnym zadaniu i łatwo tu o pomyłkę. W tabelce powoli budujemy wzór na średnią z szeregu przedziałowego, a jej nagłówki zawsze wyglądają tak samo. Każdą wartość
mnożymy przez odpowiadającą jej wartość
, a następnie sumujemy powstałe iloczyny. Przecięcie wiersza z symbolem
i kolumny
daje kompletny licznik wzoru na średnią.
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Dysponujemy wartością średniej, zatem możemy wrócić do obliczania wariancji. Rozpiszemy wzór analogicznie jak w przypadku średniej. Najpierw ogólnie:
i dla :
Tu też można podstawiać dane z tabeli, ale ponownie proponuję trzymać się obliczeń tabelarycznych. Można kontynuować poprzednią tabelę dopisując kolejne kolumny. Znowu krok po kroku będziemy tworzyć licznik ze wzoru. Dopisana pierwsza kolumna – od każdego środka przedziału odejmujemy wcześniej wyliczoną średnią
, druga kolumna to podniesienie wyników z poprzedniej do kwadratu. Ostatnia to wymnożenie wyników z drugiej przez odpowiadające im wartości
i dopiero ona jest sumowana (przecięcie wiersza z symbolem
i
daje kompletny licznik wzoru na wariancję).
Numer klasy
|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
Odchylenie standardowe to pierwiastek z wariancji
.
Wracamy do danych z tabeli i wreszcie uzupełniamy wzór konkretnymi danymi.
Teraz należy odczytać odpowiednią statystykę z tablic. W formule znajduje się literka u , zatem skorzystamy z tablic rozkładu normalnego (link). Zapis oznacza konieczność odnalezienia statystyki dla
. Czytanie z tablic rozkładu normalnego nie jest trudne. Sumuje się wartości znajdujące się na obrzeżach tzn. z kolumny, która stanowi części dziesiętne i z wiersza, który traktujemy jako części setne. W przypadku
sumujemy
i
czyli
.
Wracamy do obliczeń i podstawiamy (zaokrąglanie to indywidualna sprawa wynikająca najczęściej z preferencji prowadzącego):
5. WYNIK I INTERPRETACJA.
Ostatecznie otrzymujemy:
Interpretacja brzmi następująco: Z ufnością 0,95 nieznane odchylenie standardowe dochodu dla populacji rencistów województwa podkarpackiego mieści się w przedziale od 4,14 do 5,94 tys. zł.
[/FMP]
Podstawowym działem wnioskowania statystycznego jest teoria estymacji, która stanowi zbiór metod pozwalających na wnioskowanie o postaci rozkładu populacji generalnej (tzn. o wartości parametrów rozkładu lub jego postaci funkcyjnej) na podstawie obserwacji uzyskanych w próbie losowej. Inaczej mówiąc, estymacja polega na szacowaniu wartości parametrów, ewentualnie postaci rozkładu zmiennej losowej w populacji generalnej, na podstawie rozkładu empirycznego określonego dla próby.
Jeśli szacuje się tylko wartość parametrów rozkładu populacji generalnej, mówimy o estymacji parametrycznej. Jeśli natomiast postępowanie dotyczy również szacowania postaci funkcyjnej rozkładu populacji generalnej, mówimy o estymacji nieparametrycznej. W odniesieniu do estymacji parametrycznej można mówić o estymacji punktowej oraz estymacji przedziałowej, w zależności od sposobu, w jaki dokonuje się szacunku wartości parametrów.
W estymacji punktowej za ocenę wartości parametru przyjmuje się jedną konkretną wartość otrzymaną na podstawie wyników próby, oczywiście przy zachowaniu odpowiednich reguł wyznaczania tej wartości. Natomiast w estymacji przedziałowej wyznacza się odpowiednio pewien liczbowy przedział, w którym z określonym prawdopodobieństwem zawiera się wartość szacowanego parametru.
Podstawowe własności estymatorów
Podstawowym narzędziem estymacji punktowej jest estymator.
Estymatorem Tn parametru Θ rozkładu populacji generalnej nazywamy statystykę z próby Tn = t(X1, X2 …, Xn), która służy do oszacowania wartości tego parametru.
Jak wynika z definicji estymatora jako statystyki z próby, jest on zmienną losową, a zatem ma określony rozkład z odpowiednimi parametrami. Rozkład estymatora T w oczywisty sposób jest determinowany przez rozkład zmiennej losowej X w populacji generalnej, a przy tym jest zależny od parametru Θ. Wynika to z założenia, że każda z niezależnych zmiennych Xi, stanowiących próbę (których funkcją jest T), ma taki rozkład, jak zmienna X w populacji generalnej, a zatem rozkład każdej zmiennej X, jest charakteryzowany przez dystrybuantę F(x, Θ).
Ze względu na to, iż szacunku parametru dokonuje się na podstawie próby losowej, istnieje możliwość popełnienia błędu. Różnica między estymatorem a wartością parametru: Tn-Θ=d nazywana jest błędem estymacji parametru Θ. Błąd estymacji jest zmienną losową.
Formułując definicję estymatora, stwierdziliśmy, że jest to dowolna statystyka służąca do szacowania parametru. Ta “dowolność” postaci estymatora jest oczywiście ograniczona. Postać estymatora musi być logicznie uzasadniona, tzn. musimy mieć pewność, że stosując określony estymator pewnego parametru, będziemy za pomocą tego estymatora otrzymywali z próby wyniki bliskie wartości parametru. Jest oczywiste, że np. do estymacji wartości oczekiwanej w populacji generalnej nie można użyć wariancji z próby i że lepszym estymatorem wartości oczekiwanej jest średnia arytmetyczna z próby, ale takie intuicyjne określanie postaci estymatora może być zawodne – szczególnie gdy można znaleźć różne estymatory tego samego parametru. Powstaje zatem problem określenia własności “dobrego” estymatora, tzn. takiego, który zapewnia otrzymywanie wyników z próby zbliżonych do rzeczywistej wartości parametru.