Rozkład normalny i centralne twierdzenie graniczne – zadania

Aby zobaczyć rozwiązania zadań 2-15 należy wykupić abonament

Pewien zakład produkcyjny zatrudnia 100 pracowników, których staż pracy jest zgodny z rozkładem normalnym N(10 lat, 5 lat). Obliczyć ilu pracowników miało staż:
a) krótszy niż 3 lata
b) dłuższy niż 15 lat

Zajmijmy się najpierw przypadkiem pojedynczego pracownika o stażu pracy 

    \[X \sim N(10, 5)\]

a)

    \[P(X < 3) = P( \frac{X - 10}{5} < \frac{3 - 10}{5} ) = P(Z < -1.4) = \Phi(-1.4) =\]

    \[1 - \Phi(1.4) \approx 1 - 0.91924 = 0.08076\]

b)

    \[P(X > 15) = P(\frac{X - 10}{5} > \frac{15-10}{5}) = P(Z > 1) =\]

    \[1- \Phi(1) \approx 1 -0.84134 = 0.15866\]

Póki co wyliczyliśmy prawdopodobieństwo, że wybrany pracownik będzie pracował mniej niż 3 lata (przykład a) lub więcej niż 15 lat (przykład b).
Aby wyliczyć ilość osób musimy skorzystać ze wzoru:

    \[n_{i} = n \cdot p_{i}\]

n – ilość pracowników spełniających kryterium
n – ilość pracowników
pi – prawdopodobieństwo, że dany pracownik spełnia kryterium

Czyli teraz już łatwo możemy obliczyć ile pracowników spełnia kryterium (a) a ile kryterium (b):

Liczba pracowników pracujących mniej jak 3 lata:

    \[0.08076 \cdot 100 = 8.076 \approx 8\]

Liczba pracowników pracujących więcej jak 15 lat:

    \[0.15866 \cdot 100 = 15.866 \approx 16\]

Zmienna losowa X ma rozkład N(0;0,5). Zmienna losowa Y jest z rozkładu Yexp(X). Oblicz P(1<Y<e):

Ponieważ X nie jest z rozkładu N(0,1) będziemy musieli przeprowadzić standaryzacje jednak najpierw musimy przekształcić Y tak aby wskazywał na rozkład normalny:

Skoro Yexp(X) to lnYX, czyli przed wykonaniem standaryzacji musimy obustronnie zlogarytmować logarytmem naturalnym.

    \[P(1 < Y < e) = P( \ln{1} < \ln{Y} < \ln{e} ) = P( 0 < X < 1 ) =\]

    \[P( \frac{0-0}{0.5} < \frac{X-0}{0.5}<\frac{1-0}{0.5} ) = P( 0 < Z < 2 ) =\]

    \[\Phi(2) - \Phi(0) \approx 0.977 - 0.5 = 0.477\]

Długość produkowanych detali ma rozkład N(0.9,0.03). Norma przewiduje wyroby o wymiarach 0.9±0.05. Oblicz jaki procent wyrobów nie spełnia wymogów.

Łatwiej będzie policzyć jaki procent wyrobów spełnia normę. Wtedy też będziemy wiedzieć jaki procent wyrobów nie spełnia normy.

Procent wyrobów spełniających normę wyraża się wzorem:

    \[P( 0.9 - 0.05 < X < 0.9 + 0.05 ) = P(0.85 < X < 0.95) =\]

    \[P(\frac{0.85-0.9}{0.03} < \frac{X-0.9}{0.03} < \frac{0.95-0.9}{0.03}) \approx P( -1.67 < Z < 1.67 ) =\]

    \[\Phi(1.67) - \Phi(-1.67) = \Phi(1.67) - (1 - \Phi(1.67)) \approx\]

    \[2\Phi(1.67) - 1 \approx 2 \cdot 0.953 - 1 = 1.906 - 1 = 0.906\]

Wiadomo, że odchylenie wagi noworodków wynosi 500g. Jak rozmiar próby jest potrzebny aby odchylenie standardowe średniej wagi noworodków było mniejsze niż 100g.

Skorzystamy z faktu, że jeśli: 

    \[\large X \sim N(\mu, \sigma)\]

to: 

    \[\large \overline{X} \sim N(\mu, \frac{\sigma}{\sqrt{n}})\]

    \[\sigma = 500\]

    \[\sigma < \sqrt{n} \cdot 100\]

    \[500 < \sqrt{n} \cdot 100\]

    \[5 < \sqrt{n}\]

    \[25 < n\]

Czyli dla n większego od 25 odchylenie standardowe średniej wagi noworodków jest mniejsze niż 100g.

Zmienna losowa X ma rozkładu normalny N(10,2). Wyznacz prawdopodobieństwa:

  1. P(X<13)
  2. P(X>9)
  3. P(6<X<14)
  4. P(2<X<4)

Ponieważ rozkład normalny nie jest standardowy to w każdym przykładzie będziemy musieli przeprowadzić standaryzację, czyli:

    \[Z = \frac{X-10}{2} \sim N(0,1)\]

1.

    \[P(X < 13) = P( \frac{X-10}{2} < \frac{13-10}{2}) = P(Z < 1.5) = \Phi(1.5) \approx 0.933\]

2.

    \[P(X > 9) = P( \frac{X-10}{2} > \frac{9-10}{2} = P(Z > -0.5) =\Phi(0.5) \approx 0.691\]

3.

    \[P(6< X < 14) = P(\frac{6-10}{2} < \frac{X-10}{2} < \frac{14-10}{2}) =P( -2 < Z < 2) =\]

    \[\Phi(2) - \Phi(-2) =\Phi(2) - (1 - \Phi(2)) = 2\Phi(2) - 1 \approx 2 \cdot 0.977 -1 = 0.954\]

4.

    \[P(2< X < 4) = P(\frac{2-10}{2} < \frac{X-10}{2} < \frac{4-10}{2}) = P(-4 < Z< -3) =\]

    \[\Phi(-3) - \Phi(-4) = (1-\Phi(3)) - (1 - \Phi(4)) = \Phi(4) - \Phi(3) \approx 1 - 0.999 = 0.001\]

Dokonano pomiaru wagi wśród wylosowanych 150 dzieci. Otrzymane wyniki charakteryzują się rozkładem normalnym o średniej równej 65 kg i wariancją równą 100 kg . W powyższym przykładzie dominanta ma wartość…

W rozkładzie normalnym dominanta, średnia i mediana są sobie równe, czyli w tym przypadku wynoszą po 65kg. Łatwo to widać na wykresie rozkładu normalnego, ponieważ dla x= średniej mamy szczyt górki, czyli jest największa szansa na to, że wypadnie ta wartość, czyli jest ona wartością najczęstszą.

W teście, którego wyniki charakteryzują się średnią równą 20 i odchyleniem standardowym równym 7 pewien słuchacz zdobył 25 punktów. Jaki procent studentów uzyskało gorszy wynik od owego delikwenta ? (rozkład wyników był rozkładem normalnym).

    \[X \sim N(20,7)\]

Procent studentów, którzy otrzymali gorszy wynik, tzn. mniej niż 25 punktów:

    \[P( X < 25 ) = P( \frac{X - 20}{7} < \frac{25-20}{7}) \approx P(Z < 0.71) = \Phi(0.71) \approx 0.76\]

Odp: Około 76% uczniów otrzymało gorszy wynik od owego delikwenta.

Poziom kwasu moczowego w osoczu podlega rozkładowi normalnemu. W przedziale od 3,0mg/100ml do 6,7mg/100ml, symetrycznym względem najczęściej występującej wartości zawiera się 95% wartości poziomów kwasu moczowego w osoczu. Obliczyć prawdopodobieństwo tego, ze poziom kwasu moczowego w osoczu jest większy niż 5mg/100ml.

Przedział [3.0 , 6.7] jest symetryczny względem wartości najczęściej występującej, czyli dominanty. W rozkładzie normalnym dominanta jest zarazem średnią(wartością oczekiwaną) tego rozkładu. Wyliczając środek podanego przedziału wyliczymy wartość oczekiwaną naszego rozkładu normalnego N(m,σ):

    \[m = \frac{3.0 + 6.7}{2} = 4.85\]

Potrzebujemy jeszcze obliczyć σ tego rozkładu. Skorzystamy z informacji, że w przedziale [3.0 , 6.7] znajduje się 95% obserwacji. Oznacza to, że:

    \[P ( 3.0 \leq X \leq 6.7 )\]

Korzystając z tego że nasz przedział jest symetryczny względem średniej wiemy, że na prawo i na lewo znajduje się tyle samo obserwacji, czyli po 2.5% co zapisujemy:

    \[P( X < 3.0 ) = 0.025\]

    \[P ( X > 6.7) = 0.025\]

Chcemy skorzystać ze standaryzacji rozkładu normalnego i na jego podstawie wyliczyć σ. Korzystając z tego równania:

    \[P ( 3.0 \leq X \leq 6.7 )\]

byłoby to ciężkie do wyliczenia ponieważ niewiadoma σ pojawiła by się w 2 miejscach( przy czynnikach 3.0 i 6.7). Zamiast tego lepiej posłużyć się:

    \[P (X \leq 6.7) = P ( 3.0 \leq X \leq 6.7 ) + P( X < 3.0 ) = 0.975\]

Teraz dokonamy standaryzacji, czyli:

    \[P (X \leq 6.7)= P( \frac{X - m}{\sigma} \leq \frac{6.7 - m}{\sigma} ) =\]

    \[P(Z \leq \frac{6.7 - 4.85}{\sigma}) = P(Z \leq \frac{1.85}{\sigma}) = \Phi(\frac{1.85}{\sigma}) = 0.975\]

Teraz obliczymy prawdopodobieństwo tego, ze poziom kwasu moczowego w osoczu jest większy niż 5mg/100ml:

    \[P(X > 5) = 1 - P(X \leq 5)\]

    \[P(X \leq 5) = P( \frac{X-m}{\sigma} \leq \frac{5-m}{\sigma}) =\]

    \[P(Z \leq \frac{5-4.85}{0.94}) \approx P(Z \leq 0.16) = \Phi(0.16) \approx 0.564\]

    \[P(X > 5) = 1 - P(X \leq 5) = 1 - 0.564 = 0.436\]

Odp: Prawdopodobieństwo tego, ze poziom kwasu moczowego w osoczu jest większy niż 5mg/100ml wynosi 43.6%

Stwierdzono , że masa ciała tuczników podlega rozkładowi normalnemu o parametrach (120kg,20kg). Jakie jest prawdopodobieństwo, że wśród 5 wybranych tuczników dokładnie jeden ma masę powyżej 140 kg ?

Z zadania mamy, że zmienna jest z rozkładu N(120, 20). Najpierw policzmy prawdopodobieństwo tego że tucznik będzie ważył powyżej 140kg:

    \[P(X > 140) = P(\frac{X - 120}{20} > \frac{140 - 120}{20}) = P(Z > \frac{20}{20}) = P(Z > 1) =\]

    \[1 - P(Z \leq 1) = 1 - \phi(1) = 1 - 0.84 = 0.16\]

Znając prawdopodobieństwo dla jednego tucznika jesteśmy w stanie policzyć prawdopodobieństwo, że 1 z 5 tuczników będzie ważył powyżej 140kg. Do tego skorzystamy z rozkładu dwumianowego:

X – zmienna z rozkładu dwumianowego

p=0,16 – prawdopodobieństwo sukcesu

1-p=0,84 – prawdopodobieństwo porażki

n=5 – liczba prób

k=1 – liczba sukcesów

    \[P(X_{n} = k) = {n\choose k} \cdot p^{k} \cdot (1-p)^{n-k} = {5\choose 1} \cdot 0.16^{1} \cdot 0.84^{4} = 5 \cdot 0.16 \cdot 0.498 \approx 0.4\]

Szansa na to, że jeden z pięciu tuczników będzie ważył powyżej 140kg wynosi 40%.

Wzrost mężczyzn podlega rozkładowi normalnemu o średniej 180 cm , przy czym 2,5% mężczyzn jest niższych niż 170,2 cm. Jaki procent mężczyzn jest wyższy niż 185 cm ?

m = 180

P(X < 170,2) = 0.025

    \[P(\frac{X - 180}{\sigma} < \frac{170,2-180}{\sigma}) = 0.025\]

    \[P(Z < \frac{-9.8}{\sigma}) = 0.025\]

    \[\phi(\frac{-9.8}{\sigma}) = 0.025\]

Korzystając z tego, że ϕ(−1.96)=0.025 możemy zapisać poniższą równość:

    \[\frac{-9.8}{\sigma} = -1.96\]

    \[\sigma = \frac{-9.8}{-1.96} = 5\]

Czyli zmienna X pochodzi z rozkładu normalnego N(180, 5)

Teraz obliczymy prawdopodobieństwo, że losowy mężczyzna jest wyższy niż 185cm:

    \[P(X > 185) = P(\frac{X - 180}{5} > \frac{185 - 180}{5}) = P(Z > 1) =\]

    \[1 - P(Z \leq 1) = 1 - \phi(1) = 1 -0.84 = 0.16\]

Zakładając, ze tygodniowa kwota wydatkowana przez 4-osobową rodzinę na kupno mleka ma rozkład normalny ze średnią 5.2 zł, obliczyć odchylenie standardowe. Wiadomo, ze 30.15% ogółu tych rodzin wydaje na mleka mniej niż 3,6 zł.

    \[X \sim N(5.2 , \sigma)\]

Wiemy, że : 

    \[P(X < 3.6) = 0.3015\]

Przeprowadzając standaryzację mamy:

    \[P(X < 3.6) = P(\frac{X - 5.2}{\sigma} <\frac{3.6 -5.2}{\sigma}) = P(Z < \frac{-1.6}{\sigma}) = \phi(\frac{-1.6}{\sigma})\]

    \[\phi(\frac{-1.6}{\sigma}) = 0.3015\]

Ponieważ prawdopodobieństwo jest mniejsze od 0.5 (a od takiej wartości zaczyna się tablica rozkładu normalnego) skorzystamy z trików związanych z rozkładem N(0,1)(dokładnie z punktu 2), tj.

    \[\phi(t) = 1 - \phi(-t)\]

    \[\phi(\frac{-1.6}{\sigma}) = 1 - \phi(-\frac{-1.6}{\sigma}) =0.3015\]

    \[\phi(\frac{1.6}{\sigma}) = 1 - 0.3015 = 0.6985\]

Teraz odczytamy z tablicy dystrybuanty rozkładu normalnego takie t, że ϕ(t)=0.6985. Dystrybuanta przyjmuje taką wartość dla t≈0.52.

    \[t = 0.52 = \frac{1.6}{\sigma}\]

    \[\sigma = \frac{1.6}{0.52} \approx 3.08\]

Odp: Odchylenie standardowe kwoty wydatkowanej przez 4-osobową rodzinę na kupno mleka wynosi w przybliżeniu 3.08 zł.

Rozkład płac pracowników w firmie A jest normalny z oczekiwaną wartością m=2000 . Wybrano 25 pracowników. Obliczyć prawdopodobieństwo, że średnia płaca wylosowanych pracowników jest większa od 1800, jeśli wariancja płacy pracowników firmy A jest równa 250000zł2.

Skorzystamy z własności rozkładu normalnego:

Jeżeli X∼N(m,σ) to:

    \[\overline{X} \sim N(m, \frac{\sigma}{\sqrt{n}})\]

Dla n = 25 mamy:

    \[Y =\overline{X} \sim N(2000, \frac{\sqrt{250000}}{\sqrt{25}}) = N(2000, \frac{500}{5}) = N(2000, 100)\]

    \[P(Y > 1800) = P(\frac{Y - 2000}{100} > \frac{1800 - 2000}{100}) =\]

    \[P(Z > -2) = P(Z \geq 2) = \Phi(2) \approx 0.978\]

Odp: Prawdopodobieństwo, że średnia płaca wylosowanych pracowników jest większa od 1800 wynosi 97.8%.

Zmienna losowa x ma rozkład normalny N (190,120). Znajdź Xi.

a) P(X<x1) = 0.03
b) P(X>x2) = 0.995

a) 

    \[P(X < x_{1}) = P(\frac{X - 190}{120} < \frac{x_{1}-190}{120}) = P(Z < \frac{x_{1}-190}{120}) =\]

    \[= P(Z \leq \frac{x_{1}-190}{120}) = \Phi(\frac{x_{1}-190}{120}) = 0.03\]

Teraz musimy znaleźć dla jakiego Φ(t)=0.03 Skorzystamy z trików tablicy rozkładu N(0,1). Ponieważ Φ(t)=0.03<0.5 to t będzie ujemne więc skorzystamy z triku numer 2 do wyliczenia wartości t:

Φ(t)=1–Φ(−t)=0.03

Φ(−t)=0.97

−t≈1.88 —> t≈−1.88

W naszym przypadku:

    \[t = \frac{x_{1}-190}{120}\]

    \[-1.88 = \frac{x_{1}-190}{120}\]

    \[-1.88 \cdot 120 = x_{1} - 190\]

    \[-225.6 + 190 = x_{1}\]

    \[x_{1} = -35.6\]

b)

    \[P (X > x_{2})= P(\frac{X -190}{120} > \frac{x_{2} - 190}{120}) = P(Z > \frac{x_{2} - 190}{120}) = 0.995\]

Ponieważ prawdopodobieństwo jest większe od 0.5 to wartość 

    \[t = \frac{x_{2} - 190}{120}\]

będzie ujemna (gdyby była dodatnia to wartość P(X>x2) byłaby mniejsza od 0.5). Teraz skorzystamy z triku nr 4 :

    \[P(X \geq t) = P( X \leq -t) = \Phi(-t)\]

    \[P(Z > \frac{x_{2} - 190}{120}) = P(Z \geq \frac{x_{2} - 190}{120}) = \Phi(-\frac{x_{2} - 190}{120}) = 0.995\]

Φ(t)=0.995 dla t≈2.58

    \[2.58 = -\frac{x_{2} - 190}{120}\]

    \[-2.58 \cdot 120 = x_{2} - 190\]

    \[-309.6 + 190 = x_{2}\]

    \[x_{2} = -119.6\]

Odp: x1 wynosi -35.6, a x2 równa się -119.6.

Na podstawie dancyh dotyczących zarobków w pewnej firmie wyliczono, że μ=2000 oraz σ=400. Oblicz prawdopodobieństwo, że 30 losowo wybranych pracowników zarabia więcej niż 68 000zł.

Zakładamy, że zarobki każdego pracownika są niezależne.

Mamy obliczyć takie oto prawdopodobieństwo:

    \[P( \sum\limits_{i=1}^{30} X_{i} > 68 000 )\]

Będziemy chcieli skorzystać z CTG, więc musimy doprowadzić sumę do takiej postaci jak w twierdzeniu, czyli

obustronnie odjąć nμ

    \[P( \sum\limits_{i=1}^{30} X_{i} - 30 \cdot 2000 > 68 000 - 30 \cdot 2000 )\]

Wtedy lewa strona zamienia się, zgodnie z Centralnym Twierdzeniem Granicznym, w zmienną Z z rozkładu N(0,1).

    \[P(Z > \frac{68 000 - 30 \cdot 2000}{\sqrt{30}\cdot 400} ) = P( Z > \frac{20}{\sqrt{30}}) \approx P(Z > 3.65) =\]

    \[=1 - P(Z \le 3.65 ) = 1 - \Phi(3.65) = 1 - 0.99987 = 0.00013\]

Odp: Szansa na to, że 30 losowych pracowników zarabia więcej niż 68 000zł wynosi 0.013%.

Rzucamy 100 razy sześcienną kostką. Oblicz prawdopodobieństwo, że suma oczek będzie większa niż 300

n = 100

wartość oczekiwana: 

    \[\mu = \frac{1+2+3+4+5+6}{6} = 3.5\]

wariancja: 

    \[\sigma^{2} = \frac{1}{6} \cdot ( (1- 3.5)^{2} + (2- 3.5)^{2} + (3- 3.5)^{2} +\]

    \[+ (4- 3.5)^{2} + (5- 3.5)^{2} + (6- 3.5)^{2}) =\]

    \[= \frac{1}{6} \cdot ( 2.5^{2} + 1.5^{2} + 0.5^{2}+ 0.5^{2} + 1.5^{2} + 2.5^{2}) = \frac{17.5}{6} \approx 2.92\]

Do Centralnego twierdzenia granicznego potrzebujemy:

    \[\sigma = \sqrt{\sigma^{2}} = \sqrt{2.92} \approx 1.71\]

Teraz przejdziemy do obliczenia prawdopodobieństwa:

    \[P( \sum\limits_{i=1}^{100} X_{i} > 300 ) = P( \frac{\sum\limits_{i=1}^{100} X_{i} - 100 \cdot 3.5}{\sqrt{100}\cdot 1.71} > \frac{300- 100 \cdot 3.5}{\sqrt{100}\cdot 1.71} )\]

Zgodnie z centralnym twierdzeniem granicznym lewa strona pod prawdopodobieństwem zamienia się w zmienną losową N(0,1) co zapiszemy jako zmienną Z:

    \[P(Z > \frac{-50}{17.1}) = P(Z > -2.92) = 1 - P(Z \leq -2.92) = 1 - \phi(- 2.92)\]

    \[\phi(- 2.92) = 1 - \phi(2.92)\]

    \[1 - \phi(- 2.92) = 1 - (1 - \phi(2.92)) = \phi(2.92) = 0.998\]

Odp: Prawdopodobieństwo, że w 100 rzutach kostką suma oczek będzie większa od 300 wynosi 99.8%.

Rozkład normalny

Początki historii rozkładu normalnego wiążą się z nazwiskiem A. de Moivre’a, matematyka, który otrzymał rozkład normalny jako graniczną postać rozkładu dwumianowego. Dalszy rozwój teorii w tym zakresie wiąże się z nazwiskami P.S. Laplace’a oraz K.F. Gaussa. W teorii statystyki rozkład normalny określa się najczęściej jako rozkład Gaussa. Rozkład normalny odgrywa ważną rolę zarówno w teorii prawdopodobieństwa, jak i w statystyce matematycznej. Obserwacja wielu zjawisk świata fizycznego pozwoliła stwierdzić, że podlegają one prawu rozkładu normalnego. I tak, rozkład normalny (lub bardzo zbliżony do normalnego) mają np. następujące zmienne:

1) waga oraz wzrost osobników jednorodnych populacji ludzkich lub zwierzęcych
2) plon na jednakowych poletkach doświadczalnych
3)losowe błędy pomiarów

Do rozkładu normalnego prowadzi taki proces kształtowania zjawiska, w ramach którego na dane zjawisko oddziałuje duża liczba niezależnych czynników, których wpływ, traktowany odrębnie, jest mało znaczący. Uzasadnienia dla normalnego rozkładu zjawisk na gruncie rachunku prawdopodobieństwa dostarcza tzw. centralne twierdzenie graniczne.

Obliczanie prawdopodobieństw(a<X<=b), gdzie a<b w rozkładzie normalnym o dowolnych parametrach m i δ jest pod względem rachunkowym bardzo kłopotliwe – wymagałoby całkowania funkcji gęstości z odpowiednimi parametrami w granicach a i b. Bardzo użyteczna okazuje się w takim przypadku możliwość sprowadzenia dowolnego rozkładu normalnego do postaci tzw. standardowego rozkładu normalnego, którego funkcja gęstości i dystrybuanta zostały stablicowane.

Rozkład normalny ze średnią m=0 oraz odchyleniem standardowym δ=1 nazywamy standardowym rozkładem normalnym i oznaczamy N(0,1)

Zmienną losową mającą standardowy rozkład normalny przyjęło się oznaczać przez U, jej funkcję gęstości przez φ(u), natomiast dystrybuantę przez Φ(u).
Wartości φ(u) oraz Φ(u) dla różnych wartości u są, jak już wspomnieliśmy stablicowane. Ze względu na symetrię funkcji φ(u) względem prostej u=0 w tablicach podane często są wartości obu funkcji tylko dla dodatnich u. Przy wyznaczaniu wartości dla ujemnych u korzysta się z własności φ(u)=φ(-u).
Operacja zwana standaryzacją zmiennej losowej X umożliwia korzystanie z tablic standardowego rozkładu normalnego przy obliczeniu prawdopodobieństw postaci P(a<X<=b) dla zmiennej losowej X o rozkładzie z parametrami m i δ. Można mianowicie dowieść, że jeśli zmienna losowa X ma rozkład N(m,δ), to zmienna standaryzowana ma rozkład N(0,1)

rozklad normalny - napis