Zmienne losowe i metody opisowe – zadania

Właściciel wyciągu narciarskiego zarabia dziennie średnio 1000zł (jeżeli nie ma awarii). Z obserwacji wiadomo, że 20% dni to takie w których wyciąg zepsuje się raz, 15% dni ma 2 awarie wyciągu, 10% dni ma 3 awarie natomiast w pozostałej części wyciąg działa bezawaryjnie. Koszt usunięcia awarii wynosi 300zł. Znaleźć dystrybuantę zmiennej losowej będącej zyskiem w losowo wybranym dniu.

Najpierw policzmy rozkład zmiennej
Procent dni bez awarii: 100%20%15%10%=55%
Zysk jest prosto wyliczyć więc od razy zapiszę wyniki w tablicy:

Zysk (zł)1000700400100
Prawd. (%)55%20%15%10%

Jak widać rozkład jest skokowy (prawdopodobieństwo określone jest tylko w punktach 100, 400, 700, 1000) co oznacza, że pomiędzy punktami dystrybuanta musi być stała.
Przykład P(X < 200) = P(X < 300) co wynosi dokładnie P(X = 100), ponieważ tylko ta wartość mieści się w przedziale „do 200” i „do 300”.

<1000
[100,400)P(X=100)=10%
[400,700)P(X=100) + P(X=400) = 25%
[700,1000)P(X=100) + P(X = 400) + P(X = 700) = 45%
≥1000100%

Gracz rzuca symetryczną kostką. Jeżeli wypadnie 6 wygrywa 10zł, jeżeli wypadnie 4 lub 5 wygrywa 5zł. Jeżeli wypadnie mniej niż 4 płaci 5zł. Niech X oznacza wygraną gracza. Znajdź i narysuj dystrybuantę rozkładu X.

[FMP]

Najpierw ustalmy ile gracz może wygrać:

1) Dla 6 (prawdopodobieństwo 1/6) X = 10

2) Dla 4 i 5 (prawdopodobieństwo 2/6=1/3) X = 5

3) Dla 1,2,3 (prawdopodobieństwo 3/6=1/2) X = -5

Jedyne możliwe wygrane to k= -5, 5, 10 (zł) co oznacza że wystarczy policzyć prawdopodobieństwo P(X≤k) dla tych trzech możliwych wygranych. W pozostałych przypadkach prawdopodobieństwo będzie stałe (dla wyjaśnienia spójrz na wytłumaczenie w pierwszym zadaniu).

    \[P(X \leq -5) = P(X = -5) = \frac{1}{2}\]

    \[P(X \leq 5) = P(X = -5) + P(X = 5) = \frac{1}{2} +\frac{1}{3} = \frac{5}{6}\]

P(X≤10)=1 ponieważ 10 jest najwyższą wygraną

Teraz możemy przejść do zapisania wartości dystrybuanty:

t(−∞,−5)[−5,5)[5,10)[10,∞)
F(t)=P(X≤t)00.50.8331

[/FMP]

Otrzymano następujące pomiary: (1.8 , 2.4 , 0.9 , 1.5 , 2.1 , 1.0). Narysuj dystrybuantę empiryczną

[FMP]

Mamy 6 obserwacji. Ponieważ bazujemy tylko na wynikach pomiarów to zakładamy, że każda obserwacja jest z takim samym prawdopodobieństwem, czyli 1/6.

Uszeregowane obserwacje prezentują się następująco:
0.9 , 1 , 1.5 , 1.8 , 2.1 , 2.4

Ponieważ rozkład jest punktowy to dystrybuanta będzie funkcją kawałkami stałą ze skokami wartości 1/6 w punktach obserwacji.

Czyli funkcja dystrybuanty będzie wyglądała następująco:

Fx(t)t
0dla t < 0.9
1/6dla t∈[0.9,1)
2/6dla t∈[1,1.5)
3/6dla t∈[1.5,1.8)
4/6dla t∈[1.8,2.1)
5/6dla t∈[2.1,2.4)
1t≥2.4

[/FMP]

Dystrybuanta zmiennej losowej jest określona w następujący sposób:\

t(−∞,2)[2,4)[4,10)[10,∞)
Fx(t)00.20.71

1) Narysuj dystrybuantę
2) Wyznacz gęstość rozkładu
3) Oblicz P(X<7)
4) Oblicz P(X<4)

[FMP]

Ad 1)

Ad2)
Na wykresie widać, że to co się zmienia w dystrybuancie dotyczy punktów 2, 4, 10. Z tego powodu gęstość będzie określona tylko w tych punktach i będzie określona następująco:

    \[F_{x}(2) = P(X \leq 2) = P(X =2) = 0.2\]

    \[F_{x}(4) = P(X \leq 4) = P(X =2) + P(X = 4) = 0.2 + P(X = 4) = 0.7\]

P(X=4) = 0.5

    \[F_{x}(10) = P(X \leq 10) = P(X =2) + P(X = 4) + P(X = 10)=\]

    \[= 0.2 + 0.5 + P(X = 10) = 0.7 + P(X = 10) = 1\]

P(X=10) = 0.3

Czyli gęstość prawdopodobieństwa można zapisać następująco:

k2410
P(X = k)0.20.50.3

Ad3)
Aby obliczyć P(X<7) wystarczy odczytać wartość dla x = 7  z wykresu dystrybuanty (lub bezpośrednio z tabelki), czyli:
P(X<7) = 0.7

Ad4) Tak samo jak w 3 należy odczytać prawdopodobieństwo z wykresu/tabeli. Jednak w tym przykładzie jest mały haczyk ponieważ P(X<4) to nie to samo co P(X≤4), czyli szukane prawdopodobieństwo nie równa się Fx(4).
Ma to dla nas znaczenie ponieważ dla t = 4 mamy skok, czyli tak się zmienia wartość dystrybuanty!
Jednak nie stanowi to dla nas problemu, po prostu musimy być czujni:)
P(X<4) = P(X≤2)=Fx(2)=0.2

[/FMP]

Poniżej przedstawiono strukturę wieku osób pobierających emerytury i renty w 1998 roku.

Wiek (w latach)55-6060-6565-7070-7575-80
Odsetek osób(p)162927199

a) wyznaczyć graficznie i liczbowo wartość kwartyla pierwszego w tym rozkładzie. Otrzymaną wartość zinterpretować

b) wyznaczyć i zinterpretować wartość dystrybuanty empirycznej dla wieku osób równego 70.

[FMP]

    \[Q_{1}=X_{Q_{1}}+\frac{\frac{N}{4}-F_{n}(55-60)}{N_{Q1}}*\Delta Q_{1}\]

    \[Q_{1}=60+\frac{25-16}{29}*5=61,55\]

25% osób ma 61.55 lat lub mniej, 75% osób ma 61.55 lat lub więcej

b)F(x)=72%=0,72

[/FMP]

Pracowników pewnej firmy spytano o liczbę spóźnień do pracy w ostatnim kwartale. Uzyskano następujące wyniki:

Liczba spóźnień0123
Odsetek pracowników14283820

a) wyznaczyć i zinterpretować wartość dystrybuanty empirycznej dla liczby spóźnień równej 1

b) wyznaczyć graficznie i liczbowo, a następnie zinterpretować wartość pierwszego kwartyla w tym rozkładzie

[FMP]

Q1 = 1

a) dla x=1 F(x) =0,42-0,14=0,28

25% osób spóźniło się na tylko raz lub mniej, 75% spóźniło się co najmniej 1 raz

[/FMP]

Liczba podręczników zakupionych na początku roku akademickiego przez studentów w pewnej grupie dziekańskiej(20 osób) była następująca:

3,2,3,0,4,6,4,6,1,5,0,3,5,4,0,3,4,5,4,2

a) określ zbiorowość w tym przedziale, liczbę jej elementów i badaną cechę

b) przedstaw powyższe dane w postaci szeregu rozdzielczego

[FMP]

a) Zbiorowość statystyczna: studenci pewnej grupy dziekańskiej

Liczba elementów: 20

Cecha:liczba zakupionych podręczników

b)

Xini
03
11
22
34
45
53
62

[/FMP]

Rozkład liczby błędów popełnionych przez kandydatkę na sekretarkę  w 20-stronicowym tekście pisanym podczas egzaminu był następujący:

Liczba błędów012345
Liczba kandydatek151812321

a) wyznacz skumulowany rozkład liczebności

b) zapisz dystrybuantę empiryczną

[FMP]

a)

Liczba błędów012345
Liczba kandydatek151812321
Skumulowane liczebności153345485051

b)

    \[F(x)=\left\{\begin{matrix} \\ 0 \: dla\: \: x \leq 0 \\ \frac{15}{51}\: dla \: 0<x\leq1 \\ \frac{33}{51}\: dla \: 1<x\leq2 \\ \frac{45}{51}\: dla \: 2<x\leq3 \\ \frac{48}{51}\: dla \: 3<x\leq4 \\ \frac{50}{51}\: dla \: 4<x\leq5 \\ 1\: dla\: x>5 \end{matrix}\right. \]

[/FMP]

Przeprowadzone wśród 200 studentów badania dostarczyły następujących informacji na temat wysokości pobieranego stypendium. Okazało się, że 20% ogółu studentów pobierało nie więcej niż 200 złotych stypendium, 85% nie więcej niż 400, a w badanej zbiorowości nie było studenta, którego stypendium przekraczałoby 600 złotych. Na podstawie uzyskanych wyników:

a) zbudować szereg rozdzielczy

b) wyznaczyć liczbowo wartość mediany

[FMP]

xini
0-20040
200-400130
400-60030

20%*200=40

65%*200=130

15%*200=30

b) 

    \[Me=X_{Me}+\frac{0,5*N-n_{sk1}}{n_{Me}}*\Delta Me\]

    \[Me=200+\frac{0,5*20}{130}*200=292,3zl\]

[/FMP]

W pewnej uczelni stypendium naukowe otrzymuje 30% studentów o najwyższej średniej ocen. Jaką średnią ocen powinien mieć kandydat do stypendium jeśli wiadomo, że rozkład ocen jest rozkładem normalnym N(4,0; 0,5)

[FMP]

P=0.3

    \[1-\phi (\frac{x-4}{0,5})=0,3\]

    \[\phi (\frac{x-4}{0,5})=0,7\]

    \[\frac{x-4}{0,5}=0,52\]

x=4,26

Kandydat powinien mieć średnią co najmniej 4,26

[/FMP]

Dana jest dystrybuanta zmiennej losowej:

xi-2-1012
F(xi)0,10,250,650,851

Podaj parametry rozkładu tej zmiennej losowej oraz wyznacz dystrybuantę i medianę

[FMP]

    \[\overline{x}=(-2)*0,1+(-1)*0,15+0*0,4+1*0,2+2*0,15\]

    \[s=\sqrt{(-2-0,15)^{2}*0,1+(-1-0,15)^{2}*0,15+(0-0,15)^{2}*0,4+(1-0,15)^{2}*0,2+(2-0,15)^{2}*0,15}=1,15\]

D=0

Me=0

[/FMP]

Zmienna losowa X ma rozkład normalny o wartości oczekiwanej równej zero. Wyznaczyć odchylenie standardowe tej zmiennej, jeśli wiadomo, że przyjmuje ona wartości nie większe niż 3 z prawdopodobieństwem równym 0,95

[FMP]

P(X<3) = 0,95

    \[\phi (\frac{3-0}{\sigma })=0,95 \Rightarrow \frac{3}{\sigma}=1,64\]

    \[\sigma =\frac{3}{1,64}\approx 1,83\]

Odchylenie standardowe równe 1,83

[/FMP]

Zmienna losowa X ma rozkład N(20;2). Znajdź taką wartość, żeby prawdopodobieństwo, że zmienna przekroczy tę wartość było równe 0,85.

[FMP]

P(X>x)=0,85

    \[1-\phi (\frac{x-20}{2})=0,85\]

    \[\phi (\frac{x-20}{2})=0,15\Rightarrow \frac{x-20}{2}=-1,04\]

    \[x-20=-2,08\]

x=17,92

[/FMP]

Niech X będzie zmienną losową o rozkładzie normalnym z wartością oczekiwaną równą 100 i odchyleniem standardowym równym 10. Znajdź takie x, żeby P(102<X<x) =0,05

[FMP]

P(102<X<x) = 0,05

    \[\phi (\frac{x-100}{10})-\phi (\frac{102-100}{10})=0,05\]

    \[\phi (\frac{x-100}{10})=0,05+0,5793\]

    \[\phi (\frac{x-100}{10})=0,6293\Rightarrow \frac{x-100}{10}=0,33\]

    \[x-100=3,3\]

x=103,3

[/FMP]

Zakładając, iż wysokość miesięcznych obrotów pewnej firmy jest zgodna z rozkładem normalnym z wartością średnią 45 tysięcy złotych oraz odchyleniem standardowym 11 tysięcy złotych, wyznaczyć prawdopodobieństwo, że obroty losowo wybranej firmy będą się mieściły pomiędzy 40 a 50 tysięcy złotych.

[FMP]

    \[P(40<X<50)=\phi (\frac{50-45}{11})-\phi (\frac{40-45}{11})=\phi (\frac{5}{11}) - \phi(\frac{-5}{11})=0,6736-0,3264=34,72\%\]

[/FMP]

Czas oczekiwania na taksówkę zamówioną przez smartfonowy system iTaxi jest zmienną losową o rozkładzie normalnym z odchyleniem standardowym równym 1 min.

a) Ile wynosi przeciętny czas oczekiwania na taksówkę, jeśli 75,8% oczekujących osób czeka nie krócej niż 4min?

b) Ile minut co najwyżej czekają na taksówką zamówioną dzięki aplikacji iTaxi osoby należące do 10% osób oczekujących najkrócej ?

[FMP]

    \[\phi (\frac{4-\overline{x}}{1})=0,758\]

    \[4-\overline{x}=0,7\]

    \[\overline{x}=3,3min\]

b)

    \[\phi (\frac{x-3,3}{1})=0,1\]

    \[x-3,3=-2,32\]

    \[x=0,98min\]

[/FMP]

W zaobserwowanej grupie klientów supermarketu odnotowano następujące prawidłowości w kształtowaniu się czasu dokonywania wyboru marki przy zakupie kawy rozpuszczalnej: najkrótszy czas dokonywania wyboru wynosił 0 sekund. Najdłuższy czas dokonywania wyboru wyniósł 240 sekund. Kolejne kwartyle czasu dokonywania wyboru marki kawy rozpuszczalnej to: 35 sekund, 74 sekund oraz 126 sekund. Na podstawie dostępnych miar położenia rozkładu proszę wypowiedzieć się na temat zróżnicowania czasu wyboru marki kawy rozpuszczalnej.

[FMP]

Mając kwartyle możemy policzyć odchylenie ćwiartkowe:

    \[Q=\frac{Q_{3}-Q_{1}}{2}\]

    \[Q=\frac{126-35}{2}=45,5s\]

Zróżnicowanie czasu wyboru marki kawy rozpuszczalnej wynosi 45,5 sekund wśród 50% środkowych wartości

[/FMP]

W mieście K zebrano informacje o wielkości obrotów (w tysiącach zł) w małych firmach prywatnych. Zebrane informacje zawarto w poniższym szeregu rozdzielczym:

Obroty w tysiącach zł0-55-1010-1515-2020-2525-30
Liczba firm81214853

Za pomocą miary klasycznej ocenić asymetrię rozkładu wysokości obrotów w badanych firmach, wiedząc, że przeciętny poziom miesięcznych obrotów wyniósł 12,4 tysiąca, a klasyczny współczynnik zmienności 56,73%

[FMP]

Współczynnik zmienności Vs =56,73%

    \[\overline{x}=\frac{2,5*8+7,5*12+12,5*14+17,5*8+22,5*5+27,5*3}{50}=12,4\]

    \[V_{s}=\frac{s}{\overline{x}}*100\%\]

    \[\frac{s}{12,4}*100\%=56,73\]

s=7,03tyś. zł

    \[D=X_{D}+\frac{n_{D}-n_{D-1}}{(n_{D}-n_{D-1})+(n_{D}-n_{D+1})}*\Delta D\]

    \[10+\frac{14-12}{(14-12)+(14-8)}*5=11,25\]

    \[A_{s}=\frac{\overline{X}-D}{s}\]

    \[A_{s}=\frac{12,4-11,25}{7,03}=0,16\]

Słaba asymetria prawostronna

[/FMP]

W pewnej firmie kurierskiej zbadano miesięczne zarobki netto 200 kurierów przewożących przesyłki rowerem. Okazało się, że 30% z nich zarabiało do 600 złotych, płaca 55% nie przekraczała 800 złotych, a 85% badanych otrzymywało nie więcej niż 1000złotych. Wiedząc, że najniższa pensja kuriera wynosiła 400 złotych, oraz że żaden kurier nie zarabiał więcej niż 1200 złotych należy :

a) zbudować szereg rozdzielczy dla miesięcznych zarobków kurierów

b) wiedząc dodatkowo, że średni czas pracy badanych kurierów wyniósł 9 godzin, a odchylenie standardowe 3 godziny ocenić ze względu na która z cech: wysokość zarobków czy czas pracy badani kurierzy są bardziej zróżnicowani.

[FMP]

a)

Xini
400-60060
600-80050
800-100060
1000-120030

b) Dla wysokości zarobków: 

    \[\overline{x}=\frac{500*60+700*50+900*60+1100*30}{200}=700\]

    \[V_{s}=\frac{210,7}{760}*100\%=27,7\%\]

    \[s=\sqrt{\frac{(500-760)^{2}*60+(700-760)^{2}*50+(900-760)^{2}*60+(1100-760)^{2}*30}{200}}=210,7\]

Dla czasu pracy:

    \[V_{s}=\frac{3}{9}*100\%=33,3\%\]

Pracownicy są bardziej zróżnicowani pod względem czasu pracy

[/FMP]

Poniższe zestawienie prezentuje informacje o strukturze gospodarstw domowych według liczby osób w województwie kujawsko-pomorskim w 2002r.

Liczba osób w gospodarstwie12345
Skumulowany odsetek gospodarstw(%)20456686100

Korzystając z miar klasycznych, oceń średnią i zróżnicowanie wielkości gospodarstw domowych. Wiedząc dodatkowo, że trzeci moment centralny w rozkładzie wynosił +0,38 oceń asymetrię rozkładu.

[FMP]

Miary klasyczne: 

    \[\overline{x}=\frac{20*1+25*2+21*3+20*4+14*5}{100}=2,83\]

D=2

Me=3

Miary zróżnicowania:

    \[s^{2}=\frac{(1-2,83)^{2}*20+(2-2,83)^{2}*25+(3-2,83)^{2}*21+(4-2,83)^{2}*20+(5-2,83)^{2}*14}{100}=1,71\]

    \[s=\sqrt{1,71}=1,33\]

    \[A_{s}=\frac{M_{3}}{s^{3}}=\frac{0,38}{1,33^{3}}=0,16\]

Słaba asymetria prawostronna

[/FMP]

Wyniki badania empirycznego pensjonariuszy turnusu rehabilitacyjnego dostarczyły następujących informacji o poziomie jednorazowych wydatków na słodycze:
typowe wydatki zawierają się w przedziale od 18zł do 36zł
najczęściej zaobserwowany poziom wydatków był o 20% wyższy od średniego poziomu
Jak silna była zmienność jednorazowych wydatków na słodycze w badanej grupie pensjonariuszy?

[FMP]

Typowe wydatki mieszczą się w przedziale 18-36zł, czyli typowy obszar zmienności:

[\overline{x}-s;\overline{x}+s\]

    \[\overline{x}=27\]

    \[s=9\]

Najczęściej obserwowany poziom, czyli dominanta:

D= 27*1,2=32,4zł

Współczynnik zmienności: 

    \[V_{s}=\frac{9}{27}=33,3\%\]

Zmienność w tej grupie pensjonariuszy wynosiła 33,3%

[/FMP]

Wyniki badania empirycznego studentek pierwszego roku dostarczyły następujących informacji o poziomie miesięcznych wydatków na kosmetyki:

  • rozkład empiryczny wydatków okazał się symetryczny
  • odchylenie standardowe wydatków wynosiło 9zł
  • mediana miesięcznych wydatków w zbadanej grupie studentek wyniosła 27zł

Z kolei rozkład miesięcznych wydatków na prasę codzienną w tej samej grupie studentek kształtuje się następująco:

Wydatki w zł<0,6)<6,12)<12,18)<18,24)<24,30>
Liczba studentek1010601010

Wykorzystując powyższe informacje proszę ocenić, pod względem której z wyróżnionych cech zbiorowość studentek pierwszego roku jest bardziej zróżnicowana

[FMP]

Rozkład wydatków na kosmetyki jest symetryczny, więc mediana = średnia

    \[Me=\overline{x}=27\]

s=9

    \[V_{s}=\frac{9}{27}=\frac{1}{3}\]

Wydatki na prasę:

    \[\overline{x}=\frac{3*10+9*10+15*60+21*10+27*10}{100}=15\]

    \[s=\sqrt{\frac{(3-15)^{2}*10+(9-15)^{2}*10+(15-15)^{2}*60+(21-15)^{2}*10+(27-15)^{2}*10}{100}}=6\]

    \[V_{s}=\frac{6}{15}=\frac{2}{5}\]

    \[\frac{2}{5}>\frac{1}{3}\]

Zbiorowość studentek jest bardziej zróżnicowana pod względem wydatków na prasę

[/FMP]

Poniższe dane przedstawiają miesięczne zarobki 200 pracowników(w tyś złotych) sieci barów wolnej obsługi Walk Away.

Zarobki1-1,21,2-1,41,4-1,61,6-1,81,8-2,02,0-2,2
Liczba pracowników40605030155

Czy prawdziwe są następujące stwierdzenia(odpowiedzi należy uzasadnić):

a)asymetria rozkładu jest prawostronna

b)mediana zarobków jest wyższa od średniej

c)dysponując danymi indywidualnymi uzyskalibyśmy taką samą wartość średniej jak wartość obliczona na podstawie powyższej tabeli

[FMP]

    \[\overline{x}=\frac{1,1*40+1,3*60+1,5*50+1,7*30+1,9*15+2,1*5}{200}=1,435\]

    \[D=1,2+\frac{60-40}{(60-40)+(60-50)*0,2}=1,33\]

    \[Me=1,4+\frac{0,5*200-100}{50}*0,2=1,4\]

    \[W_{s}=\overline{x}-D=1,435-1,33\approx 0,1>0\]

Asymetria prawostronna

a) Tak, bo wskaźnik asymetrii > 0

b) Nie, mediana(1,4) jest mniejsza od średniej (1,435)

c) Nie, ponieważ do obliczeń na podstawie tabeli bierzemy środki przedziałów. Wyniki indywidualne będą bardziej zróżnicowane.

[/FMP]

Pewna agencja badań marketingowych przeprowadziła w firmie “A” badanie, ile czasu (w godzinach) w ciągu tygodnia pracownicy spędzają na czytaniu wiadomości na portalach informacyjnych. Wyniki badania na 100 pracowników przedstawia poniższa tabela:

Spędzany czas0-22-44-66-88-10
Skumulowana liczba osób5356095100

Ponadto wiadomo, że najczęstsza ilość czasu poświęcana na kawę w trakcie tygodnia osób zatrudnionych w tej firmie jest równa średniej tego czasu i wynosi 5,7h, a odchylenie standardowe wynosi 1,25h. Czy pracownicy w tej firmie są bardziej zróżnicowani ze względu na czas spędzany na portalach informacyjnych, czy też ze względu na czas spędzany na kawie ?

[FMP]

Czas spędzany na portalach informacyjnych:

    \[\overline{x}=\frac{1*5+3*30+5*25+7*30+9*5}{100}=4,75\]

    \[s=\sqrt{\frac{(1-4,75)^{2}*5+(3-4,75)^{2}*30+(5-4,75)^{2}*25+(7-4,75)^{2}*35+(9-4,75)^{2}*5}{100}}=2,015\]

    \[V_{s}=\frac{2,015}{4,75}=42,4\%\]

Czas na kawę:

    \[D=\overline{x}=5,7\]

    \[s=1,25\]

    \[V_{s}=\frac{1,25}{5,7}=21,93\%\]

Pracownicy tej firmy są bardziej zróżnicowani ze względu na czas spędzany na portalach informacyjnych

[/FMP]

Zmienna losowa

Sformułowanie definicji zmiennej losowej opiera się na takich podstawowych pojęciach rachunku prawdopodobieństwa, jak zdarzenie losowe, zdarzenie elementarne, zbiór zdarzeń elementarnych, prawdopodobieństwo.
Jednoznaczne przyporządkowanie każdemu zdarzeniu elementarnemu wartości liczbowej prowadzi do określenia zmiennej losowej.

Niech E będzie zbiorem zdarzeń elementarnych danego doświadczenia. Funkcję X(e) przyporządkowującą każdemu zdarzeniu elementarnemu e ∈ E jedną i tylko jedną liczbę X(e)=x nazywamy zmienną losową

W praktyce zmienną losową X(e) zapisuje się zwykle skrótowo jako X, przy czym najczęściej stosowanymi oznaczeniami zmiennych losowych są duże litery X, Y, Z. Wartości, jakie mogą przyjmować zmienne losowe, oznacza się, odpowiednio małymi literami x, y, z.

Zmienna losowa X jest zmienną skokową, jeśli może przyjmować skończoną  lub nieskończoną, ale przeliczalną liczbę wartości

Wartości zmiennej losowej skokowej(określane często jako punkty skokowe) będziemy oznaczać przez x1, x2, …. natomiast prawdopodobieństwa, z jakimi są one realizowane (określane jako skoki), oznaczamy przez p1, p2, …

Zmienna losowa X jest zmienną ciągłą, jeżeli jej możliwe wartości należą do przedziału ze zbioru liczb rzeczywistych

Dla zmiennej losowej możliwe jest określenie prawdopodobieństwa, że przyjmuje ona wartość należącą do dowolnego zbioru jej wartości. Sposób rozdysponowania całej “masy” prawdopodobieństwa (równej 1) pomiędzy wartości, jakie przyjmuje dana zmienna losowa, określamy mianem rozkładu prawdopodobieństwa zmiennej losowej lub krótko: rozkładu zmiennej losowej. Pojęcie to jest bardzo ważne i wymaga bliższego sprecyzowania.

Metody opisowe w analizie - napis