Rozkład dwumianowy i Poissona – teoria

Rozkład dwumianowy

Rozkład dwumianowy, nazywany również rozkładem Bernouliego, to rozkład prawdopodobieństwa który przy stałym prawdopodobieństwie sukcesu p pozwala obliczyć liczbę sukcesów k w n próbach. Prawdopodobieństwo wyliczane jest ze wzoru:

    \[P(X_{n} = k) = {n\choose k} \cdot p^{k} \cdot (1-p)^{n-k}\]

    \[Gdzie:{n\choose k} = \frac{n!}{(n-k)! \cdot k!}\]

    \[k! = 1 \cdot 2 \cdot 3 \cdot … \cdot k\]

Interpretacja:
Zakładamy, że mamy n takich zdarzeń, że k pierwszych prób to sukcesy, a reszta(n-k) prób to porażki. Prawdopodobieństwo w takiej sytuacji równe jest pk ⋅ (1−p)n−k.

W powyższym przykładzie zakładamy określony układ sukcesów i porażek.
Jednak gdy liczymy prawdopodobieństwo k-sukcesów w n-próbach, sukcesy i porażki mogą się przeplatać w dowolny sposób, dlatego uzyskane prawdopodobieństwo należy przemnożyć przez ilość kombinacji.
W tym celu wykorzystujemy symbol newtona, który oznacza liczbę możliwości wylosowania k sukcesów w n próbach.

  • Wartość oczekiwana E(X)=np
    np. Prawdopodobieństwo wyrzucenia orła jest równe 0.5.
    Rzucając monetą 10x spodziewamy się 10*0,5=5 orłów
  • Wariancja VarX=np(1−p)
    Największa wariancja występuje dla p=0.5(wynika to ze wzoru)
    Dla p=0.5-y oraz p=0.5+y wariancja jest identyczna – oznacza to że wariancja jest symetryczna względem p=0.5
  • Prawo zdarzeń rzadkich

Rozkład Poissona

Rozkład Poissona jest rozkładem dyskretnym (skokowym), który wyraża prawdopodobieństwo zdarzeń następujących po sobie z daną częstotliwością α(ilość zdarzeń na jednostkę czasową) w danym czasie. Zdarzenia zachodzą niezależnie, tzn. że czas następnego zdarzenia nie zależy od tego kiedy wystąpiło poprzednie zdarzenie.

Przykład

Rozważmy taki przykład: obserwujemy pewien przystanek autobusowy i stwierdzamy, że średnio autobusy przyjeżdżają z częstotliwością λ=autobusy na godzinę. Zdarza się jednak, że autobus nie przyjedzie- ulegnie wypadkowi – lub się spóźni. Wtedy może okazać się, że w jedną godzinę przyjadą 3 autobusy, a w następną 5. Jednak średnio w każdą godzinę będziemy obserwować 4 autobusy na tym przystanku. Zmienna opisująca kiedy przyjedzie autobus jest właśnie zmienną z rozkładu Poissona o intensywności λ=4.

Definicja:

Niech X będzie zmienną z rozkładu Poissona o intensywności λ co zapisujemy XPoiss(λ). Wtedy gęstość rozkładu(prawdopodobieństwo, że zajdzie dokładnie k zdarzeń), wyraża się wzorem:

    \[f(k, \lambda) = P( X = k ) = \frac{\lambda^{k} e^{-\lambda}}{k!}\; dla\; k:0,1,2...\]

gdzie ex to funkcja eksponencjalna. Jeżeli musisz podać dokładny wynik, a nie masz tej funkcji na kalkulatorze podstaw za e 2.718.

Warto zauważyć, że k może być dowolnie duże lecz z powodu k! w mianowniku dla dużego k prawdopodobieństwo P(X = k) będzie bardzo małe.

  • λ>0– skoro lambda opisuje intensywność to musi być liczbą dodatnią
  • k=0,1,2, – ilość zdarzeń nie może być ujemna i do tego musi być liczbą całkowitą
  • Wartość oczekiwana EX=λ
  • Wariancja VarX=λ
  • Dominanta( Moda ) jest równa największej liczbie całkowitej mniejszej od λ, np. dla λ=2.7 dominanta wynosi 2.
  • Prawo zdarzeń rzadkich
  • Dla dużego λ rozkład Poissona można przybliżyć rozkładem normalnym o średniej i wariancji równych λ, czyli dla XPoiss(λ) oraz dla dużego λ mamy XN(λ,λ)

Prawo zdarzeń rzadkich

Rozkład Poissona, przy pewnych założeniach , może posłużyć jako aproksymacja (przybliżenie) rozkładu dwumianowego. Tzn. dla dostatecznie dużej próby ( co najmniej n = 20) oraz małym prawdopodobieństwie zajścia danego zdarzenia ( p0.05 ) zamiast rozkładu dwumianowego możemy użyć rozkład Poissona.

Definicja:

Dla n> 20 i p0.05 rozkład dwumianowy możemy przybliżyć rozkładem Poissona o intensywności λ=np, co zapiszemy:

    \[X \sim B( n,p ) \sim Poiss( n \cdot p )\]

Rozklad dwumianowy i Poissona - napis