Współczynniki korelacji – zadania

Aby zobaczyć rozwiązania zadań 3-13 należy wykupić abonament

Wybierz pakiet:
Zaloguj się lub Wykup
Sprawdź Wykup
Anuluj
Abonament 30 dni
Abonament 90dni

Abonament 30 dni

Dostęp do wszystkich treści serwisu przez 30dni
29,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość

Abonament 90 dni

Dostęp do wszystkich treści serwisu przez 90dni
49,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość
Anuluj

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Pearsona:

DŁUGOŚĆ SERII X(SZT.)8090100100110120
KOSZT JEDNOSTKOWY Y(ZŁ.)12910986

Do policzenia korelacji potrzebujemy: 

    \[\overline{X}, \overline{Y}, \sigma _{x}, \sigma _{y}\]

n=6

    \[\overline{X} = \frac{1}{6} \cdot ( 80+90+100+100+110+120 ) = \frac{600}{6} = 100\]

    \[\overline{Y} = \frac{1}{6} \cdot ( 12+9+10+9+8+6 ) = \frac{54}{6} = 9\]

Do policzenia odchyleń standardowych skorzystamy z poniższej tabeli:

    \[VarX = \frac{1}{6} \cdot \sum (X_{i} - \overline{X})^{2} = \frac{1000}{6} \approx 166.67\]

    \[\sqrt{166.67} \approx 12.91\]

    \[VarY = \frac{1}{6} \cdot \sum (Y_{i} - \overline{Y})^{2} = \frac{20}{6} \approx 3.33\]

    \[\sqrt{3.33} \approx 1.82\]

Do obliczenia współczynnika korelacji liniowej użyjemy wzoru:

    \[r_{xy} = \frac{\frac{1}{n}\sum X_{i}Y_{i}- \overline{X}\overline{Y}}{\sigma_{X} \cdot \sigma_{Y}}\]

Potrzebujemy jeszcze policzyć

    \[\sum X_{i}Y_{i}\]

    \[\sum X_{i}Y_{i} = 80 \cdot 12 + 90 \cdot 9 + \ldots + 120 \cdot 6 = 5270\]

Teraz mamy już wszystko co jest potrzebne do policzenia współczynnika korelacji:

    \[r_{xy} = \frac{\frac{1}{n}\sum X_{i}Y_{i}- \overline{X}\overline{Y}}{\sigma_{X} \cdot \sigma_{Y}} = \frac{\frac{1}{6}\cdot 5270 - 100 \cdot 9}{12.91 \cdot 1.82} \approx \frac{-21.67}{23.5} \approx -0.92\]

Czyli między danymi występuje silna ujemna korelacja między długością serii, a kosztem jednostkowym, tzn. gdy rośnie długość serii to spada koszt jednostkowy.

Pewien prowadzący ćwiczenia ze statystyki zbadał zależność między liczbą punktów otrzymanych na kolokwium, a liczbą godzin poświęconych na naukę. Na podstawie 10-elementowej próby otrzymał następujące wyniki:

    \[\overline{Y} = 12pkt, \overline{X} = 5h\]

    \[\sum_{i=0}^{10} (X_{i} - \overline{X})^2 = 4\]

    \[\sum_{i=0}^{10} (Y_{i} - \overline{Y})^2 = 25\]

    \[\sum_{i=0}^{10} (X_{i} - \overline{X})(Y_{i} - \overline{Y}) = 8\]

a) ocenić siłę i rodzaj zależności pomiędzy badanymi cechami
b) oszacuj liczbę punktów studenta, który uczył się do kolokwium 6h
c) podać interpretację parametrów wyznaczonej linii regresji
d) obliczyć współczynnik determinacji i podać jego interpretację

Podstawiając dane do wzoru: 

    \[r_{xy} = \frac{\sum (X_{i} - \overline{X}) \cdot (Y_{i} - \overline{Y}) }{\sqrt{\sum (X_{i} - \overline{X})^{2} \cdot \sum (Y_{i} - \overline{Y})^{2}} } = \frac{8}{\sqrt{25 \cdot 4}} = 0.8\]

Korelacja jest dość silna, a zależność jest liniowa oraz dodatnia.

b) Aby oszacować liczbę punktów musimy wyznaczyć równanie regresji: y= a*x + b, gdzie:

    \[a = \frac{\sum ( X_{i}- \overline{X} ) \cdot( Y_{i}- \overline{Y} ) }{\sum ( X_{i}- \overline{X} )^{2}} = \frac{8}{4} = 2\]

    \[b = \overline{Y} - a \cdot \overline{X} = 12 - 2 \cdot 5 = 12-10 = 2\]

Czyli równanie regresji wygląda następująco y=2x+2

Teraz podstawiając x = 6 otrzymujemy y=2⋅6+2=14

Szacowana liczba punktów dla studenta, który uczył się 6h wynosil 14 punktów.

c) Parametrami funkcji są a i b, gdzie:

a = 2 oznacza, że:

jeżeli liczba godzin nauki wzrośnie o 1h to liczba punktów wzrośnie o 2, a
jeżeli liczba godzin nauki zmaleje o 1h to liczba punktów zmaleje o 2.
b = 2 oznacza, że przy zerowym czasie nauki student otrzyma 2punkty.

d) Współczynnik determinacji: 

    \[R^{2} = r^{2}_{xy} = 0.8^2 = 0.64\]

Dopasowanie wynosi 0.64 co oznacza, że 64% danych jest wytłumaczonych przez model. Współczynnik jest większy niż 0.6 co oznacza, że dopasowanie jest zadowalające.

Badając relację pomiędzy ceną szmaragdu (w USD), a jego wagą (w gramach) otrzymano następujące wyniki:

    \[cov(X,Y) = 700, s^{2}_{x} = 25, \overline{Y} = 800, V_{y} = 30%\]

Oblicz współczynnik Preasona i zinterpretuj wyniki.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Spearmana:

DŁUGOŚĆ SERII X(SZT.)8090100100110120
KOSZT JEDNOSTKOWY Y(ZŁ.)12910986

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Zbadano zależność między wysokością zarobków, a wynikiem z testu IQ, wyniki przedstawiono w tabeli. Oblicz siłę korelacji Spearmana pomiędzy zmiennymi.

ZAROBKI30003500300040001000050002000
IQ11510090115120130105

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Pewna firma turystyczna przeprowadziła, wśród swoich klientów,  ankietę dotyczącą preferowanego miejsca następnego wyjazdu.
Uszeregowane preferencje przedstawiają się następująco (gdzie 1 to najczęściej zaznaczana opcja, a 7-najrzadziej zaznaczana)

 IndieBrazyliaUSAFrancjaWłochyChinyTajlandia
Mężczyźni4236751
Kobiety7531264

Oblicz współczynnik korelacji Spearmana i zinterpretuj wynik.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz funkcję regresji liniowej:

ZAROBKI30003500300040001000050002000
IQ11510090115120130105

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Analiza wydatków na rozrywkę w zależności od dochodów w losowej grupie gospodarstw domowych dostarczyła niżej dostępne statystyki:
– średnie wydatki na rozrywkę na osobę wynosiły 150zł
– średnie zarobki na osobę wynosiły 1500zł
– współczynnik zmienności wydatków wynosił 20%
– współczynnik zmienności dochodu wynosił 30%
– kowariancja między zmiennymi wynosiła X

Wyznacz oraz opisz parametry regresji liniowej wydatków na rozrywkę względem zarobków.

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Mamy dwie cechy:
X [liczba kupionych karpi]
Y [liczba otrzymanych prezentów].
Równanie prostej regresji: y=2x+10

    \[Cov(x,y)=2, \overline{X}=2, \overline{Y}=6\]

Święty Mikołaj nie zgadza się z tymi wyliczeniami.
Kto ma rację i dlaczego?

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Przeanalizujmy wyniki z Zadania 1 z tematu Regresja liniowa.
Funkcja regresji: Y = -0.13X + 22

rxy = 0,92

1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy możemy przewidzieć Y dla X = 150? Jak tak ile wynosi Y w tym przypadku?
3) Czy możemy przewidzieć Y dla X = 200? Jak tak ile wynosi Y w tym przypadku?

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Mamy funkcję regresji Y = 2X + 3, która została wyliczona dla X z przedziału [1, 10] oraz rxy = 0.2

1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy powinniśmy przewidywać Y dla X = 12?

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Dysponując poniższymi statystykami oblicz współczynniki zbieżności i determinacji:

sx=20 , sy=30, a=0.9

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Oblicz kowariancję wykorzystując dane z tabeli

Marcin Xi35423
Dominik Yi44323

Aby zobaczyć rozwiązanie tego zadania musisz wykupić abonament

Wspolczynniki korelacji - napis

error: Content is protected !!