Współczynniki korelacji – zadania

Aby zobaczyć rozwiązania zadań 2-13 należy wykupić abonament

Wybierz pakiet:
Zaloguj się lub Wykup
Sprawdź Wykup
Anuluj
Abonament 30 dni
Abonament 90dni

Abonament 30 dni

Dostęp do wszystkich treści serwisu przez 30dni
29,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość

Abonament 90 dni

Dostęp do wszystkich treści serwisu przez 90dni
49,90zł PLN
Sposób zapłaty: Dotpay
Sprawdź
Odblokuj zawartość
Anuluj

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Pearsona:

DŁUGOŚĆ SERII X(SZT.)8090100100110120
KOSZT JEDNOSTKOWY Y(ZŁ.)12910986

Do policzenia korelacji potrzebujemy: 

    \[\overline{X}, \overline{Y}, \sigma _{x}, \sigma _{y}\]

n=6

    \[\overline{X} = \frac{1}{6} \cdot ( 80+90+100+100+110+120 ) = \frac{600}{6} = 100\]

    \[\overline{Y} = \frac{1}{6} \cdot ( 12+9+10+9+8+6 ) = \frac{54}{6} = 9\]

Do policzenia odchyleń standardowych skorzystamy z poniższej tabeli:

    \[VarX = \frac{1}{6} \cdot \sum (X_{i} - \overline{X})^{2} = \frac{1000}{6} \approx 166.67\]

    \[\sqrt{166.67} \approx 12.91\]

    \[VarY = \frac{1}{6} \cdot \sum (Y_{i} - \overline{Y})^{2} = \frac{20}{6} \approx 3.33\]

    \[\sqrt{3.33} \approx 1.82\]

Do obliczenia współczynnika korelacji liniowej użyjemy wzoru:

    \[r_{xy} = \frac{\frac{1}{n}\sum X_{i}Y_{i}- \overline{X}\overline{Y}}{\sigma_{X} \cdot \sigma_{Y}}\]

Potrzebujemy jeszcze policzyć

    \[\sum X_{i}Y_{i}\]

    \[\sum X_{i}Y_{i} = 80 \cdot 12 + 90 \cdot 9 + \ldots + 120 \cdot 6 = 5270\]

Teraz mamy już wszystko co jest potrzebne do policzenia współczynnika korelacji:

    \[r_{xy} = \frac{\frac{1}{n}\sum X_{i}Y_{i}- \overline{X}\overline{Y}}{\sigma_{X} \cdot \sigma_{Y}} = \frac{\frac{1}{6}\cdot 5270 - 100 \cdot 9}{12.91 \cdot 1.82} \approx \frac{-21.67}{23.5} \approx -0.92\]

Czyli między danymi występuje silna ujemna korelacja między długością serii, a kosztem jednostkowym, tzn. gdy rośnie długość serii to spada koszt jednostkowy.

Pewien prowadzący ćwiczenia ze statystyki zbadał zależność między liczbą punktów otrzymanych na kolokwium, a liczbą godzin poświęconych na naukę. Na podstawie 10-elementowej próby otrzymał następujące wyniki:

    \[\overline{Y} = 12pkt, \overline{X} = 5h\]

    \[\sum_{i=0}^{10} (X_{i} - \overline{X})^2 = 4\]

    \[\sum_{i=0}^{10} (Y_{i} - \overline{Y})^2 = 25\]

    \[\sum_{i=0}^{10} (X_{i} - \overline{X})(Y_{i} - \overline{Y}) = 8\]

a) ocenić siłę i rodzaj zależności pomiędzy badanymi cechami
b) oszacuj liczbę punktów studenta, który uczył się do kolokwium 6h
c) podać interpretację parametrów wyznaczonej linii regresji
d) obliczyć współczynnik determinacji i podać jego interpretację

Badając relację pomiędzy ceną szmaragdu (w USD), a jego wagą (w gramach) otrzymano następujące wyniki:

    \[cov(X,Y) = 700, s^{2}_{x} = 25, \overline{Y} = 800, V_{y} = 30%\]

Oblicz współczynnik Preasona i zinterpretuj wyniki.

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz współczynnik korelacji Spearmana:

DŁUGOŚĆ SERII X(SZT.)8090100100110120
KOSZT JEDNOSTKOWY Y(ZŁ.)12910986

Zbadano zależność między wysokością zarobków, a wynikiem z testu IQ, wyniki przedstawiono w tabeli. Oblicz siłę korelacji Spearmana pomiędzy zmiennymi.

ZAROBKI30003500300040001000050002000
IQ11510090115120130105

Pewna firma turystyczna przeprowadziła, wśród swoich klientów,  ankietę dotyczącą preferowanego miejsca następnego wyjazdu.
Uszeregowane preferencje przedstawiają się następująco (gdzie 1 to najczęściej zaznaczana opcja, a 7-najrzadziej zaznaczana)

 IndieBrazyliaUSAFrancjaWłochyChinyTajlandia
Mężczyźni4236751
Kobiety7531264

Oblicz współczynnik korelacji Spearmana i zinterpretuj wynik.

Zbadano zależność między długością serii produkcyjnej a jednostkowym kosztem produkcji i otrzymano następujące dane. Oblicz funkcję regresji liniowej:

ZAROBKI30003500300040001000050002000
IQ11510090115120130105

Analiza wydatków na rozrywkę w zależności od dochodów w losowej grupie gospodarstw domowych dostarczyła niżej dostępne statystyki:
– średnie wydatki na rozrywkę na osobę wynosiły 150zł
– średnie zarobki na osobę wynosiły 1500zł
– współczynnik zmienności wydatków wynosił 20%
– współczynnik zmienności dochodu wynosił 30%
– kowariancja między zmiennymi wynosiła X

Wyznacz oraz opisz parametry regresji liniowej wydatków na rozrywkę względem zarobków.

Mamy dwie cechy:
X [liczba kupionych karpi]
Y [liczba otrzymanych prezentów].
Równanie prostej regresji: y=2x+10

    \[Cov(x,y)=2, \overline{X}=2, \overline{Y}=6\]

Święty Mikołaj nie zgadza się z tymi wyliczeniami.
Kto ma rację i dlaczego?

Przeanalizujmy wyniki z Zadania 1 z tematu Regresja liniowa.
Funkcja regresji: Y = -0.13X + 22

rxy = 0,92

1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy możemy przewidzieć Y dla X = 150? Jak tak ile wynosi Y w tym przypadku?
3) Czy możemy przewidzieć Y dla X = 200? Jak tak ile wynosi Y w tym przypadku?

Mamy funkcję regresji Y = 2X + 3, która została wyliczona dla X z przedziału [1, 10] oraz rxy = 0.2

1) Oblicz oraz zinterpretuj współczynniki zbieżności oraz determinacji.
2) Czy powinniśmy przewidywać Y dla X = 12?

Dysponując poniższymi statystykami oblicz współczynniki zbieżności i determinacji:

sx=20 , sy=30, a=0.9

Oblicz kowariancję wykorzystując dane z tabeli

Marcin Xi35423
Dominik Yi44323

Wspolczynniki korelacji - napis