Tad korelācijas koeficients ir 0. Korelācijas koeficienta nozīme. Korelācijas analīze ir

Korelācijas koeficients ir attiecību pakāpe starp diviem mainīgajiem. Tās aprēķins sniedz priekšstatu par to, vai pastāv saistība starp divām datu kopām. Atšķirībā no regresijas, korelācija neparedz lielumu vērtības. Tomēr koeficienta aprēķināšana ir svarīgs sākotnējās statistiskās analīzes solis. Piemēram, konstatējām, ka korelācijas koeficients starp ārvalstu tiešo investīciju līmeni un IKP pieauguma tempu ir augsts. Tas rada priekšstatu, ka labklājības nodrošināšanai ir jārada labvēlīgs klimats tieši ārvalstu uzņēmējiem. No pirmā acu uzmetiena nav tik acīmredzams secinājums!

Korelācija un cēloņsakarība

Varbūt nav nevienas statistikas jomas, kas mūsu dzīvē būtu tik stingri nostiprinājusies. Korelācijas koeficients tiek izmantots visās sociālo zināšanu jomās. Tās galvenais apdraudējums ir tas, ka bieži tiek spekulēts par tā augstajām vērtībām, lai pārliecinātu cilvēkus un liktu viņiem noticēt dažiem secinājumiem. Tomēr patiesībā spēcīga korelācija nepavisam nenorāda uz cēloņsakarību starp daudzumiem.

Korelācijas koeficients: Pīrsona un Spīrmena formula

Ir vairāki pamatrādītāji, kas raksturo attiecības starp diviem mainīgajiem. Vēsturiski pirmais ir Pīrsona lineārās korelācijas koeficients. To māca skolā. To izstrādāja K. Pearson un J. Yule, pamatojoties uz Fr. Galtons. Šis koeficients ļauj redzēt attiecības starp racionāliem skaitļiem, kas mainās racionāli. Tas vienmēr ir lielāks par -1 un mazāks par 1. Negatīvs skaitlis norāda uz apgriezti proporcionālu sakarību. Ja koeficients ir nulle, tad starp mainīgajiem nav nekādas attiecības. Vienāds ar pozitīvu skaitli – pastāv tieši proporcionāla sakarība starp pētāmajiem daudzumiem. Spīrmena ranga korelācijas koeficients ļauj vienkāršot aprēķinus, veidojot mainīgo vērtību hierarhiju.

Attiecības starp mainīgajiem

Korelācija palīdz atbildēt uz diviem jautājumiem. Pirmkārt, vai attiecības starp mainīgajiem lielumiem ir pozitīvas vai negatīvas. Otrkārt, cik spēcīga ir atkarība. Korelācijas analīze ir spēcīgs instruments, kas var sniegt šo svarīgo informāciju. Ir viegli redzēt, ka ģimenes ienākumi un izdevumi proporcionāli krītas un pieaug. Šīs attiecības tiek uzskatītas par pozitīvām. Gluži pretēji, kad preces cena pieaug, pieprasījums pēc tās samazinās. Šīs attiecības sauc par negatīvām. Korelācijas koeficienta vērtības svārstās no -1 līdz 1. Nulle nozīmē, ka starp pētāmajām vērtībām nav sakarības. Jo tuvāk iegūtais rādītājs ir galējām vērtībām, jo ​​spēcīgāka ir saistība (negatīva vai pozitīva). Atkarības neesamību norāda ar koeficientu no -0,1 līdz 0,1. Jums jāsaprot, ka šāda vērtība norāda tikai uz lineāras attiecības neesamību.

Pielietojuma iezīmes

Abu rādītāju izmantošana ietver noteiktus pieņēmumus. Pirmkārt, spēcīga savienojuma klātbūtne nenosaka to, ka viens daudzums nosaka otru. Var būt arī trešais daudzums, kas nosaka katru no tiem. Otrkārt, augsts Pīrsona korelācijas koeficients nenorāda uz cēloņsakarību starp pētītajiem mainīgajiem. Treškārt, tas parāda tikai lineāras attiecības. Korelāciju var izmantot, lai novērtētu nozīmīgus kvantitatīvos datus (piemēram, barometrisko spiedienu, gaisa temperatūru), nevis tādas kategorijas kā dzimums vai iecienītākā krāsa.

Daudzkārtējs korelācijas koeficients

Pīrsons un Spīrmens pārbaudīja attiecības starp diviem mainīgajiem. Bet ko darīt, ja tādu ir trīs vai pat vairāk. Šeit palīgā nāk daudzkārtējās korelācijas koeficients. Piemēram, nacionālo kopproduktu ietekmē ne tikai ārvalstu tiešās investīcijas, bet arī valdības monetārā un fiskālā politika, kā arī eksporta līmenis. IKP pieauguma temps un apjoms ir vairāku faktoru mijiedarbības rezultāts. Tomēr ir jāsaprot, ka daudzkārtējās korelācijas modelis ir balstīts uz vairākiem vienkāršojumiem un pieņēmumiem. Pirmkārt, ir izslēgta daudzkolinearitāte starp vērtībām. Otrkārt, attiecības starp atkarīgo un mainīgajiem, kas to ietekmē, tiek uzskatītas par lineārām.

Korelācijas un regresijas analīzes izmantošanas jomas

Šo daudzumu attiecību atrašanas metodi plaši izmanto statistikā. Visbiežāk tas tiek izmantots trīs galvenajos gadījumos:

  1. Lai pārbaudītu cēloņu un seku attiecības starp divu mainīgo vērtībām. Rezultātā pētnieks cer atklāt lineāru sakarību un iegūt formulu, kas apraksta šīs attiecības starp daudzumiem. To mērvienības var atšķirties.
  2. Lai pārbaudītu attiecību starp daudzumiem. Šajā gadījumā neviens nenosaka, kurš mainīgais ir atkarīgais mainīgais. Var izrādīties, ka kāds cits faktors nosaka abu lielumu vērtību.
  3. Lai iegūtu vienādojumu. Šajā gadījumā jūs varat vienkārši aizstāt tajā skaitļus un uzzināt nezināmā mainīgā vērtības.

Vīrietis meklē cēloņu un seku attiecības

Apziņa ir veidota tā, ka mums noteikti ir jāizskaidro notikumi, kas notiek mums apkārt. Cilvēks vienmēr meklē saikni starp pasaules attēlu, kurā viņš dzīvo, un informāciju, ko viņš saņem. Smadzenes bieži rada kārtību no haosa. Viņš var viegli saskatīt cēloņu un seku attiecības tur, kur to nav. Zinātniekiem ir īpaši jāmācās pārvarēt šo tendenci. Spēja objektīvi novērtēt attiecības starp datiem ir būtiska akadēmiskajā karjerā.

Mediju neobjektivitāte

Apskatīsim, kā korelācijas esamību var nepareizi interpretēt. Britu studentu grupai ar sliktu uzvedību tika jautāts, vai viņu vecāki smēķē. Tad tests tika publicēts laikrakstā. Rezultāts parādīja spēcīgu korelāciju starp vecāku smēķēšanu un viņu bērnu likumpārkāpumiem. Profesors, kurš veica šo pētījumu, pat ieteica uz cigarešu paciņām ievietot brīdinājumu par to. Tomēr šim secinājumam ir vairākas problēmas. Pirmkārt, korelācija neparāda, kurš no daudzumiem ir neatkarīgs. Tāpēc pilnīgi iespējams pieņemt, ka vecāku kaitīgo ieradumu izraisa bērnu nepaklausība. Otrkārt, nevar droši apgalvot, ka abas problēmas nav radušās kāda trešā faktora dēļ. Piemēram, ģimenes ar zemiem ienākumiem. Ir vērts atzīmēt pētījuma veicēja profesora sākotnējo atziņu emocionālo aspektu. Viņš bija dedzīgs smēķēšanas pretinieks. Tāpēc nav pārsteidzoši, ka viņš šādi interpretēja savu pētījumu rezultātus.

secinājumus

Nepareiza korelācijas interpretācija kā cēloņsakarība starp diviem mainīgajiem lielumiem var izraisīt apkaunojošas izpētes kļūdas. Problēma ir tā, ka tā ir cilvēka apziņas pamatā. Daudzu mārketinga triku pamatā ir šī funkcija. Izpratne par atšķirību starp cēloņiem un sekām un korelāciju ļauj racionāli analizēt informāciju gan ikdienas dzīvē, gan profesionālajā karjerā.

Korelācijas koeficients ir attiecību pakāpe starp diviem mainīgajiem. Tās aprēķins sniedz priekšstatu par to, vai pastāv saistība starp divām datu kopām. Atšķirībā no regresijas, korelācija neparedz lielumu vērtības. Tomēr koeficienta aprēķināšana ir svarīgs sākotnējās statistiskās analīzes solis. Piemēram, konstatējām, ka korelācijas koeficients starp ārvalstu tiešo investīciju līmeni un IKP pieauguma tempu ir augsts. Tas rada priekšstatu, ka labklājības nodrošināšanai ir jārada labvēlīgs klimats tieši ārvalstu uzņēmējiem. No pirmā acu uzmetiena nav tik acīmredzams secinājums!

Korelācija un cēloņsakarība

Varbūt nav nevienas statistikas jomas, kas mūsu dzīvē būtu tik stingri nostiprinājusies. Korelācijas koeficients tiek izmantots visās sociālo zināšanu jomās. Tās galvenais apdraudējums ir tas, ka bieži tiek spekulēts par tā augstajām vērtībām, lai pārliecinātu cilvēkus un liktu viņiem noticēt dažiem secinājumiem. Tomēr patiesībā spēcīga korelācija nepavisam nenorāda uz cēloņsakarību starp daudzumiem.

Korelācijas koeficients: Pīrsona un Spīrmena formula

Ir vairāki pamatrādītāji, kas raksturo attiecības starp diviem mainīgajiem. Vēsturiski pirmais ir Pīrsona lineārās korelācijas koeficients. To māca skolā. To izstrādāja K. Pearson un J. Yule, pamatojoties uz Fr. Galtons. Šis koeficients ļauj redzēt attiecības starp racionāliem skaitļiem, kas mainās racionāli. Tas vienmēr ir lielāks par -1 un mazāks par 1. Negatīvs skaitlis norāda uz apgriezti proporcionālu sakarību. Ja koeficients ir nulle, tad starp mainīgajiem nav nekādas attiecības. Vienāds ar pozitīvu skaitli – pastāv tieši proporcionāla sakarība starp pētāmajiem daudzumiem. Spīrmena ranga korelācijas koeficients ļauj vienkāršot aprēķinus, veidojot mainīgo vērtību hierarhiju.

Attiecības starp mainīgajiem

Korelācija palīdz atbildēt uz diviem jautājumiem. Pirmkārt, vai attiecības starp mainīgajiem lielumiem ir pozitīvas vai negatīvas. Otrkārt, cik spēcīga ir atkarība. Korelācijas analīze ir spēcīgs instruments, kas var sniegt šo svarīgo informāciju. Ir viegli redzēt, ka ģimenes ienākumi un izdevumi proporcionāli krītas un pieaug. Šīs attiecības tiek uzskatītas par pozitīvām. Gluži pretēji, kad preces cena pieaug, pieprasījums pēc tās samazinās. Šīs attiecības sauc par negatīvām. Korelācijas koeficienta vērtības svārstās no -1 līdz 1. Nulle nozīmē, ka starp pētāmajām vērtībām nav sakarības. Jo tuvāk iegūtais rādītājs ir galējām vērtībām, jo ​​spēcīgāka ir saistība (negatīva vai pozitīva). Atkarības neesamību norāda ar koeficientu no -0,1 līdz 0,1. Jums jāsaprot, ka šāda vērtība norāda tikai uz lineāras attiecības neesamību.

Pielietojuma iezīmes

Abu rādītāju izmantošana ietver noteiktus pieņēmumus. Pirmkārt, spēcīga savienojuma klātbūtne nenosaka to, ka viens daudzums nosaka otru. Var būt arī trešais daudzums, kas nosaka katru no tiem. Otrkārt, augsts Pīrsona korelācijas koeficients nenorāda uz cēloņsakarību starp pētītajiem mainīgajiem. Treškārt, tas parāda tikai lineāras attiecības. Korelāciju var izmantot, lai novērtētu nozīmīgus kvantitatīvos datus (piemēram, barometrisko spiedienu, gaisa temperatūru), nevis tādas kategorijas kā dzimums vai iecienītākā krāsa.

Daudzkārtējs korelācijas koeficients

Pīrsons un Spīrmens pārbaudīja attiecības starp diviem mainīgajiem. Bet ko darīt, ja tādu ir trīs vai pat vairāk. Šeit palīgā nāk daudzkārtējās korelācijas koeficients. Piemēram, nacionālo kopproduktu ietekmē ne tikai ārvalstu tiešās investīcijas, bet arī valdības monetārā un fiskālā politika, kā arī eksporta līmenis. IKP pieauguma temps un apjoms ir vairāku faktoru mijiedarbības rezultāts. Tomēr ir jāsaprot, ka daudzkārtējās korelācijas modelis ir balstīts uz vairākiem vienkāršojumiem un pieņēmumiem. Pirmkārt, ir izslēgta daudzkolinearitāte starp vērtībām. Otrkārt, attiecības starp atkarīgo un mainīgajiem, kas to ietekmē, tiek uzskatītas par lineārām.

Korelācijas un regresijas analīzes izmantošanas jomas

Šo daudzumu attiecību atrašanas metodi plaši izmanto statistikā. Visbiežāk tas tiek izmantots trīs galvenajos gadījumos:

  1. Lai pārbaudītu cēloņu un seku attiecības starp divu mainīgo vērtībām. Rezultātā pētnieks cer atklāt lineāru sakarību un iegūt formulu, kas apraksta šīs attiecības starp daudzumiem. To mērvienības var atšķirties.
  2. Lai pārbaudītu attiecību starp daudzumiem. Šajā gadījumā neviens nenosaka, kurš mainīgais ir atkarīgais mainīgais. Var izrādīties, ka kāds cits faktors nosaka abu lielumu vērtību.
  3. Lai iegūtu vienādojumu. Šajā gadījumā jūs varat vienkārši aizstāt tajā skaitļus un uzzināt nezināmā mainīgā vērtības.

Vīrietis meklē cēloņu un seku attiecības

Apziņa ir veidota tā, ka mums noteikti ir jāizskaidro notikumi, kas notiek mums apkārt. Cilvēks vienmēr meklē saikni starp pasaules attēlu, kurā viņš dzīvo, un informāciju, ko viņš saņem. Smadzenes bieži rada kārtību no haosa. Viņš var viegli saskatīt cēloņu un seku attiecības tur, kur to nav. Zinātniekiem ir īpaši jāmācās pārvarēt šo tendenci. Spēja objektīvi novērtēt attiecības starp datiem ir būtiska akadēmiskajā karjerā.

Mediju neobjektivitāte

Apskatīsim, kā korelācijas esamību var nepareizi interpretēt. Britu studentu grupai ar sliktu uzvedību tika jautāts, vai viņu vecāki smēķē. Tad tests tika publicēts laikrakstā. Rezultāts parādīja spēcīgu korelāciju starp vecāku smēķēšanu un viņu bērnu likumpārkāpumiem. Profesors, kurš veica šo pētījumu, pat ieteica uz cigarešu paciņām ievietot brīdinājumu par to. Tomēr šim secinājumam ir vairākas problēmas. Pirmkārt, korelācija neparāda, kurš no daudzumiem ir neatkarīgs. Tāpēc pilnīgi iespējams pieņemt, ka vecāku kaitīgo ieradumu izraisa bērnu nepaklausība. Otrkārt, nevar droši apgalvot, ka abas problēmas nav radušās kāda trešā faktora dēļ. Piemēram, ģimenes ar zemiem ienākumiem. Ir vērts atzīmēt pētījuma veicēja profesora sākotnējo atziņu emocionālo aspektu. Viņš bija dedzīgs smēķēšanas pretinieks. Tāpēc nav pārsteidzoši, ka viņš šādi interpretēja savu pētījumu rezultātus.

secinājumus

Nepareiza korelācijas interpretācija kā cēloņsakarība starp diviem mainīgajiem lielumiem var izraisīt apkaunojošas izpētes kļūdas. Problēma ir tā, ka tā ir cilvēka apziņas pamatā. Daudzu mārketinga triku pamatā ir šī funkcija. Izpratne par atšķirību starp cēloņiem un sekām un korelāciju ļauj racionāli analizēt informāciju gan ikdienas dzīvē, gan profesionālajā karjerā.

Pētot sabiedrības veselību un veselības aprūpi zinātniskos un praktiskos nolūkos, pētniekam bieži ir jāveic statistiskā analīze par sakarībām starp statistiskās kopas faktoru un veiktspējas raksturlielumiem (cēloņsakarība) vai jānosaka paralēlu izmaiņu atkarība vairākos šīs populācijas raksturlielumos. par kādu trešo vērtību (par to kopīgo lietu). Ir jāspēj izpētīt šī savienojuma iezīmes, noteikt tā lielumu un virzienu, kā arī novērtēt tā uzticamību. Šim nolūkam tiek izmantotas korelācijas metodes.

  1. Kvantitatīvo attiecību izpausmes veidi starp pazīmēm
    • funkcionāls savienojums
    • korelācijas savienojums
  2. Funkcionālās un korelācijas saiknes definīcijas

    Funkcionāls savienojums- šāda veida attiecības starp diviem raksturlielumiem, kad katra viena no tām vērtība atbilst otras stingri noteiktai vērtībai (apļa laukums ir atkarīgs no apļa rādiusa utt.). Funkcionālais savienojums ir raksturīgs fizikāliem un matemātiskiem procesiem.

    Korelācija- tāda sakarība, kurā katra konkrēta viena raksturlieluma vērtība atbilst vairākām cita raksturlieluma vērtībām, kas ir savstarpēji saistītas ar to (cilvēka garuma un svara attiecības; ķermeņa temperatūras un pulsa ātruma attiecības utt.). Korelācija ir raksturīga medicīniskiem un bioloģiskiem procesiem.

  3. Korelācijas sakarības noteikšanas praktiskā nozīme. Cēloņ-seku sakarību starp faktoru un rezultējošām pazīmēm identificēšana (novērtējot fizisko attīstību, noteikt saistību starp darba apstākļiem, dzīves apstākļiem un veselības stāvokli, nosakot saslimšanas gadījumu biežuma atkarību no vecuma, darba stāža, darba apdraudējumu klātbūtne utt.)

    Vairāku raksturlielumu paralēlo izmaiņu atkarība no kādas trešās vērtības. Piemēram, darbnīcā augstas temperatūras ietekmē mainās asinsspiediens, asins viskozitāte, pulss utt.

  4. Vērtība, kas raksturo pazīmju attiecību virzienu un stiprumu. Korelācijas koeficients, kas vienā skaitlī sniedz priekšstatu par savienojuma virzienu un stiprumu starp zīmēm (parādībām), tā svārstību robežām no 0 līdz ± 1
  5. Korelāciju uzrādīšanas metodes
    • grafiks (izkliedes diagramma)
    • korelācijas koeficients
  6. Korelācijas virziens
    • taisni
    • otrādi
  7. Korelācijas stiprums
    • stiprs: ±0,7 līdz ±1
    • vidējais: ±0,3 līdz ±0,699
    • vājš: no 0 līdz ±0,299
  8. Korelācijas koeficienta noteikšanas metodes un formulas
    • kvadrātu metode (Pīrsona metode)
    • ranga metode (Spīrmena metode)
  9. Korelācijas koeficienta izmantošanas metodiskās prasības
    • attiecību mērīšana ir iespējama tikai kvalitatīvi viendabīgās populācijās (piemēram, garuma un svara attiecības mērīšana populācijās, kas ir viendabīgas pēc dzimuma un vecuma)
    • aprēķinus var veikt, izmantojot absolūtās vai atvasinātās vērtības
    • korelācijas koeficienta aprēķināšanai izmanto negrupētas variāciju rindas (šī prasība attiecas tikai uz korelācijas koeficienta aprēķināšanu pēc kvadrātu metodes)
    • novērojumu skaits vismaz 30
  10. Ieteikumi rangu korelācijas metodes lietošanai (Spīrmena metode)
    • kad nav nepieciešams precīzi noteikt savienojuma stiprumu, bet pietiek ar aptuveniem datiem
    • kad raksturlielumus attēlo ne tikai kvantitatīvās, bet arī atributīvās vērtības
    • kad raksturlielumu sadalījuma sērijai ir atvērtas iespējas (piemēram, darba pieredze līdz 1 gadam utt.)
  11. Ieteikumi kvadrātu metodes lietošanai (Pīrsona metode)
    • kad nepieciešams precīzi noteikt savienojuma stiprumu starp raksturlielumiem
    • kad zīmēm ir tikai kvantitatīvā izteiksme
  12. Korelācijas koeficienta aprēķināšanas metodika un kārtība

    1) Kvadrātu metode

    2) Ranga metode

  13. Shēma korelācijas sakarības novērtēšanai, izmantojot korelācijas koeficientu
  14. Korelācijas koeficienta kļūdas aprēķins
  15. Ar rangu korelācijas metodi un kvadrātu metodi iegūtā korelācijas koeficienta ticamības novērtējums

    1. metode
    Uzticamību nosaka pēc formulas:

    t kritēriju novērtē, izmantojot t vērtību tabulu, ņemot vērā brīvības pakāpju skaitu (n - 2), kur n ir sapāroto opciju skaits. t kritērijam ir jābūt vienādam ar vai lielākam par tabulā norādīto, kas atbilst varbūtībai p ≥99%.

    2. metode
    Uzticamība tiek novērtēta, izmantojot īpašu standarta korelācijas koeficientu tabulu. Šajā gadījumā korelācijas koeficients tiek uzskatīts par ticamu, ja ar noteiktu brīvības pakāpju skaitu (n - 2) tas ir vienāds ar tabulas koeficientu vai lielāks par to, kas atbilst bezkļūdu prognozēšanas pakāpei p ≥95%. .

izmantot kvadrātu metodi

Vingrinājums: aprēķina korelācijas koeficientu, nosaka attiecības virzienu un stiprumu starp kalcija daudzumu ūdenī un ūdens cietību, ja ir zināmi šādi dati (1. tabula). Novērtējiet attiecību uzticamību. Izdariet secinājumu.

1. tabula

Metodes izvēles pamatojums. Problēmas risināšanai tika izvēlēta kvadrātu metode (Pīrsona), jo katrai no pazīmēm (ūdens cietība un kalcija daudzums) ir skaitliska izteiksme; nav atvērtas opcijas.

Risinājums.
Aprēķinu secība ir aprakstīta tekstā, rezultāti parādīti tabulā. Izveidojot salīdzināmu raksturlielumu virkni, apzīmē tos ar x (ūdens cietība grādos) un ar y (kalcija daudzums ūdenī mg/l).

Ūdens cietība
(grādos)
Kalcija daudzums ūdenī
(mg/l)
d x d g d x x d y d x 2 d g 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y = Σ y / n Σ d x x d y =7078 Σ d x 2 = 982 Σ d y 2 =51056
M x = 120/6 = 20 M y = 852/6 = 142
  1. Nosakiet M x vidējās vērtības rindas opcijā “x” un M y rindas opcijā “y”, izmantojot formulas:
    M x = Σх/n (1. aile) un
    M y = Σу/n (2. sleja)
  2. Atrodiet katras opcijas novirzi (d x un d y) no aprēķinātā vidējā rindā “x” un sērijā “y”
    d x = x - M x (3. sleja) un d y = y - M y (4. sleja).
  3. Atrodiet noviržu d x x d y reizinājumu un summējiet tās: Σ d x x d y (5. aile)
  4. Kvadrātojiet katru novirzi d x un d y un summējiet to vērtības gar “x” sēriju un “y” sēriju: Σ d x 2 = 982 (6. aile) un Σ d y 2 = 51056 (7. sleja).
  5. Nosakiet reizinājumu Σ d x 2 x Σ d y 2 un izvelciet no šī reizinājuma kvadrātsakni
  6. Iegūtās vērtības Σ (d x x d y) un √ (Σd x 2 x Σd y 2) aizvietot korelācijas koeficienta aprēķināšanas formulā:
  7. Nosakiet korelācijas koeficienta ticamību:
    1. metode. Atrodiet korelācijas koeficienta kļūdu (mr xy) un t kritēriju, izmantojot formulas:

    Kritērijs t = 14,1, kas atbilst bezkļūdu prognozes varbūtībai p > 99,9%.

    2. metode. Korelācijas koeficienta ticamība tiek novērtēta, izmantojot tabulu “Standarta korelācijas koeficienti” (skat. 1. pielikumu). Ar brīvības pakāpju skaitu (n - 2)=6 - 2=4, mūsu aprēķinātais korelācijas koeficients r xу = + 0,99 ir lielāks nekā tabulā norādītais (r tabula = + 0,917 pie p = 99%).

    Secinājums. Jo vairāk kalcija ūdenī, jo cietāks tas ir (savienojums tiešs, spēcīgs un autentisks: r xy = + 0,99, p > 99,9%).

    izmantot ranžēšanas metodi

    Vingrinājums: Izmantojot ranga metodi, nosakiet sakarības virzienu un stiprumu starp darba pieredzi un traumu biežumu, ja tiek iegūti šādi dati:

    Metodes izvēles pamatojums: Problēmas risināšanai var izvēlēties tikai rangu korelācijas metodi, jo Atribūta “darba pieredze gados” pirmajā rindā ir atvērtas iespējas (darba pieredze līdz 1 gadam un 7 vai vairāk gadiem), kas neļauj izmantot precīzāku metodi - kvadrātu metodi - savienojuma izveidošanai. starp salīdzinātajiem raksturlielumiem.

    Risinājums. Aprēķinu secība parādīta tekstā, rezultāti parādīti tabulā. 2.

    2. tabula

    Darba pieredze gados Traumu skaits Kārtības skaitļi (pakāpes) Ranga atšķirība Pakāpju atšķirība kvadrātā
    X Y d(x-y) d 2
    Līdz 1 gadam 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 vai vairāk 6 5 1 +4 16
    Σ d 2 = 38,5

    Standarta korelācijas koeficienti, kas tiek uzskatīti par ticamiem (saskaņā ar L. S. Kaminsky)

    Brīvības pakāpju skaits - 2 Varbūtības līmenis p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasovs V.V. Epidemioloģija. - M.: GEOTAR-MED, 2004. - 464 lpp.
    2. Lisitsyn Yu.P. Sabiedrības veselība un veselības aprūpe. Mācību grāmata augstskolām. - M.: GEOTAR-MED, 2007. - 512 lpp.
    3. Mediķis V.A., Jurjevs V.K. Lekciju kurss par sabiedrības veselību un veselības aprūpi: 1.daļa. Sabiedrības veselība. - M.: Medicīna, 2003. - 368 lpp.
    4. Minjajevs V.A., Višņakovs N.I. un citi.Sociālā medicīna un veselības aprūpes organizācija (Rokasgrāmata 2 sējumos). - Sanktpēterburga, 1998. -528 lpp.
    5. Kučerenko V.Z., Agarkovs N.M. un citi.Sociālās higiēnas un veselības aprūpes organizācija (Pamācība) - Maskava, 2000. - 432 lpp.
    6. S. Glancs. Medicīniskā un bioloģiskā statistika. Tulkojums no angļu valodas - M., Praktika, 1998. - 459 lpp.
Paziņojums! Jūsu konkrētās problēmas risinājums izskatīsies līdzīgi šim piemēram, iekļaujot visas tālāk esošās tabulas un skaidrojošos tekstus, taču ņemot vērā jūsu sākotnējos datus...

Uzdevums:
Ir saistīts 26 vērtību pāru paraugs (x k, y k):

k 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

Nepieciešams, lai aprēķinātu/uzzīmētu:
- korelācijas koeficients;
- pārbaudīt gadījuma lielumu X un Y atkarības hipotēzi pie nozīmīguma līmeņa α = 0,05;
- lineārās regresijas vienādojuma koeficienti;
- izkliedes diagramma (korelācijas lauks) un regresijas līniju grafiks;

RISINĀJUMS:

1. Aprēķināt korelācijas koeficientu.

Korelācijas koeficients ir divu nejaušu lielumu savstarpējās varbūtības ietekmes rādītājs. Korelācijas koeficients R var ņemt vērtības no -1 pirms tam +1 . Ja absolūtā vērtība ir tuvāka 1 , tad tas liecina par spēcīgu saikni starp daudzumiem, un ja tuvāk 0 - tad tas norāda uz vāju savienojumu vai tā neesamību. Ja absolūtā vērtība R vienāds ar vienu, tad mēs varam runāt par funkcionālu saikni starp lielumiem, tas ir, vienu lielumu var izteikt caur citu, izmantojot matemātisko funkciju.


Korelācijas koeficientu var aprēķināt, izmantojot šādas formulas:
n
Σ
k = 1
(x k-M x) 2, σ y 2 =
M x =
1
n
n
Σ
k = 1
xk, M g =

vai pēc formulas

Rx,y =
M xy - M x M g
S x S y
(1.4), kur:
M x =
1
n
n
Σ
k = 1
xk, M g =
1
n
n
Σ
k = 1
y k , Mxy =
1
n
n
Σ
k = 1
x k y k (1,5)
S x 2 =
1
n
n
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
n
n
Σ
k = 1
y k 2 — M y 2 (1,6)

Praksē korelācijas koeficienta aprēķināšanai biežāk izmanto formulu (1.4.), jo tas prasa mazāk aprēķinu. Tomēr, ja kovariācija tika aprēķināta iepriekš cov(X,Y), tad izdevīgāk ir izmantot formulu (1.1), jo Papildus pašai kovariācijas vērtībai varat izmantot arī starpaprēķinu rezultātus.

1.1 Aprēķināsim korelācijas koeficientu, izmantojot formulu (1.4), lai to izdarītu, mēs aprēķinām x k ​​2, y k 2 un x k y k vērtības un ievadām tās 1. tabulā.

1. tabula


k
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. Aprēķināsim M x, izmantojot formulu (1.5).

1.2.1. x k

x 1 + x 2 + … + x 26 = 25,20000 + 26,40000 + ... + 25,80000 = 669,500000

1.2.2.

669.50000 / 26 = 25.75000

M x = 25,750000

1.3. Aprēķināsim M y līdzīgi.

1.3.1. Saskaitīsim visus elementus secīgi y k

y 1 + y 2 + … + y 26 = 30,80000 + 29,40000 + ... + 30,80000 = 793,000000

1.3.2. Sadaliet iegūto summu ar parauga elementu skaitu

793.00000 / 26 = 30.50000

M g = 30,500 000

1.4. Līdzīgā veidā mēs aprēķinām M xy.

1.4.1. Saskaitīsim secīgi visus 1. tabulas 6. ailes elementus

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. Sadaliet iegūto summu ar elementu skaitu

20412.83000 / 26 = 785.10885

M xy = 785,108846

1.5. Aprēķināsim S x 2 vērtību, izmantojot formulu (1.6.).

1.5.1. Saskaitīsim secīgi visus 1. tabulas 4. ailes elementus

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. Sadaliet iegūto summu ar elementu skaitu

17256.91000 / 26 = 663.72731

1.5.3. No pēdējā skaitļa atņemiet kvadrātu M x, lai iegūtu S x 2 vērtību

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. Aprēķināsim S y 2 vērtību, izmantojot formulu (1.6.).

1.6.1. Saskaitīsim secīgi visus 1. tabulas 5. ailes elementus

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. Sadaliet iegūto summu ar elementu skaitu

24191.84000 / 26 = 930.45538

1.6.3. Atņemiet M y kvadrātu no pēdējā skaitļa, lai iegūtu S y 2 vērtību

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. Aprēķināsim lielumu S x 2 un S y 2 reizinājumu.

S x 2 S y 2 = 0,66481 0,20538 = 0,136541

1.8. Ņemsim pēdējā skaitļa kvadrātsakni un iegūstam vērtību S x S y.

S x S y = 0,36951

1.9. Aprēķināsim korelācijas koeficienta vērtību, izmantojot formulu (1.4.).

R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028

ATBILDE: R x,y = -0,720279

2. Pārbaudām korelācijas koeficienta nozīmīgumu (pārbaudām atkarības hipotēzi).

Tā kā korelācijas koeficienta aprēķins tiek aprēķināts ierobežotai izlasei un tāpēc var atšķirties no tās kopas vērtības, ir jāpārbauda korelācijas koeficienta nozīmīgums. Pārbaude tiek veikta, izmantojot t-testu:

t =
Rx,y
n-2
1 — R 2 x,y
(2.1)

Izlases vērtība t seko Stjudenta t sadalījumam un, izmantojot t sadalījuma tabulu, ir jāatrod kritērija kritiskā vērtība (t cr.α) noteiktā nozīmīguma līmenī α. Ja pēc formulas (2.1) aprēķinātā t absolūtā vērtībā izrādās mazāka par t cr.α , tad starp nejaušajiem lielumiem X un Y nav atkarības. Pretējā gadījumā eksperimentālie dati nav pretrunā ar hipotēzi par nejaušo mainīgo atkarību.


2.1. Aprēķināsim t-kritērija vērtību, izmantojot formulu (2.1) un iegūsim:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. Izmantojot t sadalījuma tabulu, nosakām parametra t cr.α kritisko vērtību

Vēlamā tcr.α vērtība atrodas brīvības pakāpju skaitam atbilstošās rindas un dotajam nozīmīguma līmenim α atbilstošās kolonnas krustpunktā.
Mūsu gadījumā brīvības pakāpju skaits ir n - 2 = 26 - 2 = 24 un α = 0.05 , kas atbilst kritērija kritiskajai vērtībai t cr.α = 2.064 (skat. 2. tabulu)

2. tabula t-sadale

Brīvības pakāpju skaits
(n - 2)
α = 0,1 α = 0,05 α = 0,02 α = 0,01 α = 0,002 α = 0,001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. Salīdzināsim t-kritērija absolūto vērtību un t cr.α

T-kritērija absolūtā vērtība nav mazāka par kritisko vērtību t = 5,08680, t cr.α = 2,064, tāpēc eksperimentālie dati, ar varbūtību 0,95(1–α), nav pretrunā ar hipotēzi par gadījuma lielumu X un Y atkarību.

3. Aprēķināt lineārās regresijas vienādojuma koeficientus.

Lineārās regresijas vienādojums ir taisnas līnijas vienādojums, kas tuvina (aptuveni apraksta) sakarību starp nejaušajiem mainīgajiem X un Y. Ja pieņemam, ka vērtība X ir brīva un Y ir atkarīga no X, tad regresijas vienādojums tiks uzrakstīts kā seko


Y = a + b X (3.1.), kur:

b =Rx,y
σy
σx
= Rx,y
S y
S x
(3.2),
a = M y - b M x (3.3)

Koeficients, kas aprēķināts, izmantojot formulu (3.2.) b sauc par lineārās regresijas koeficientu. Dažos avotos a sauc par konstantu regresijas koeficientu un b atbilstoši mainīgajiem lielumiem.

Kļūdas, prognozējot Y noteiktai vērtībai X, aprēķina, izmantojot šādas formulas:

Tiek saukts arī lielums σ y/x (formula 3.4). atlikušā standarta novirze, tas raksturo vērtības Y novirzi no regresijas taisnes, kas aprakstīta ar vienādojumu (3.1) fiksētai (dotai) X vērtībai.

.
S y 2 / S x 2 = 0,20538 / 0,66481 = 0,30894. Ņemsim kvadrātsakni no pēdējā skaitļa un iegūstam:
S y / S x = 0,55582

3.3. Aprēķināsim koeficientu b saskaņā ar formulu (3.2.)

b = -0.72028 0.55582 = -0.40035

3.4 Aprēķināsim koeficientu a saskaņā ar formulu (3.3.)

a = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5. Novērtēsim regresijas vienādojuma kļūdas.

3.5.1 Ņemot kvadrātsakni no S y 2, mēs iegūstam:

= 0.31437
3.5.4 Aprēķināsim relatīvo kļūdu, izmantojot formulu (3.5)

δ y/x = (0,31437/30,50000)100% = 1,03073%

4. Izveidojam izkliedes diagrammu (korelācijas lauku) un regresijas līniju grafiku.

Izkliedes diagramma ir atbilstošo pāru (x k, y k) grafisks attēlojums kā plaknes punkti taisnstūra koordinātēs ar X un Y asīm. Korelācijas lauks ir viens no saistītā (pāra) parauga grafiskiem attēlojumiem. Tajā pašā koordinātu sistēmā ir attēlots arī regresijas līniju grafiks. Mērogi un sākuma punkti uz asīm jāizvēlas rūpīgi, lai diagramma būtu pēc iespējas skaidrāka.

4.1. Atrodiet parauga minimālo un maksimālo elementu X ir attiecīgi 18. un 15. elements, x min = 22.10000 un x max = 26.60000.

4.2. Parauga Y minimālais un maksimālais elements ir attiecīgi 2. un 18. elements, y min = 29.40000 un y max = 31.60000.

4.3. Uz x ass izvēlieties sākuma punktu nedaudz pa kreisi no punkta x 18 = 22,10000 un tādu mērogu, lai punkts x 15 = 26,60000 ietilptu uz ass un pārējie punkti būtu skaidri redzami.

4.4. Uz ordinātu ass izvēlieties sākuma punktu nedaudz pa kreisi no punkta y 2 = 29,40000 un tādu mērogu, lai punkts y 18 = 31,60000 ietilptu uz ass un pārējie punkti būtu skaidri atšķirami.

4.5. Mēs novietojam x k ​​vērtības uz abscisu ass un y k vērtības uz ordinātu ass.

4.6. Punktus (x 1, y 1), (x 2, y 2),…, (x 26, y 26) uzzīmējam koordinātu plaknē. Mēs iegūstam izkliedes diagrammu (korelācijas lauku), kas parādīta attēlā zemāk.

4.7. Nozīmēsim regresijas līniju.

Lai to izdarītu, mēs atradīsim divus dažādus punktus ar koordinātām (x r1, y r1) un (x r2, y r2), kas atbilst (3.6) vienādojumam, uzzīmēsim tos koordinātu plaknē un novelsim caur tiem taisnu līniju. Kā pirmā punkta abscisu mēs ņemam vērtību x min = 22,10000. Aizvietojot vērtību x min vienādojumā (3.6), iegūstam pirmā punkta ordinātas. Tādējādi mums ir punkts ar koordinātām (22.10000, 31.96127). Līdzīgā veidā iegūstam otrā punkta koordinātas, par abscisu liekot vērtību x max = 26,60000. Otrais punkts būs: (26.60000, 30.15970).

Regresijas līnija ir parādīta attēlā zemāk sarkanā krāsā

Lūdzu, ņemiet vērā, ka regresijas līnija vienmēr iet caur X un Y vidējo vērtību punktu, t.i. ar koordinātām (M x , M y).

06.06.2018 16 235 0 Igors

Psiholoģija un sabiedrība

Viss pasaulē ir savstarpēji saistīts. Katrs cilvēks intuīcijas līmenī cenšas atrast attiecības starp parādībām, lai spētu tās ietekmēt un kontrolēt. Jēdzienu, kas atspoguļo šīs attiecības, sauc par korelāciju. Ko tas nozīmē vienkāršos vārdos?

Saturs:

Korelācijas jēdziens

Korelācija (no latīņu “correlatio” - attiecība, attiecības)– matemātisks termins, kas nozīmē statistiskās varbūtības atkarības mēru starp nejaušiem lielumiem (mainīgajiem).



Piemērs:Ņemsim divu veidu attiecības:

  1. Pirmkārt- pildspalva cilvēka rokā. Kurā virzienā kustas roka, tajā virzienā iet pildspalva. Ja roka ir miera stāvoklī, pildspalva neraksta. Ja cilvēks to nospiež nedaudz stiprāk, atzīme uz papīra būs bagātāka. Šāda veida attiecības atspoguļo stingru atkarību un nav korelatīvas. Šīs attiecības ir funkcionālas.
  2. Otrais veids– attiecības starp cilvēka izglītības līmeni un literatūras lasīšanu. Iepriekš nav zināms, kuri cilvēki lasa vairāk: ar vai bez augstākās izglītības. Šī saikne ir nejauša vai stohastiska; to pēta statistikas zinātne, kas nodarbojas tikai ar masu parādībām. Ja statistiskais aprēķins ļauj pierādīt korelāciju starp izglītības līmeni un literatūras lasīšanu, tad tas ļaus veikt jebkādas prognozes un paredzēt notikumu varbūtības rašanos. Šajā piemērā ar lielu varbūtības pakāpi var apgalvot, ka cilvēki ar augstāko izglītību, tie, kas ir vairāk izglītoti, lasa vairāk grāmatu. Bet, tā kā savienojums starp šiem parametriem nav funkcionāls, mēs varam kļūdīties. Jūs vienmēr varat aprēķināt šādas kļūdas iespējamību, kas būs nepārprotami maza un tiek saukta par statistiskās nozīmīguma līmeni (p).

Dabas parādību saistību piemēri ir: barības ķēde dabā, cilvēka ķermenis, kas sastāv no orgānu sistēmām, kas ir savstarpēji saistītas un darbojas kā vienots veselums.

Ikdienā sastopamies ar korelācijām ikdienā: starp laikapstākļiem un labu garastāvokli, pareizu mērķu formulēšanu un to sasniegšanu, pozitīvu attieksmi un veiksmi, laimes sajūtu un finansiālo labklājību. Bet mēs meklējam kopsakarības, paļaujoties nevis uz matemātiskiem aprēķiniem, bet gan uz mītiem, intuīciju, māņticību un dīkstāvēm. Šīs parādības ir ļoti grūti pārtulkot matemātiskā valodā, izteikt skaitļos un izmērīt. Cits jautājums ir, ja mēs analizējam parādības, kuras var aprēķināt un attēlot skaitļu veidā. Šajā gadījumā korelāciju varam definēt, izmantojot korelācijas koeficientu (r), kas atspoguļo nejaušo mainīgo korelācijas stiprumu, pakāpi, tuvumu un virzienu.

Spēcīga korelācija starp nejaušajiem mainīgajiem- pierādījumi par statistiskas saiknes esamību tieši starp šīm parādībām, taču šo saistību nevar pārnest uz tām pašām parādībām, bet gan uz citu situāciju. Bieži vien pētnieki, savos aprēķinos ieguvuši būtisku korelāciju starp diviem mainīgajiem, pamatojoties uz korelācijas analīzes vienkāršību, izdara kļūdainus intuitīvus pieņēmumus par cēloņsakarību esamību starp pazīmēm, aizmirstot, ka korelācijas koeficientam ir varbūtības raksturs. .

Piemērs: ledus apstākļos cietušo cilvēku skaits un ceļu satiksmes negadījumu skaits starp mehāniskajiem transportlīdzekļiem. Šie lielumi korelēs viens ar otru, lai gan tie absolūti nav savstarpēji saistīti, bet ir saistīti tikai ar šo nejaušo notikumu kopējo cēloni - melno ledu. Ja analīze neatklāj korelāciju starp parādībām, tas vēl neliecina par to, ka starp tām nav atkarības, kas var būt sarežģīta nelineāra un neatklāta korelācijas aprēķinos.




Pirmie korelācijas jēdzienu zinātniskā lietošanā ieviesa franči paleontologs Džordžs Kuvjē. 18. gadsimtā viņš izsecināja dzīvo organismu daļu un orgānu korelācijas likumu, pateicoties kuram no atrastajām ķermeņa daļām (atliekām) kļuva iespējams atjaunot veselas fosilās radības, dzīvnieka izskatu. Statistikā terminu korelācija pirmo reizi lietoja 1886. gadā angļu zinātnieks Frensiss Galtons. Bet viņš nevarēja iegūt precīzu formulu korelācijas koeficienta aprēķināšanai, bet viņa students to izdarīja - slavenais matemātiķis un biologs Karls Pīrsons.

Korelācijas veidi

Pēc svarīguma– ļoti nozīmīgs, nozīmīgs un nenozīmīgs.

Veidi

ar ko r ir vienāds

Ļoti nozīmīgs

r atbilst statistiskā nozīmīguma līmenim p<=0,01

Nozīmīgi

r atbilst p<=0,05

Nenozīmīgs

r nesasniedz p>0,1

Negatīvs(viena mainīgā vērtības samazināšanās noved pie cita līmeņa paaugstināšanās: jo vairāk fobiju cilvēkam ir, jo mazāka iespēja, ka viņš ieņems vadošu amatu) un pozitīvs (ja viena mainīgā lieluma palielināšanās izraisa pieaugumu cita līmenī: jo nervozāks tu esi, jo lielāka iespēja saslimt). Ja starp mainīgajiem nav saiknes, tad šādu korelāciju sauc par nulli.

Lineārs(vienai vērtībai palielinoties vai samazinoties, otrajai arī palielinoties vai samazinoties) un nelineārajai (kad, mainoties vienai vērtībai, otrās izmaiņu raksturu nevar aprakstīt, izmantojot lineāro sakarību, tad tiek piemēroti citi matemātiskie likumi - polinoms, hiperbolisks attiecības).

Pēc spēka.

Likmes




Atkarībā no tā, kurai skalai pieder pētāmie mainīgie, tiek aprēķināti dažāda veida korelācijas koeficienti:

  1. Pīrsona korelācijas koeficients, pāru lineārās korelācijas koeficients vai produkta momenta korelācija tiek aprēķināta mainīgajiem ar intervāla un skalas mērīšanas skalām.
  2. Spīrmena vai Kendala ranga korelācijas koeficients – ja vismaz vienam no daudzumiem ir kārtas skala vai tas nav normāli sadalīts.
  3. Punktu bisēriskās korelācijas koeficients (Fechner sign korelācijas koeficients) – ja viens no diviem lielumiem ir dihotoms.
  4. Četru lauku korelācijas koeficients (vairāku rangu korelācijas (saskaņas) koeficients – ja divi mainīgie ir dihotomi.

Pīrsona koeficients attiecas uz parametru korelācijas rādītājiem, visi pārējie ir neparametriskie.

Korelācijas koeficienta vērtība svārstās no -1 līdz +1. Ar pilnīgu pozitīvu korelāciju r = +1, ar pilnīgu negatīvu korelāciju r = -1.

Formula un aprēķins





Piemēri

Ir nepieciešams noteikt saistību starp diviem mainīgajiem lielumiem: intelektuālās attīstības līmeni (saskaņā ar testēšanu) un kavējumu skaitu mēnesī (saskaņā ar ierakstiem izglītības žurnālā) skolēnu vidū.

Sākotnējie dati ir parādīti tabulā:

IQ dati (x)

Dati par kavējumu skaitu (y)

Summa

1122

Vidēji

112,2


Lai iegūtu pareizu iegūtā rādītāja interpretāciju, ir jāanalizē korelācijas koeficienta zīme (+ vai -) un tā absolūtā vērtība (modulo).

Saskaņā ar korelācijas koeficienta klasifikācijas tabulu pēc stiprības secinām, ka rxy = -0,827 ir spēcīga negatīva korelācija. Tādējādi kavējošo skolēnu skaitam ir ļoti liela atkarība no viņu intelektuālās attīstības līmeņa. Var teikt, ka skolēni ar augstu IQ līmeni uz nodarbībām kavējas retāk nekā skolēni ar zemu IQ līmeni.



Korelācijas koeficientu var izmantot gan zinātnieki, lai apstiprinātu vai atspēkotu pieņēmumu par divu lielumu vai parādību atkarību un izmērītu tā stiprumu un nozīmīgumu, gan studenti, lai veiktu empīriskus un statistiskus pētījumus dažādos priekšmetos. Jāatceras, ka šis rādītājs nav ideāls instruments, tas tiek aprēķināts tikai lineāras attiecības stipruma mērīšanai un vienmēr būs varbūtības vērtība, kurai ir noteikta kļūda.

Korelācijas analīze tiek izmantota šādās jomās:

  • ekonomikas zinātne;
  • astrofizika;
  • sociālās zinātnes (socioloģija, psiholoģija, pedagoģija);
  • agroķīmija;
  • metalurģija;
  • rūpniecība (kvalitātes kontrolei);
  • hidrobioloģija;
  • biometriskie dati utt.

Korelācijas analīzes metodes popularitātes iemesli:

  1. Korelācijas koeficientu aprēķināšanas relatīvā vienkāršība neprasa īpašu matemātisko izglītību.
  2. Ļauj aprēķināt sakarības starp masveida gadījuma mainīgajiem, kas ir statistikas zinātnes analīzes priekšmets. Šajā sakarā šī metode ir kļuvusi plaši izplatīta statistikas pētījumu jomā.

Es ceru, ka tagad jūs spēsiet atšķirt funkcionālās attiecības no korelācijas attiecībām un zināsiet, ka, dzirdot televīzijā vai lasot presē par korelāciju, tas nozīmē pozitīvu un diezgan nozīmīgu divu parādību savstarpējo atkarību.