Korrelatsioonikordaja on siis 0. Korrelatsioonikordaja olulisus. Korrelatsioonianalüüs on

Korrelatsioonikordaja on kahe muutuja vahelise seose määr. Selle arvutus annab aimu, kas kahe andmekogumi vahel on seos. Erinevalt regressioonist ei ennusta korrelatsioon suuruste väärtusi. Koefitsiendi arvutamine on aga oluline samm esialgses statistilises analüüsis. Näiteks leidsime, et välismaiste otseinvesteeringute taseme ja SKP kasvutempo vaheline korrelatsioonikordaja on kõrge. See annab meile idee, et heaolu tagamiseks on vaja luua soodne kliima just välismaistele ettevõtjatele. Pole esmapilgul nii ilmne järeldus!

Korrelatsioon ja põhjuslikkus

Võib-olla pole ühtegi statistikavaldkonda, mis oleks meie elus nii kindlalt kinnistunud. Korrelatsioonikordajat kasutatakse kõigis sotsiaalsete teadmiste valdkondades. Selle peamine oht seisneb selles, et selle kõrgete väärtuste üle spekuleeritakse sageli, et inimesi veenda ja uskuda teatud järeldustesse. Kuid tegelikult ei näita tugev korrelatsioon sugugi põhjus-tagajärg seost suuruste vahel.

Korrelatsioonikordaja: Pearsoni ja Spearmani valem

Kahe muutuja vahelist seost iseloomustavad mitmed põhinäitajad. Ajalooliselt on esimene Pearsoni lineaarne korrelatsioonikordaja. Seda õpetatakse koolis. Selle töötasid välja K. Pearson ja J. Yule Fr. Galton. See koefitsient võimaldab näha seost ratsionaalselt muutuvate ratsionaalsete arvude vahel. See on alati suurem kui -1 ja väiksem kui 1. Negatiivne arv näitab pöördvõrdelist seost. Kui koefitsient on null, siis muutujate vahel seost ei ole. Võrdne positiivse arvuga – uuritavate suuruste vahel on otseselt võrdeline seos. Spearmani järgu korrelatsioonikordaja võimaldab arvutusi lihtsustada, luues muutujate väärtuste hierarhia.

Muutujate vahelised seosed

Korrelatsioon aitab vastata kahele küsimusele. Esiteks, kas muutujate vaheline seos on positiivne või negatiivne. Teiseks, kui tugev on sõltuvus. Korrelatsioonianalüüs on võimas tööriist, mis võib selle olulise teabe anda. On hästi näha, et pere sissetulekud ja kulud proportsionaalselt langevad ja kasvavad. Seda suhet peetakse positiivseks. Vastupidi, kui toote hind tõuseb, siis nõudlus selle järele langeb. Seda suhet nimetatakse negatiivseks. Korrelatsioonikoefitsiendi väärtused jäävad vahemikku -1 kuni 1. Null tähendab, et uuritavate väärtuste vahel puudub seos. Mida lähemal on saadud näitaja äärmuslikele väärtustele, seda tugevam on seos (negatiivne või positiivne). Sõltuvuse puudumist näitab koefitsient -0,1 kuni 0,1. Peate mõistma, et selline väärtus näitab ainult lineaarse seose puudumist.

Rakenduse omadused

Mõlema näitaja kasutamine hõlmab teatud eeldusi. Esiteks ei määra tugeva seose olemasolu seda, et üks suurus määrab teise. Võib olla ka kolmas suurus, mis määrab igaüks neist. Teiseks, kõrge Pearsoni korrelatsioonikoefitsient ei näita põhjus-tagajärg seost uuritud muutujate vahel. Kolmandaks näitab see eranditult lineaarset seost. Korrelatsiooni saab kasutada tähenduslike kvantitatiivsete andmete (nt õhurõhk, õhutemperatuur) hindamiseks, mitte kategooriate, nagu sugu või lemmikvärv, hindamiseks.

Mitmekordne korrelatsioonikordaja

Pearson ja Spearman uurisid kahe muutuja vahelist seost. Aga mis teha, kui neid on kolm või isegi rohkem. Siin tuleb appi mitmekordne korrelatsioonikordaja. Näiteks ei mõjuta rahvamajanduse kogutoodangut mitte ainult välismaised otseinvesteeringud, vaid ka valitsuse raha- ja fiskaalpoliitika ning ekspordi tase. SKP kasvutempo ja maht on mitmete tegurite koosmõju tulemus. Siiski tuleb mõista, et mitme korrelatsiooni mudel põhineb mitmel lihtsustusel ja eeldusel. Esiteks on välistatud väärtuste multikollineaarsus. Teiseks loetakse lineaarseks seos sõltuva ja seda mõjutavate muutujate vahel.

Korrelatsioon- ja regressioonanalüüsi kasutusvaldkonnad

Seda suuruste vaheliste seoste leidmise meetodit kasutatakse statistikas laialdaselt. Kõige sagedamini kasutatakse seda kolmel põhijuhul:

  1. Kahe muutuja väärtuste põhjus-tagajärg seoste testimiseks. Selle tulemusena loodab teadlane avastada lineaarse seose ja tuletada valemi, mis kirjeldab neid seoseid suuruste vahel. Nende mõõtühikud võivad olla erinevad.
  2. Kogustevahelise seose kontrollimiseks. Sel juhul ei määra keegi, milline muutuja on sõltuv muutuja. Võib selguda, et mõlema suuruse väärtuse määrab mõni muu tegur.
  3. Eq. Sel juhul saate sellesse lihtsalt numbrid asendada ja tundmatu muutuja väärtused teada saada.

Mees otsib põhjuse-tagajärje suhet

Teadvus on kujundatud nii, et meil on kindlasti vaja selgitada sündmusi, mis meie ümber toimuvad. Inimene otsib alati seost maailmapildi, milles ta elab, ja saadud informatsiooni vahel. Aju loob sageli korra kaosest. Ta suudab kergesti näha põhjuse-tagajärje seost seal, kus seda pole. Teadlased peavad konkreetselt õppima sellest tendentsist üle saama. Oskus andmevahelisi suhteid objektiivselt hinnata on akadeemilises karjääris hädavajalik.

Meedia eelarvamus

Mõelgem, kuidas saab korrelatsiooni olemasolu valesti tõlgendada. Rühmalt halva käitumisega Briti õpilasi küsiti, kas nende vanemad suitsetavad. Siis avaldati test ajalehes. Tulemus näitas tugevat seost vanemate suitsetamise ja nende laste kuritegevuse vahel. Selle uuringu läbi viinud professor soovitas isegi sigaretipakkidele selle kohta hoiatuse panna. Selle järeldusega on aga mitmeid probleeme. Esiteks ei näita korrelatsioon, milline suurus on sõltumatu. Seetõttu on täiesti võimalik eeldada, et vanemate kahjuliku harjumuse põhjuseks on laste sõnakuulmatus. Teiseks ei saa kindlalt väita, et mõlemad probleemid ei tekkinud mingi kolmanda teguri tõttu. Näiteks madala sissetulekuga pered. Märkimist väärib uuringu läbiviija professori esialgsete leidude emotsionaalne aspekt. Ta oli tulihingeline suitsetamise vastane. Seetõttu pole üllatav, et ta oma uurimistöö tulemusi nii tõlgendas.

järeldused

Korrelatsiooni väär tõlgendamine kahe muutuja põhjus-tagajärg seosena võib põhjustada häbiväärseid uurimisvigu. Probleem on selles, et see on inimese teadvuse alus. Paljud turundusnipid põhinevad sellel funktsioonil. Põhjuse ja tagajärje erinevuse ning korrelatsiooni mõistmine võimaldab teil teavet ratsionaalselt analüüsida nii igapäevaelus kui ka tööalases karjääris.

Korrelatsioonikordaja on kahe muutuja vahelise seose määr. Selle arvutus annab aimu, kas kahe andmekogumi vahel on seos. Erinevalt regressioonist ei ennusta korrelatsioon suuruste väärtusi. Koefitsiendi arvutamine on aga oluline samm esialgses statistilises analüüsis. Näiteks leidsime, et välismaiste otseinvesteeringute taseme ja SKP kasvutempo vaheline korrelatsioonikordaja on kõrge. See annab meile idee, et heaolu tagamiseks on vaja luua soodne kliima just välismaistele ettevõtjatele. Pole esmapilgul nii ilmne järeldus!

Korrelatsioon ja põhjuslikkus

Võib-olla pole ühtegi statistikavaldkonda, mis oleks meie elus nii kindlalt kinnistunud. Korrelatsioonikordajat kasutatakse kõigis sotsiaalsete teadmiste valdkondades. Selle peamine oht seisneb selles, et selle kõrgete väärtuste üle spekuleeritakse sageli, et inimesi veenda ja uskuda teatud järeldustesse. Kuid tegelikult ei näita tugev korrelatsioon sugugi põhjus-tagajärg seost suuruste vahel.

Korrelatsioonikordaja: Pearsoni ja Spearmani valem

Kahe muutuja vahelist seost iseloomustavad mitmed põhinäitajad. Ajalooliselt on esimene Pearsoni lineaarne korrelatsioonikordaja. Seda õpetatakse koolis. Selle töötasid välja K. Pearson ja J. Yule Fr. Galton. See koefitsient võimaldab näha seost ratsionaalselt muutuvate ratsionaalsete arvude vahel. See on alati suurem kui -1 ja väiksem kui 1. Negatiivne arv näitab pöördvõrdelist seost. Kui koefitsient on null, siis muutujate vahel seost ei ole. Võrdne positiivse arvuga – uuritavate suuruste vahel on otseselt võrdeline seos. Spearmani järgu korrelatsioonikordaja võimaldab arvutusi lihtsustada, luues muutujate väärtuste hierarhia.

Muutujate vahelised seosed

Korrelatsioon aitab vastata kahele küsimusele. Esiteks, kas muutujate vaheline seos on positiivne või negatiivne. Teiseks, kui tugev on sõltuvus. Korrelatsioonianalüüs on võimas tööriist, mis võib selle olulise teabe anda. On hästi näha, et pere sissetulekud ja kulud proportsionaalselt langevad ja kasvavad. Seda suhet peetakse positiivseks. Vastupidi, kui toote hind tõuseb, siis nõudlus selle järele langeb. Seda suhet nimetatakse negatiivseks. Korrelatsioonikoefitsiendi väärtused jäävad vahemikku -1 kuni 1. Null tähendab, et uuritavate väärtuste vahel puudub seos. Mida lähemal on saadud näitaja äärmuslikele väärtustele, seda tugevam on seos (negatiivne või positiivne). Sõltuvuse puudumist näitab koefitsient -0,1 kuni 0,1. Peate mõistma, et selline väärtus näitab ainult lineaarse seose puudumist.

Rakenduse omadused

Mõlema näitaja kasutamine hõlmab teatud eeldusi. Esiteks ei määra tugeva seose olemasolu seda, et üks suurus määrab teise. Võib olla ka kolmas suurus, mis määrab igaüks neist. Teiseks, kõrge Pearsoni korrelatsioonikoefitsient ei näita põhjus-tagajärg seost uuritud muutujate vahel. Kolmandaks näitab see eranditult lineaarset seost. Korrelatsiooni saab kasutada tähenduslike kvantitatiivsete andmete (nt õhurõhk, õhutemperatuur) hindamiseks, mitte kategooriate, nagu sugu või lemmikvärv, hindamiseks.

Mitmekordne korrelatsioonikordaja

Pearson ja Spearman uurisid kahe muutuja vahelist seost. Aga mis teha, kui neid on kolm või isegi rohkem. Siin tuleb appi mitmekordne korrelatsioonikordaja. Näiteks ei mõjuta rahvamajanduse kogutoodangut mitte ainult välismaised otseinvesteeringud, vaid ka valitsuse raha- ja fiskaalpoliitika ning ekspordi tase. SKP kasvutempo ja maht on mitmete tegurite koosmõju tulemus. Siiski tuleb mõista, et mitme korrelatsiooni mudel põhineb mitmel lihtsustusel ja eeldusel. Esiteks on välistatud väärtuste multikollineaarsus. Teiseks loetakse lineaarseks seos sõltuva ja seda mõjutavate muutujate vahel.

Korrelatsioon- ja regressioonanalüüsi kasutusvaldkonnad

Seda suuruste vaheliste seoste leidmise meetodit kasutatakse statistikas laialdaselt. Kõige sagedamini kasutatakse seda kolmel põhijuhul:

  1. Kahe muutuja väärtuste põhjus-tagajärg seoste testimiseks. Selle tulemusena loodab teadlane avastada lineaarse seose ja tuletada valemi, mis kirjeldab neid seoseid suuruste vahel. Nende mõõtühikud võivad olla erinevad.
  2. Kogustevahelise seose kontrollimiseks. Sel juhul ei määra keegi, milline muutuja on sõltuv muutuja. Võib selguda, et mõlema suuruse väärtuse määrab mõni muu tegur.
  3. Eq. Sel juhul saate sellesse lihtsalt numbrid asendada ja tundmatu muutuja väärtused teada saada.

Mees otsib põhjuse-tagajärje suhet

Teadvus on kujundatud nii, et meil on kindlasti vaja selgitada sündmusi, mis meie ümber toimuvad. Inimene otsib alati seost maailmapildi, milles ta elab, ja saadud informatsiooni vahel. Aju loob sageli korra kaosest. Ta suudab kergesti näha põhjuse-tagajärje seost seal, kus seda pole. Teadlased peavad konkreetselt õppima sellest tendentsist üle saama. Oskus andmevahelisi suhteid objektiivselt hinnata on akadeemilises karjääris hädavajalik.

Meedia eelarvamus

Mõelgem, kuidas saab korrelatsiooni olemasolu valesti tõlgendada. Rühmalt halva käitumisega Briti õpilasi küsiti, kas nende vanemad suitsetavad. Siis avaldati test ajalehes. Tulemus näitas tugevat seost vanemate suitsetamise ja nende laste kuritegevuse vahel. Selle uuringu läbi viinud professor soovitas isegi sigaretipakkidele selle kohta hoiatuse panna. Selle järeldusega on aga mitmeid probleeme. Esiteks ei näita korrelatsioon, milline suurus on sõltumatu. Seetõttu on täiesti võimalik eeldada, et vanemate kahjuliku harjumuse põhjuseks on laste sõnakuulmatus. Teiseks ei saa kindlalt väita, et mõlemad probleemid ei tekkinud mingi kolmanda teguri tõttu. Näiteks madala sissetulekuga pered. Märkimist väärib uuringu läbiviija professori esialgsete leidude emotsionaalne aspekt. Ta oli tulihingeline suitsetamise vastane. Seetõttu pole üllatav, et ta oma uurimistöö tulemusi nii tõlgendas.

järeldused

Korrelatsiooni väär tõlgendamine kahe muutuja põhjus-tagajärg seosena võib põhjustada häbiväärseid uurimisvigu. Probleem on selles, et see on inimese teadvuse alus. Paljud turundusnipid põhinevad sellel funktsioonil. Põhjuse ja tagajärje erinevuse ning korrelatsiooni mõistmine võimaldab teil teavet ratsionaalselt analüüsida nii igapäevaelus kui ka tööalases karjääris.

Uurides rahvatervist ja tervishoidu teaduslikel ja praktilistel eesmärkidel, peab uurija sageli läbi viima statistilise üldkogumi teguri- ja tulemusnäitajate vaheliste seoste statistilise analüüsi (põhjuslik seos) või määrama selle populatsiooni mitme tunnuse paralleelsete muutuste sõltuvuse. mõnel kolmandal väärtusel (nende ühisel põhjusel). On vaja uurida selle ühenduse omadusi, määrata selle suurus ja suund ning hinnata ka selle usaldusväärsust. Sel eesmärgil kasutatakse korrelatsioonimeetodeid.

  1. Tunnuste vaheliste kvantitatiivsete seoste avaldumise tüübid
    • funktsionaalne ühendus
    • korrelatsiooniühendus
  2. Funktsionaalse ja korrelatsioonilise seose mõisted

    Funktsionaalne ühendus- seda tüüpi seos kahe tunnuse vahel, kui ühe neist väärtus vastab teise rangelt määratletud väärtusele (ringi pindala sõltub ringi raadiusest jne). Funktsionaalne seos on iseloomulik füüsikalistele ja matemaatilistele protsessidele.

    Korrelatsioon- selline seos, kus ühe tunnuse iga konkreetne väärtus vastab mitmele teise tunnuse väärtusele, mis on sellega omavahel seotud (inimese pikkuse ja kaalu suhe; kehatemperatuuri ja pulsisageduse suhe jne). Korrelatsioon on tüüpiline meditsiinilistele ja bioloogilistele protsessidele.

  3. Korrelatsiooniseose loomise praktiline tähendus. Põhjus-tagajärje seoste väljaselgitamine teguri- ja tulemusnäitajate vahel (füüsilise arengu hindamisel töötingimuste, elutingimuste ja tervisliku seisundi vahelise seose väljaselgitamiseks, haigusjuhtude esinemissageduse sõltuvuse määramisel vanusest, tööstaažist tööohtude olemasolu jne)

    Mitme tunnuse paralleelsete muutuste sõltuvus mõnest kolmandast väärtusest. Näiteks töökojas kõrge temperatuuri mõjul tekivad muutused vererõhus, vere viskoossuses, pulsisageduses jne.

  4. Tunnustevahelise seose suunda ja tugevust iseloomustav väärtus. Korrelatsioonikordaja, mis ühes numbris annab aimu märkide (nähtuste) vahelise seose suunast ja tugevusest, selle kõikumise piiridest 0 kuni ± 1
  5. Korrelatsioonide esitamise meetodid
    • graafik (hajuvusdiagramm)
    • korrelatsioonikordaja
  6. Korrelatsiooni suund
    • sirge
    • tagurpidi
  7. Korrelatsiooni tugevus
    • tugev: ±0,7 kuni ±1
    • keskmine: ±0,3 kuni ±0,699
    • nõrk: 0 kuni ±0,299
  8. Korrelatsioonikordaja määramise meetodid ja valemid
    • ruutude meetod (Pearsoni meetod)
    • järjestuse meetod (Spearmani meetod)
  9. Korrelatsioonikordaja kasutamise metoodilised nõuded
    • seose mõõtmine on võimalik ainult kvalitatiivselt homogeensetes populatsioonides (näiteks pikkuse ja kaalu suhte mõõtmine soo ja vanuse järgi homogeensetes populatsioonides)
    • arvutamiseks võib kasutada absoluutväärtusi või tuletatud väärtusi
    • korrelatsioonikordaja arvutamiseks kasutatakse grupeerimata variatsiooniridu (see nõue kehtib ainult korrelatsioonikordaja arvutamisel ruutude meetodil)
    • vaatluste arv vähemalt 30
  10. Soovitused astmekorrelatsiooni meetodi kasutamiseks (Spearmani meetod)
    • kui pole vaja ühenduse tugevust täpselt kindlaks teha, kuid piisab ligikaudsetest andmetest
    • kui tunnuseid esindavad mitte ainult kvantitatiivsed, vaid ka omistatavad väärtused
    • kui tunnuste jaotussarjadel on avatud valikud (näiteks töökogemus kuni 1 aasta jne)
  11. Soovitused ruutude meetodi kasutamiseks (Pearsoni meetod)
    • kui on vaja täpselt määrata omaduste vahelise seose tugevus
    • kui märkidel on ainult kvantitatiivne väljendus
  12. Korrelatsioonikordaja arvutamise metoodika ja kord

    1) Ruudude meetod

    2) Järjekorra meetod

  13. Skeem korrelatsioonisuhte hindamiseks korrelatsioonikordaja abil
  14. Korrelatsioonikordaja vea arvutamine
  15. Astekorrelatsiooni meetodil ja ruutude meetodil saadud korrelatsioonikordaja usaldusväärsuse hindamine

    1. meetod
    Töökindlus määratakse järgmise valemiga:

    Kriteeriumi t hinnatakse t väärtuste tabeli abil, võttes arvesse vabadusastmete arvu (n - 2), kus n on seotud valikute arv. Kriteerium t peab olema võrdne tabeliga või sellest suurem, mis vastab tõenäosusele p ≥99%.

    2. meetod
    Usaldusväärsust hinnatakse standardsete korrelatsioonikordajate spetsiaalse tabeli abil. Sel juhul peetakse korrelatsioonikordajat usaldusväärseks, kui see on teatud arvu vabadusastmete (n - 2) korral võrdne tabeliga või sellest suurem, mis vastab veavaba prognoosi astmele p ≥95%. .

kasutada ruutude meetodit

Harjutus: arvutada korrelatsioonikoefitsient, määrata kindlaks vees sisalduva kaltsiumi koguse ja vee kareduse vahelise seose suund ja tugevus, kui on teada järgmised andmed (tabel 1). Hinnake suhte usaldusväärsust. Tehke järeldus.

Tabel 1

Meetodi valiku põhjendus.Ülesande lahendamiseks valiti ruutude meetod (Pearson), kuna igal märgil (vee karedus ja kaltsiumi kogus) on arvuline avaldis; avatud võimalust pole.

Lahendus.
Arvutuste järjekord on kirjeldatud tekstis, tulemused on toodud tabelis. Olles koostanud paaris võrreldavate karakteristikute jada, tähistage neid x-ga (vee karedus kraadides) ja y-ga (kaltsiumi sisaldus vees mg/l).

Vee karedus
(kraadides)
Kaltsiumi kogus vees
(mg/l)
d x d a d x x d y d x 2 d a 2
4
8
11
27
34
37
28
56
77
191
241
262
-16
-12
-9
+7
+14
+16
-114
-86
-66
+48
+98
+120
1824
1032
594
336
1372
1920
256
144
81
49
196
256
12996
7396
4356
2304
9604
14400
M x =Σ x / n M y =Σ y / n Σ d x x d y =7078 Σ d x 2 = 982 Σ d y 2 = 51056
M x = 120/6 = 20 M = 852/6 = 142
  1. Määrake M x reavalikus “x” ja M y reavalikus “y” järgmiste valemite abil:
    M x = Σх/n (1. veerg) ja
    M y = Σу/n (veerg 2)
  2. Leidke iga variandi kõrvalekalle (d x ja d y) rea “x” ja “y” arvutatud keskmisest
    d x = x - M x (veerg 3) ja d y = y - M y (veerg 4).
  3. Leidke kõrvalekallete d x x d y korrutis ja summeerige need: Σ d x x d y (veerg 5)
  4. Ruudutage kõik kõrvalekalded d x ja d y ning liidage nende väärtused piki "x" ja "y" seeriat: Σ d x 2 = 982 (veerg 6) ja Σ d y 2 = 51056 (veerg 7).
  5. Määrake korrutis Σ d x 2 x Σ d y 2 ja eraldage sellest korrutisest ruutjuur
  6. Saadud väärtused Σ (d x x d y) ja √ (Σd x 2 x Σd y 2) asendada korrelatsioonikordaja arvutamise valemiga:
  7. Määrake korrelatsioonikordaja usaldusväärsus:
    1. meetod. Leidke valemite abil korrelatsioonikordaja (mr xy) ja t-kriteeriumi viga:

    Kriteerium t = 14,1, mis vastab veavaba prognoosi tõenäosusele p > 99,9%.

    2. meetod. Korrelatsioonikordaja usaldusväärsust hinnatakse tabeli “Standardkorrelatsioonikordajad” (vt lisa 1) abil. Vabadusastmete arvuga (n - 2) = 6 - 2 = 4 on meie arvutatud korrelatsioonikordaja r xу = + 0,99 suurem kui tabelina toodud (r tabel = + 0,917 p = 99%).

    Järeldus. Mida rohkem kaltsiumi vees, seda kõvem see on (ühendus otsene, tugev ja autentne: r xy = + 0,99, p > 99,9%).

    kasutada järjestusmeetodit

    Harjutus: Järgmiste andmete saamise korral määrake järgmeetodi abil kindlaks aastatepikkuse töökogemuse ja vigastuste sageduse vahelise seose suund ja tugevus:

    Meetodi valimise põhjendus:Ülesande lahendamiseks saab valida ainult auaste korrelatsioonimeetodi, sest Atribuudi “töökogemus aastates” esimesel real on avatud valikud (töökogemus kuni 1 aasta ja 7 või enam aastat), mis ei võimalda ühenduse loomiseks kasutada täpsemat meetodit - ruutude meetodit. võrreldavate omaduste vahel.

    Lahendus. Arvutuste järjekord on toodud tekstis, tulemused on toodud tabelis. 2.

    tabel 2

    Töökogemus aastates Vigastuste arv Järjearvud (järgud) Auastme erinevus Auastmete erinevus ruudus
    X Y d(x-y) d 2
    Kuni 1 aasta 24 1 5 -4 16
    1-2 16 2 4 -2 4
    3-4 12 3 2,5 +0,5 0,25
    5-6 12 4 2,5 +1,5 2,25
    7 või rohkem 6 5 1 +4 16
    Σ d2 = 38,5

    Standardsed korrelatsioonikoefitsiendid, mida peetakse usaldusväärseks (L.S. Kaminsky järgi)

    Vabadusastmete arv - 2 Tõenäosuse tase p (%)
    95% 98% 99%
    1 0,997 0,999 0,999
    2 0,950 0,980 0,990
    3 0,878 0,934 0,959
    4 0,811 0,882 0,917
    5 0,754 0,833 0,874
    6 0,707 0,789 0,834
    7 0,666 0,750 0,798
    8 0,632 0,716 0,765
    9 0,602 0,885 0,735
    10 0,576 0,858 0,708
    11 0,553 0,634 0,684
    12 0,532 0,612 0,661
    13 0,514 0,592 0,641
    14 0,497 0,574 0,623
    15 0,482 0,558 0,606
    16 0,468 0,542 0,590
    17 0,456 0,528 0,575
    18 0,444 0,516 0,561
    19 0,433 0,503 0,549
    20 0,423 0,492 0,537
    25 0,381 0,445 0,487
    30 0,349 0,409 0,449

    1. Vlasov V.V. Epidemioloogia. - M.: GEOTAR-MED, 2004. - 464 lk.
    2. Lisitsyn Yu.P. Rahvatervis ja tervishoid. Õpik ülikoolidele. - M.: GEOTAR-MED, 2007. - 512 lk.
    3. Arst V.A., Jurjev V.K. Rahvatervise ja tervishoiu loengute kursus: 1. osa. Rahvatervis. - M.: Meditsiin, 2003. - 368 lk.
    4. Minjajev V.A., Višnjakov N.I. ja teised.Sotsiaalmeditsiin ja tervishoiukorraldus (käsiraamat 2 köites). - Peterburi, 1998. -528 lk.
    5. Kutšerenko V.Z., Agarkov N.M. ja teised Sotsiaalhügieeni ja tervishoiu korraldus (õpetus) - Moskva, 2000. - 432 lk.
    6. S. Glanz. Meditsiiniline ja bioloogiline statistika. Tõlge inglise keelest - M., Praktika, 1998. - 459 lk.
Pange tähele! Teie konkreetse probleemi lahendus näeb välja sarnane sellele näitele, mis sisaldab kõiki allolevaid tabeleid ja selgitavaid tekste, kuid võttes arvesse teie algandmeid...

Ülesanne:
Seotud valim koosneb 26 väärtuste paarist (x k, y k):

k 1 2 3 4 5 6 7 8 9 10
x k 25.20000 26.40000 26.00000 25.80000 24.90000 25.70000 25.70000 25.70000 26.10000 25.80000
y k 30.80000 29.40000 30.20000 30.50000 31.40000 30.30000 30.40000 30.50000 29.90000 30.40000

k 11 12 13 14 15 16 17 18 19 20
x k 25.90000 26.20000 25.60000 25.40000 26.60000 26.20000 26.00000 22.10000 25.90000 25.80000
y k 30.30000 30.50000 30.60000 31.00000 29.60000 30.40000 30.70000 31.60000 30.50000 30.60000

k 21 22 23 24 25 26
x k 25.90000 26.30000 26.10000 26.00000 26.40000 25.80000
y k 30.70000 30.10000 30.60000 30.50000 30.70000 30.80000

Arvutamiseks/graafiku tegemiseks vajalik:
- korrelatsioonikordaja;
- testida hüpoteesi juhuslike suuruste X ja Y sõltuvusest, olulisuse tasemel α = 0,05;
- lineaarse regressiooni võrrandi koefitsiendid;
- hajuvusdiagramm (korrelatsiooniväli) ja regressioonijoongraafik;

LAHENDUS:

1. Arvutage korrelatsioonikordaja.

Korrelatsioonikordaja on kahe juhusliku suuruse vastastikuse tõenäosusliku mõju näitaja. Korrelatsioonikordaja R võib võtta väärtusi -1 enne +1 . Kui absoluutväärtus on lähemal 1 , siis on see tõend tugevast seosest koguste vahel ja kui sellele lähemal 0 - siis see näitab nõrka ühendust või selle puudumist. Kui absoluutväärtus R võrdub ühega, siis saame rääkida suurustevahelisest funktsionaalsest seosest ehk üht suurust saab väljendada teise kaudu, kasutades matemaatilist funktsiooni.


Korrelatsioonikordaja saab arvutada järgmiste valemite abil:
n
Σ
k = 1
(x k -M x) 2, σ y 2 =
M x =
1
n
n
Σ
k = 1
xk, minu a =

või valemi järgi

Rx, y =
K xy – K x M a
S x S y
(1.4), kus:
M x =
1
n
n
Σ
k = 1
xk, minu a =
1
n
n
Σ
k = 1
y k , Mxy =
1
n
n
Σ
k = 1
x k y k (1,5)
S x 2 =
1
n
n
Σ
k = 1
x k 2 - M x 2, S y 2 =
1
n
n
Σ
k = 1
y k 2 – M y 2 (1,6)

Praktikas kasutatakse korrelatsioonikordaja arvutamiseks sagedamini valemit (1.4), sest see nõuab vähem arvutusi. Kui aga kovariatsioon oli eelnevalt arvutatud cov (X,Y), siis on kasulikum kasutada valemit (1.1), sest Lisaks kovariatsiooni väärtusele endale saate kasutada ka vahearvutuste tulemusi.

1.1 Arvutame korrelatsioonikordaja valemi (1.4) abil, selleks arvutame x k 2, y k 2 ja x k y k väärtused ning sisestame need tabelisse 1.

Tabel 1


k
x k y k x k 2 y k 2 x ky k
1 2 3 4 5 6
1 25.2 30.8 635.04000 948.64000 776.16000
2 26.4 29.4 696.96000 864.36000 776.16000
3 26.0 30.2 676.00000 912.04000 785.20000
4 25.8 30.5 665.64000 930.25000 786.90000
5 24.9 31.4 620.01000 985.96000 781.86000
6 25.7 30.3 660.49000 918.09000 778.71000
7 25.7 30.4 660.49000 924.16000 781.28000
8 25.7 30.5 660.49000 930.25000 783.85000
9 26.1 29.9 681.21000 894.01000 780.39000
10 25.8 30.4 665.64000 924.16000 784.32000
11 25.9 30.3 670.81000 918.09000 784.77000
12 26.2 30.5 686.44000 930.25000 799.10000
13 25.6 30.6 655.36000 936.36000 783.36000
14 25.4 31 645.16000 961.00000 787.40000
15 26.6 29.6 707.56000 876.16000 787.36000
16 26.2 30.4 686.44000 924.16000 796.48000
17 26 30.7 676.00000 942.49000 798.20000
18 22.1 31.6 488.41000 998.56000 698.36000
19 25.9 30.5 670.81000 930.25000 789.95000
20 25.8 30.6 665.64000 936.36000 789.48000
21 25.9 30.7 670.81000 942.49000 795.13000
22 26.3 30.1 691.69000 906.01000 791.63000
23 26.1 30.6 681.21000 936.36000 798.66000
24 26 30.5 676.00000 930.25000 793.00000
25 26.4 30.7 696.96000 942.49000 810.48000
26 25.8 30.8 665.64000 948.64000 794.64000


1.2. Arvutame valemi (1.5) abil M x.

1.2.1. x k

x 1 + x 2 + … + x 26 = 25,20000 + 26,40000 + ... + 25,80000 = 669,500000

1.2.2.

669.50000 / 26 = 25.75000

M x = 25,750000

1.3. Arvutame M y sarnaselt.

1.3.1. Lisame kõik elemendid järjestikku y k

y 1 + y 2 + … + y 26 = 30,80000 + 29,40000 + ... + 30,80000 = 793,000000

1.3.2. Jagage saadud summa näidiselementide arvuga

793.00000 / 26 = 30.50000

M y = 30,500000

1.4. Samamoodi arvutame M xy.

1.4.1. Lisame järjestikku kõik tabeli 1 6. veeru elemendid

776.16000 + 776.16000 + ... + 794.64000 = 20412.830000

1.4.2. Jagage saadud summa elementide arvuga

20412.83000 / 26 = 785.10885

M xy = 785,108846

1.5. Arvutame S x 2 väärtuse valemi (1.6.) abil..

1.5.1. Lisame järjestikku kõik tabeli 1 4. veeru elemendid

635.04000 + 696.96000 + ... + 665.64000 = 17256.910000

1.5.2. Jagage saadud summa elementide arvuga

17256.91000 / 26 = 663.72731

1.5.3. S x 2 väärtuse saamiseks lahutage viimasest arvust ruut M x

S x 2 = 663.72731 - 25.75000 2 = 663.72731 - 663.06250 = 0.66481

1.6. Arvutame S y 2 väärtuse valemi (1.6.) abil..

1.6.1. Lisame järjestikku kõik tabeli 1 5. veeru elemendid

948.64000 + 864.36000 + ... + 948.64000 = 24191.840000

1.6.2. Jagage saadud summa elementide arvuga

24191.84000 / 26 = 930.45538

1.6.3. S y 2 väärtuse saamiseks lahutage viimasest arvust M y ruut

S y 2 = 930.45538 - 30.50000 2 = 930.45538 - 930.25000 = 0.20538

1.7. Arvutame suuruste S x 2 ja S y 2 korrutise.

S x 2 S y 2 = 0,66481 0,20538 = 0,136541

1.8. Võtame viimase arvu ruutjuure ja saame väärtuse S x S y.

S x S y = 0,36951

1.9. Arvutame korrelatsioonikordaja väärtuse valemi (1.4.) abil..

R = (785,10885 - 25,75000 30,50000) / 0,36951 = (785,10885 - 785,37500) / 0,36951 = -0,72028

VASTUS: R x,y = -0,720279

2. Kontrollime korrelatsioonikordaja olulisust (kontrollime sõltuvuse hüpoteesi).

Kuna korrelatsioonikordaja hinnang arvutatakse lõpliku valimi põhjal ja seetõttu võib see populatsiooni väärtusest erineda, on vaja testida korrelatsioonikordaja olulisust. Kontrollimine toimub t-testi abil:

t =
Rx, y
n - 2
1 - R 2 x,y
(2.1)

Juhuslik väärtus t järgib Studenti t-jaotust ja t-jaotuse tabelit kasutades on vaja leida kriteeriumi kriitiline väärtus (t cr.α) etteantud olulisuse tasemel α. Kui valemiga (2.1) arvutatud t absoluutväärtuses osutub väiksemaks kui t cr.α , siis juhuslike suuruste X ja Y vahel sõltuvust ei ole. Vastasel juhul ei ole katseandmed vastuolus hüpoteesiga juhuslike suuruste sõltuvuse kohta.


2.1. Arvutame valemi (2.1) abil t-kriteeriumi väärtuse ja saame:
t =
-0.72028
26 - 2
1 - (-0.72028) 2
= -5.08680

2.2. t-jaotustabeli abil määrame parameetri t cr.α kriitilise väärtuse

tcr.α soovitud väärtus asub vabadusastmete arvule vastava rea ​​ja antud olulisustasemele α vastava veeru ristumiskohas.
Meie puhul on vabadusastmete arv n - 2 = 26 - 2 = 24 ja α = 0.05 , mis vastab kriteeriumi kriitilisele väärtusele t cr.α = 2.064 (vt tabel 2)

tabel 2 t-jaotus

Vabadusastmete arv
(n - 2)
α = 0,1 α = 0,05 α = 0,02 α = 0,01 α = 0,002 α = 0,001
1 6.314 12.706 31.821 63.657 318.31 636.62
2 2.920 4.303 6.965 9.925 22.327 31.598
3 2.353 3.182 4.541 5.841 10.214 12.924
4 2.132 2.776 3.747 4.604 7.173 8.610
5 2.015 2.571 3.365 4.032 5.893 6.869
6 1.943 2.447 3.143 3.707 5.208 5.959
7 1.895 2.365 2.998 3.499 4.785 5.408
8 1.860 2.306 2.896 3.355 4.501 5.041
9 1.833 2.262 2.821 3.250 4.297 4.781
10 1.812 2.228 2.764 3.169 4.144 4.587
11 1.796 2.201 2.718 3.106 4.025 4.437
12 1.782 2.179 2.681 3.055 3.930 4.318
13 1.771 2.160 2.650 3.012 3.852 4.221
14 1.761 2.145 2.624 2.977 3.787 4.140
15 1.753 2.131 2.602 2.947 3.733 4.073
16 1.746 2.120 2.583 2.921 3.686 4.015
17 1.740 2.110 2.567 2.898 3.646 3.965
18 1.734 2.101 2.552 2.878 3.610 3.922
19 1.729 2.093 2.539 2.861 3.579 3.883
20 1.725 2.086 2.528 2.845 3.552 3.850
21 1.721 2.080 2.518 2.831 3.527 3.819
22 1.717 2.074 2.508 2.819 3.505 3.792
23 1.714 2.069 2.500 2.807 3.485 3.767
24 1.711 2.064 2.492 2.797 3.467 3.745
25 1.708 2.060 2.485 2.787 3.450 3.725
26 1.706 2.056 2.479 2.779 3.435 3.707
27 1.703 2.052 2.473 2.771 3.421 3.690
28 1.701 2.048 2.467 2.763 3.408 3.674
29 1.699 2.045 2.462 2.756 3.396 3.659
30 1.697 2.042 2.457 2.750 3.385 3.646
40 1.684 2.021 2.423 2.704 3.307 3.551
60 1.671 2.000 2.390 2.660 3.232 3.460
120 1.658 1.980 2.358 2.617 3.160 3.373
1.645 1.960 2.326 2.576 3.090 3.291


2.2. Võrdleme t-kriteeriumi absoluutväärtust ja t cr.α

t-kriteeriumi absoluutväärtus ei ole väiksem kui kriitiline väärtus t = 5,08680, t cr.α = 2,064, seega katseandmed, tõenäosusega 0,95(1 - α), ei ole hüpoteesiga vastuolus juhuslike suuruste X ja Y sõltuvuse kohta.

3. Arvutage lineaarse regressiooni võrrandi koefitsiendid.

Lineaarne regressioonivõrrand on sirgjoone võrrand, mis lähendab (ligikaudselt kirjeldab) juhuslike muutujate X ja Y vahelist seost. Kui eeldame, et väärtus X on vaba ja Y sõltub X-st, kirjutatakse regressioonivõrrand järgmiselt. järgneb


Y = a + b X (3.1), kus:

b =Rx, y
σy
σx
= Rx, y
S y
S x
(3.2),
a = M y - b M x (3,3)

Valemi (3.2) abil arvutatud koefitsient b nimetatakse lineaarseks regressioonikordajaks. Mõnes allikas a nimetatakse konstantseks regressioonikoefitsiendiks ja b muutujate järgi.

Vead Y ennustamisel antud väärtuse X jaoks arvutatakse valemite abil:

Nimetatakse ka suurust σ y/x (valem 3.4). jääkstandardhälve, iseloomustab see väärtuse Y kõrvalekaldumist võrrandiga (3.1) kirjeldatud regressioonijoonest X fikseeritud (antud) väärtuse korral.

.
Sy 2 / S x 2 = 0,20538 / 0,66481 = 0,30894. Võtame viimase arvu ruutjuure ja saame:
Sy/Sx = 0,55582

3.3 Arvutame koefitsiendi b vastavalt valemile (3.2)

b = -0.72028 0.55582 = -0.40035

3.4 Arvutame koefitsiendi a vastavalt valemile (3.3)

a = 30.50000 - (-0.40035 25.75000) = 40.80894

3.5 Hindame regressioonivõrrandi vigu.

3.5.1 Võttes S y 2 ruutjuure saame:

= 0.31437
3.5.4 Arvutame suhtelise vea valemi (3.5) abil

δ y/x = (0,31437 / 30,50000)100% = 1,03073%

4. Koostame hajuvusdiagrammi (korrelatsioonivälja) ja regressioonijoongraafiku.

Hajudiagramm on vastavate paaride (x k, y k) graafiline esitus punktidena tasapinnal, ristkülikukujulistes koordinaatides teljega X ja Y. Korrelatsiooniväli on üks seotud (paaris) valimi graafilistest esitustest. Samasse koordinaatsüsteemi joonistatakse ka regressioonijoongraafik. Skaalad ja lähtepunktid telgedel tuleks valida hoolikalt, et diagramm oleks võimalikult selge.

4.1. Leia valimi minimaalne ja maksimaalne element X on vastavalt 18. ja 15. element, x min = 22,10000 ja x max = 26,60000.

4.2. Leiame, et valimi Y minimaalne ja maksimaalne element on vastavalt 2. ja 18. element, y min = 29,40000 ja y max = 31,60000.

4.3. Vali x-teljel punktist x 18 = 22,10000 veidi vasakul asuv alguspunkt ja selline skaala, et punkt x 15 = 26,60000 mahuks teljele ja ülejäänud punktid oleksid selgelt nähtavad.

4.4. Ordinaatteljel vali lähtepunkt punktist y 2 = 29,40000 veidi vasakule ja selline skaala, et punkt y 18 = 31,60000 mahuks teljele ja ülejäänud punktid oleksid selgelt eristatavad.

4.5. Asetame x k väärtused abstsissteljele ja y k väärtused ordinaatteljele.

4.6. Punktid (x 1, y 1), (x 2, y 2),…, (x 26, y 26) joonistame koordinaattasandile. Saame hajuvusdiagrammi (korrelatsioonivälja), mis on näidatud alloleval joonisel.

4.7. Joonistame regressioonisirge.

Selleks leiame kaks erinevat punkti koordinaatidega (x r1, y r1) ja (x r2, y r2), mis rahuldavad võrrandit (3.6), kanname need koordinaattasandile ja tõmbame läbi nende sirge. Esimese punkti abstsissina võtame väärtuse x min = 22,10000. Asendades võrrandi (3.6) väärtuse x min, saame esimese punkti ordinaadi. Seega on meil punkt koordinaatidega (22.10000, 31.96127). Sarnasel viisil saame teise punkti koordinaadid, pannes abstsissiks väärtuse x max = 26,60000. Teine punkt on: (26.60000, 30.15970).

Regressioonijoon on näidatud alloleval joonisel punaselt

Pange tähele, et regressioonisirge läbib alati X ja Y keskmiste väärtuste punkti, st. koordinaatidega (M x , M y).

06.06.2018 16 235 0 Igor

Psühholoogia ja ühiskond

Kõik maailmas on omavahel seotud. Iga inimene püüab intuitsiooni tasandil leida seoseid nähtuste vahel, et suuta neid mõjutada ja kontrollida. Seda seost kajastavat kontseptsiooni nimetatakse korrelatsiooniks. Mida see lihtsate sõnadega tähendab?

Sisu:

Korrelatsiooni mõiste

Korrelatsioon (ladina sõnast "correlatio" - suhe, suhe)– matemaatiline termin, mis tähendab juhuslike suuruste (muutujate) statistilise tõenäosusliku sõltuvuse mõõtu.



Näide: Võtame kahte tüüpi suhteid:

  1. Esiteks- pliiats inimese käes. Millises suunas käsi liigub, selles suunas pliiats. Kui käsi on puhkeasendis, siis pliiats ei kirjuta. Kui inimene seda veidi tugevamalt vajutab, jääb paberile jääv märk rikkalikum. Seda tüüpi suhted peegeldavad ranget sõltuvust ega ole korrelatsioonilised. See suhe on funktsionaalne.
  2. Teine tüüp– seos inimese haridustaseme ja kirjanduse lugemise vahel. Ei ole ette teada, millised inimesed loevad rohkem: kas kõrgharidusega või kõrghariduseta. See seos on juhuslik või stohhastiline, seda uurib statistikateadus, mis tegeleb eranditult massinähtustega. Kui statistiline arvutus võimaldab tõestada korrelatsiooni haridustaseme ja kirjanduse lugemise vahel, siis see võimaldab teha mis tahes prognoose ja ennustada sündmuste tõenäosuslikku toimumist. Selle näite puhul võib suure tõenäosusega väita, et kõrgharidusega inimesed, haritumad, loevad rohkem raamatuid. Kuid kuna nende parameetrite vaheline seos ei ole funktsionaalne, võime eksida. Alati saate arvutada sellise vea tõenäosuse, mis on selgelt väike ja mida nimetatakse statistilise olulisuse tasemeks (p).

Loodusnähtuste vaheliste seoste näited on järgmised: toiduahel looduses, inimkeha, mis koosneb omavahel seotud ja ühtse tervikuna toimivatest organsüsteemidest.

Iga päev kohtame igapäevaelus seoseid: ilma ja hea tuju, eesmärkide õige sõnastamise ja nende saavutamise, positiivse suhtumise ja õnne, õnnetunde ja rahalise heaolu vahel. Kuid me otsime seoseid, tuginedes mitte matemaatilistele arvutustele, vaid müütidele, intuitsioonile, ebausule ja tühisele spekulatsioonile. Neid nähtusi on väga raske matemaatilisse keelde tõlkida, arvudes väljendada ja mõõta. Teine asi on see, kui analüüsime nähtusi, mida saab arvutada ja arvude kujul esitada. Sel juhul saame korrelatsiooni defineerida korrelatsioonikordaja (r) abil, mis peegeldab juhuslike suuruste vahelise korrelatsiooni tugevust, astet, lähedust ja suunda.

Tugev korrelatsioon juhuslike muutujate vahel- tõendid mõne statistilise seose olemasolu kohta konkreetselt nende nähtuste vahel, kuid seda seost ei saa üle kanda samadele nähtustele, vaid erineva olukorra jaoks. Sageli teevad teadlased, saades oma arvutustes kahe muutuja vahel olulise korrelatsiooni, lähtudes korrelatsioonianalüüsi lihtsusest, valesid intuitiivseid oletusi tunnuste vahel põhjus-tagajärg seoste olemasolu kohta, unustades, et korrelatsioonikordaja on oma olemuselt tõenäosuslik. .

Näide: jääoludes vigastatute arv ja liiklusõnnetuste arv mootorsõidukite seas. Need kogused korreleeruvad üksteisega, kuigi need pole absoluutselt omavahel seotud, vaid neil on seos ainult nende juhuslike sündmuste ühise põhjusega - musta jääga. Kui analüüs ei näita nähtuste vahelist seost, ei ole see veel tõend nendevahelise sõltuvuse puudumise kohta, mis võib olla keeruline mittelineaarne ja mida korrelatsiooniarvutused ei paljasta.




Esimesena tõid korrelatsiooni mõiste teaduslikku kasutusse prantslased paleontoloog Georges Cuvier. 18. sajandil tuletas ta elusorganismide osade ja elundite korrelatsiooniseaduse, tänu millele sai leitud kehaosadest (jäänustest) võimalikuks taastada terve fossiilse olendi, looma välimus. Statistikas kasutas terminit korrelatsioon esmakordselt 1886. aastal inglise teadlane Francis Galton. Kuid ta ei suutnud tuletada täpset korrelatsioonikordaja arvutamise valemit, kuid tema õpilane tegi seda - kuulus matemaatik ja bioloog Karl Pearson.

Korrelatsiooni tüübid

Tähtsuse järgi– väga oluline, oluline ja ebaoluline.

Liigid

millega r on võrdne

Väga oluline

r vastab statistilise olulisuse tasemele p<=0,01

Märkimisväärne

r vastab p<=0,05

Ebaoluline

r ei ulatu p>0,1-ni

Negatiivne(ühe muutuja väärtuse vähenemine toob kaasa teise taseme tõusu: mida rohkem on inimesel foobiaid, seda väiksem on tõenäosus, et ta võtab juhipositsiooni) ja positiivne (kui ühe muutuja suurenemine toob kaasa tõusu teise tasandil: mida närvilisem sa oled, seda suurem on tõenäosus haigestuda). Kui muutujate vahel seos puudub, siis nimetatakse sellist korrelatsiooni nulliks.

Lineaarne(kui üks väärtus suureneb või väheneb, suureneb või väheneb ka teine) ja mittelineaarne (kui ühe väärtuse muutumisel ei saa teise väärtuse muutumise olemust kirjeldada lineaarse seose abil, siis rakendatakse muid matemaatilisi seadusi - polünoom, hüperbool suhted).

Tugevuse järgi.

Koefitsiendid




Sõltuvalt sellest, millisesse skaalasse uuritavad muutujad kuuluvad, arvutatakse erinevat tüüpi korrelatsioonikordajad:

  1. Pearsoni korrelatsioonikordaja, paariline lineaarne korrelatsioonikordaja või korrelatsioonimomendi korrelatsioon arvutatakse muutujate jaoks intervalli ja skaala mõõtmise skaaladega.
  2. Spearmani või Kendalli järgu korrelatsioonikordaja – kui vähemalt ühel suurustel on järguskaala või see ei ole normaalselt jaotunud.
  3. Punktide kaheseerialine korrelatsioonikordaja (Fechneri märgi korrelatsioonikordaja) – kui üks kahest suurusest on dihhotoomne.
  4. Neljavälja korrelatsioonikordaja (mitme järgu korrelatsiooni (konkordantsi) koefitsient – ​​kui kaks muutujat on dihhotoomilised.

Pearsoni koefitsient viitab parameetrilistele korrelatsiooninäitajatele, kõik ülejäänud on mitteparameetrilised.

Korrelatsioonikordaja väärtus on vahemikus -1 kuni +1. Täieliku positiivse korrelatsiooni korral r = +1, täieliku negatiivse korrelatsiooniga r = -1.

Valem ja arvutus





Näited

On vaja kindlaks määrata seos kahe muutuja vahel: kooliõpilaste intellektuaalse arengu tase (vastavalt testimisele) ja hilinemiste arv kuus (vastavalt haridusajakirja sissekannetele).

Algandmed on toodud tabelis:

IQ andmed (x)

Andmed viivituste arvu kohta (y)

Summa

1122

Keskmine

112,2


Saadud näitaja õigeks tõlgendamiseks on vaja analüüsida korrelatsioonikordaja märki (+ või -) ja selle absoluutväärtust (moodul).

Kooskõlas korrelatsioonikordaja tugevuse järgi klassifikatsiooni tabeliga järeldame, et rxy = -0,827 on tugev negatiivne korrelatsioon. Seega on kooliõpilaste hilinemise arvul väga tugev sõltuvus nende intellektuaalsest arengutasemest. Võib öelda, et kõrge IQ tasemega õpilased hilinevad tundi harvemini kui madala IQ tasemega õpilased.



Korrelatsioonikoefitsienti saavad kasutada nii teadlased kahe suuruse või nähtuse sõltuvuse oletuse kinnitamiseks või ümberlükkamiseks ning selle tugevuse ja olulisuse mõõtmiseks kui ka üliõpilased erinevates õppeainetes empiiriliste ja statistiliste uuringute läbiviimiseks. Tuleb meeles pidada, et see näitaja ei ole ideaalne tööriist, see arvutatakse ainult lineaarse seose tugevuse mõõtmiseks ja see on alati tõenäosusväärtus, millel on teatud viga.

Korrelatsioonianalüüsi kasutatakse järgmistes valdkondades:

  • majandusteadus;
  • astrofüüsika;
  • sotsiaalteadused (sotsioloogia, psühholoogia, pedagoogika);
  • agrokeemia;
  • metallurgia;
  • tööstus (kvaliteedikontrolli jaoks);
  • hüdrobioloogia;
  • biomeetria jne.

Korrelatsioonianalüüsi meetodi populaarsuse põhjused:

  1. Korrelatsioonikoefitsientide arvutamise suhteline lihtsus ei nõua matemaatilist eriharidust.
  2. Võimaldab arvutada seoseid massiliste juhuslike muutujate vahel, mida statistikateaduses analüüsitakse. Sellega seoses on see meetod statistiliste uuringute valdkonnas laialt levinud.

Loodan, et nüüd suudate eristada funktsionaalset seost korrelatsioonilisest suhtest ja teate, et kui kuulete televisioonist või lugete ajakirjandusest korrelatsioonist, tähendab see positiivset ja üsna olulist vastastikust sõltuvust kahe nähtuse vahel.