Valoarea coeficientului empiric de determinare egală cu 0 indică. Coeficientul de determinare a ceea ce măsoară - formula

Coeficientul empiric de determinare este utilizat pe scară largă în problemele statistice și este un indicator care reprezintă ponderea în varianța totală a atributului rezultat și caracterizează puterea influenței atributului de grupare asupra formării variației generale. Poate fi calculat folosind formula:

Acest coeficient arată proporția variației caracteristicii efective y sub influența factorului x. În absența unei conexiuni, coeficientul empiric de determinare este egal cu zero, iar în cazul unui funcțional conexiune puternică- unitate.

reprezentată ca rădăcină pătrată a coeficient empiric determinări. Arată apropierea relației dintre datele statistice și este determinată de formula:

unde numărătorul este dispersia mijloacelor grupului;
numitorul este varianța totală.

relație de corelație este zero dacă nu există nicio relație între date. În acest caz, toate mediile grupului vor fi egale între ele și nu vor exista variații între grupuri.

Raportul de corelație este egal cu unu atunci când conexiunea este funcțională. În acest caz, varianța mediilor grupului va fi egală cu varianța totală, adică nu va exista nicio variație intragrup.

Cu cât valorile raportului de corelare sunt mai apropiate de unu, cu atât mai puternică, mai aproape de dependența funcțională, relația dintre caracteristici.

Se calculează după formula:

unde fe și ft sunt frecvențe empirice și teoretice.

Prin utilizarea criteriul lui Pearson tabelele determină probabilitatea P(x^2). Intrările în tabel sunt valori x^2 și numărul de grade de libertate k = n - p -1.

Dacă P > 0,05, atunci distribuțiile empirice și teoretice sunt considerate a fi apropiate. Când P aparține, coincidența dintre ele este satisfăcătoare, iar în alte cazuri este insuficientă.

Se calculează după formula:

unde numărătorul este momentul central de ordinul trei.

b^3 - cubul abaterii standard.

Factorul de asimetrie este valoare adimensională, ceea ce îi permite să fie utilizat pentru diverse distribuții. Cu asimetrie pe partea stângă, Mo > Mt > xav, cu asimetrie pe partea dreaptă, relații inverse. Acest lucru vă permite să aplicați cel mai simplu indicator de asimetrie:

Kurtosis în statistică

Există un grad de abrupție a distribuției empirice în raport cu cea normală. Acesta este determinat de formula:

unde numărătorul este momentul central de ordinul al patrulea

Când distribuția este la vârf în raport cu normalul, kurtoza va fi pozitivă, dacă distribuția este plată, va fi negativă. Pentru o distribuție normală, E = 0.

Ce se înțelege prin varianță în cadrul unui grup pentru o populație? Care este formula pentru calculul ei? Dă un exemplu. Ce se înțelege prin varianța populației intergrup? Care este formula pentru calculul ei? Dă un exemplu.

Varianta intragrup () indică o variație aleatorie care nu depinde de trăsătura care stă la baza grupării.

, Unde

Media grupului

Variația medie intra-grup se calculează după cum urmează: mai întâi se calculează variațiile pentru grupuri individuale (), apoi se calculează variația medie intra-grup:

Caracterizează variația sistematică, adică diferențe de amploare a trăsăturii studiate, care stă la baza grupării. Această dispersie este calculată prin formula

, Unde

Valoarea medie pentru un grup separat

n i- numărul de unități din grup

- media aritmetică generală a întregii populaţii studiate.

Toate cele trei tipuri de varianță sunt interconectate: varianța totală este egală cu suma variației medii intragrup și a varianței intergrup:

Acest raport reflectă legea, care se numește regula de adunare a varianței.

20.

Ce se înțelege prin variația totală a populației? Care este formula pentru calculul ei? Modul în care grupurile sunt grupate afectează varianța totală? Dă un exemplu.

Varianta totală () caracterizează variația trăsăturii întregii populații sub influența tuturor acelor factori care au determinat această variație. Această valoare este determinată de formulă

, Unde

media aritmetică generală a întregii populaţii studiate.

Pe de altă parte, varianța totală este egală cu suma variației medii intragrup și a varianței intergrup:

Acest raport reflectă legea, care se numește regula de adunare a varianței.. Datorită regulii de adunare a variațiilor, este posibil să se determine ce parte din variația totală se află sub influența factorului caracteristic care stă la baza grupării.

Cu cât este mai mare proporția varianței intergrupurilor în varianța totală, cu atât influența atributului (rangul) factorului asupra rezultatului (producția) este mai puternică.

Această proporție este caracterizată de un coeficient empiric de determinare:

Pentru o evaluare calitativă a proximității relației dintre semne se folosesc relațiile lui Chaddock.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Puterea conexiunii

dispărut

foarte slab

slab

moderat

evidentă

închide

foarte aproape

funcţional-

nazal

21.

Ce arată coeficientul de determinare? Care este formula pentru calculul ei? În ce unități se măsoară acest indicator? Care sunt valorile posibile pentru acest indicator? Ce înseamnă empiric relație de corelație? Care este formula pentru calculul ei? În ce unități se măsoară acest indicator? Care sunt valorile posibile pentru acest indicator?

Coeficientul empiric de determinare () caracterizează ponderea varianței intergrupurilor în varianța totală:

Ia valori de la -1 la 1 și arată cât de mult se datorează variației trăsăturii în agregat factorului de grupare.

Dispersia intergrupurilor;

varianta totala.

Determinat prin formula:

Acceptă valori de la -1 la 1

Exemplu

grup

Numar fabrici din grup, buc.

Producția brută medie la prețuri comparabile, milioane de ruble

Să determinăm acum valoarea medie, variația totală și variația intergrup a producției brute în prețuri comparabile ale fabricilor:

milioane de ruble;

Milion frecare.2;

Milion freacă.2.

Coeficientul de determinare va fi egal cu:

Ca urmare, raportul de corelație empirică va fi egal cu:

Valoarea calculată a raportului de corelație empirică indică o relație statistică destul de ridicată între producția brută în prețuri comparabile și costul mediu anual al activelor fixe de producție ale fabricilor.

22.

Cum se calculează o statistică de test în analiza univariată a varianței? Care este legea distribuției sale sub valabilitatea ipotezei principale? Care sunt parametrii acestei legi? Cum se ia o decizie într-o analiză unidirecțională a varianței bazată pe valoarea calculată a criteriului statistic?

Sarcina analizei varianței este de a studia influența unuia sau mai multor factori asupra trăsăturii luate în considerare.

Analiza unidirecțională a varianței este utilizată atunci când sunt disponibile trei sau mai multe eșantioane independente, obținute din aceeași populație generală prin modificarea unui factor independent pentru care, din anumite motive, nu există măsurători cantitative.

Ca criteriu, este necesar să se utilizeze criteriul Fisher:

., Unde

Q 1 este suma abaterilor pătrate ale mediilor eșantionului față de media totală

Q 2 este suma abaterilor pătrate ale valorilor observate de la media eșantionului

Dacă valoarea calculată a criteriului Fisher este mai mică decât valoarea tabelară, nu există niciun motiv să credem că factorul independent afectează răspândirea valorilor medii ( acestea. ipoteza nu a fost confirmată). În caz contrar, factorul independent are un efect semnificativ asupra răspândirii valorilor medii ( ipoteza este corecta).

23-25.

1. La intervale egale, utilizați media aritmetică simplă:

unde y sunt nivelurile absolute ale seriei;
n- numărul de niveluri din serie.
2. Pentru intervale inegale, utilizați media aritmetică ponderată:

unde u 1 ,...,уn - niveluri ale seriei de dinamică;
t1,... tn - ponderi, durata intervalelor de timp.

Nivelul mediu al seriei de momente dinamica se calculează cu formula:
1. Cu niveluri echidistante se calculează prin formula seriei momentelor cronologice medii:

unde u 1 ,...,уn - nivelurile perioadei pentru care se face calculul;
n- numărul de niveluri;
n-1 - durata perioadei de timp.
2. C inegal nivelurile se calculează folosind formula medie ponderată cronologică:

unde u 1 ,...,уn - niveluri ale serii temporale;
t- interval de timp dintre nivelele adiacente

în statistici

Creștere medie absolută este definită ca media câștigurilor absolute pe intervale de timp egale ale unei perioade. Se calculează prin formulele: 1. Pe baza datelor în lanț privind creșterea absolută pe un număr de ani, creșterea medie absolută este calculată ca medie aritmetică simplă:

Unde n este numărul de incremente absolute ale legii puterii în perioada studiată.
2. Se calculează creșterea medie absolutăprin creşterea absolută de bază în cazul intervalelor egale

Unde m - numărul de niveluri ale unei serii de dinamici în perioada de studiu, inclusiv cel de bază.

Rata medie de creștere este o caracteristică de generalizare liberă a intensității schimbării de nivelserie de dinamică și arată de câte ori se modifică nivelul seriei de dinamică în medie pe unitatea de timp.
Ca bază și criteriu pentru corectitudinea calculării ratei medii de creștere (scădere), este utilizat un indicator de generalizare, care este calculat ca produsul ratelor de creștere în lanț egal cu rata de creștere pentru întreaga perioadă luată în considerare. Dacă valoarea atributului este formată ca produs opțiuni individuale, atunci se folosește media geometrică.
Întrucât rata medie de creștere este coeficientul mediu de creștere, exprimat în procente, atunci pentru seria echivalentă de dinamică, calculele folosind media geometrică se reduc la calcularea coeficienților medii de creștere din cei în lanț folosind „metoda lanțului”:

Unde n este numărul de factori de creștere în lanț;
kts- factori de creștere în lanț;
Kb - rata de creștere de bază pentru întreaga perioadă.
Determinarea factorului mediu de creșterepoate fi simplificată dacă nivelurile seriei temporale sunt clare. Deoarece produsul factorilor de creștere a lanțului este egal cu cel de bază, factorul de creștere a bazei este substituit în expresia radicalului.
Formula pentru determinarea factorului mediu de creșterepentru serii echidistante de dinamică conform „metodei de bază” va fi după cum urmează:

36.

Care sunt indicatorii absoluti ai schimbărilor de nivel al seriei cunoscute de tine?

Toți acești indicatori pot fi determinați în mod de bază, atunci când nivelul perioadă dată comparativ cu prima perioadă (de bază), sau într-un mod în lanț - când sunt comparate două niveluri de perioade adiacente.

Scrieți formule de calcul.

Schimbarea absolută de bază este diferența dintre nivelul specific și primul nivel al seriei, determinată de formulă

Arată cât de mult (în unități de indicatori ai seriei) nivelul unei (i-a) perioade este mai mult sau mai mic decât primul nivel (de bază) și, prin urmare, poate avea semnul „+” (cu o creștere în niveluri) sau „–” (cu o scădere a nivelurilor).

Schimbarea absolută a lanțului este diferența dintre nivelurile specifice și anterioare ale seriei, este determinată de formulă

Arată cât de mult (în unități de indicatori ai seriei) nivelul unei (i-a) perioade este mai mult sau mai mic decât nivelul anterior și poate avea semnul „+” sau „-”.

Explicați modul în care metoda de calcul depinde de alegerea bazei de comparație.

Ce indicatori relativi de schimbare a nivelului seriei vă sunt cunoscuți? Scrieți formule de calcul.

Modificarea relativă de bază (rata de creștere de bază sau indicele de dinamică de bază) este raportul dintre un nivel specific și primul nivel al seriei, determinat de formula

Schimbarea relativă a lanțului (rata de creștere a lanțului sau indicele dinamicii lanțului) este raportul dintre un nivel specific și un nivel anterior al seriei, determinat de formula

Explicați modul în care metoda de calcul depinde de alegerea bazei de comparație.

Modificarea relativă arată de câte ori este mai mare nivelul unei perioade date decât nivelul oricărei perioade anterioare (pentru i > 1) sau ce parte din acesta este (pentru i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Care sunt indicatorii medii ai schimbării nivelului seriei cunoscute de tine? Scrieți formulele de calcul a creșterii medii absolute, a ratei de creștere și a ratei de creștere a nivelurilor seriei.

Creșterea medie absolută este definită ca media creșterii absolute pentru perioade egale de timp într-o perioadă. Se calculează prin formulele: 1. Pe baza datelor în lanț privind creșterea absolută pe un număr de ani, creșterea medie absolută este calculată ca medie aritmetică simplă:

Unde n este numărul de incremente absolute ale legii puterii în perioada studiată.

2. Creșterea medie absolută se calculează prin creșterea absolută de bază în cazul intervalelor egale

Unde m - numărul de niveluri ale unei serii de dinamici în perioada de studiu, inclusiv cel de bază.

Rata medie de creștere este o caracteristică de generalizare liberă a intensității modificărilor nivelurilor unei serii de dinamică și arată de câte ori se modifică în medie nivelul unei serii de dinamici pe unitatea de timp.

Ca bază și criteriu pentru corectitudinea calculării ratei medii de creștere (scădere), este utilizat un indicator de generalizare, care este calculat ca produsul ratelor de creștere în lanț egal cu rata de creștere pentru întreaga perioadă luată în considerare. Dacă valoarea caracteristică este formată ca un produs al opțiunilor individuale, atunci se utilizează media geometrică.

Întrucât rata medie de creștere este coeficientul mediu de creștere, exprimat în procente, atunci pentru seria echivalentă de dinamică, calculele folosind media geometrică se reduc la calcularea coeficienților medii de creștere din cei în lanț folosind „metoda lanțului”:

Unde n este numărul de factori de creștere în lanț;

Кц - coeficienții de creștere în lanț;

Kb - rata de creștere de bază pentru întreaga perioadă.

Rata de schimbare (rata de creștere) a nivelurilor este un indicator relativ care arată cât de procente este un anumit nivel mai mare (sau mai mic) decât altul, luat ca bază de comparație. Se calculează scăzând 100% din modificarea relativă, adică prin formula:

sau ca procent din modificarea absolută a nivelului față de care se calculează modificarea absolută (linia de bază), adică conform formulei:

.

Care sunt dezavantajele acestor indicatori? În ce cazuri este indicat să le folosim? Cum pot fi remediate aceste neajunsuri? Scrieți formule de calcul a mediilor care să asigure păstrarea valorii totale a seriei.

38.

Cum se determină tipul tendinței principale prin valorile indicatorilor de modificări ale nivelurilor seriei? Dă exemple.

Identificarea tendinței generale a seriei de timp se poate face prin netezirea seriei de timp folosind metoda mediei mobile. Esența acestei tehnici este că nivelurile calculate (teoretice) sunt determinate de la nivelurile inițiale ale seriei (date empirice).

Condiția principală pentru aplicarea acestei metode este calcularea legăturilor medii mobile (în mișcare) de la un astfel de număr de niveluri ale seriei care să corespundă duratei dinamicii ciclului observată în serie.

RĂSPUNS

O evaluare cantitativă a gradului de apropiere a comunicării conform datelor empirice constă în calcularea indicatorilor de apropiere a comunicării:

· Coeficientul empiric de determinare (raportul de dispersie empiric) - r 2 .

Acest indicator este calculat în funcție de datele grupării analitice (tabel), ca raport dintre varianța intergrup a trăsăturii rezultatului Y (d y 2) și varianța totală Y (s y 2):

Conform teoremei de descompunere a varianței, varianța intergrup este legată de varianța totală: s y 2 =d y 2 +e y 2 . Apoi coeficientul empiric de determinare poate fi calculat prin varianța reziduală folosind formula:

unde s j 2 este varianța rezultatului Y în cadrul grupului j-a.

Coeficientul empiric de determinare caracterizează puterea influenței atributului de grupare (X) asupra formării variației globale a atributului rezultat Y și arată procentul (ponderea) variației atributului rezultat datorită factorului de atribut subiacent. gruparea.

Este convenabil să calculați r 2 în tabel:

Factorul de semn X j Nj Valoarea medie a caracteristicii-rezultat s j 2 N j
x1 N 1 s 1 2 N 1
x2 N 2 s 2 2 N 2
.... ...
X m N m s m 2 N m
Total N X es j 2

Apoi .

Luați în considerare un exemplu. Să fie dat un set de 20 de muncitori, caracterizați prin următoarele caracteristici: Y - randamentul unui muncitor (buc/schimb) și X - calificare (grad). Datele inițiale sunt prezentate în tabel:

X
Y

Este necesară evaluarea gradului de apropiere a relației dintre caracteristici folosind coeficientul empiric de determinare (r 2).

Pentru a calcula r 2, vom efectua o grupare analitică a populației. Ca factor-semn, luăm X (categoria unui lucrător), ca rezultat-semn - Y, rezultatul unui lucrător). Gruparea analitică se realizează pe baza lui X. În acest caz, va fi discretă (deoarece valorile atributului X se repetă destul de des). Numărul de grupuri este egal cu numărul de valori ale atributului X în agregat, adică. 6. Rezultatele grupării și calculului lui r 2 sunt rezumate în tabel:

Factorul de semn X Atributul rezultat Y Numărul de unități dintr-un grup, N j Valoarea medie a semnului rezultat în grup, (-) 2 N j Dispersia trăsăturii-rezultat în grup, s 2 j s 2 j N j
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 \u003d ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 \u003d 1,56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 \u003d ((11-12,5) 2 + (14-12,5) 2) / 2 \u003d 2,25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 \u003d ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \u003d 1.9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 \u003d ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 \u003d 2.19 8,75
=17,1 429,1 40,7

Coeficientul empiric de determinare este egal cu raportul dintre varianța intergrup a atributului rezultat (d y 2) și varianța totală a atributului rezultat (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2) + e y 2).

Dispersia intergrupurilor Y va fi egală cu: d y 2 = å( - ) 2 N j / N = 429,1/20=21,45.

Varianta reziduala Y va fi: e y 2 = ås 2 j ·N j / N= 40,7/20= 2,035.

Apoi: r 2 \u003d 21,45 / (21,45 + 2,035) \u003d 429,1 / (429,1 + 40,7) \u003d 0,913.

Concluzie: 91,3% din variația producției muncitorilor se datorează influenței factorului de descărcare.

· Relația de corelație empirică - r.

Acest indicator este rădăcina coeficientului empiric de determinare. Ea arată strânsoarea conexiunii (nu doar liniară!) dintre gruparea și caracteristicile productive. Intervalul valorilor permise ale raportului de corelație empirică este de la 0 la +1.

Cea mai apropiată conexiune posibilă este o conexiune funcțională, când fiecare valoare a rezultatului Y este determinată în mod unic de valoarea factorului X (adică rezultatul grupării). În acest caz, varianța mijloacelor grupului (d y 2) este egală cu varianța totală (s y 2), adică. nu va exista variație intragrup. În acest caz, dispersia reziduală (e y 2) este egală cu 0, iar coeficientul empiric de determinare este egal cu 1.

Dacă nu există nicio legătură între semne, atunci toate mediile grupului sunt egale între ele, nu va exista nicio variație intergrup (d y 2 = 0), iar coeficientul empiric de determinare este 0.

Să calculăm raportul de corelație empirică pentru exemplul nostru: r= 0,9555. Concluzie: semnele „producției unui muncitor” și „descărcării” sunt destul de strâns legate.

Indicatorii r și r 2 sunt determinați nu numai de prezența unei legături între caracteristicile X și Y, ci și de faptul grupării datelor primare. Pe măsură ce numărul de grupuri m crește, varianța intergrupurilor d 2 crește și se apropie de varianța totală. Dacă numărul de grupuri este mai mic decât numărul de unități de populație N, atunci valorile lui r și r 2 nu vor fi niciodată egale cu 1, chiar și cu o relație funcțională strictă.

Rețineți că valoarea indicatorului de apropiere a conexiunii nu este în sine dovada prezenței unei relații cauzale între trăsăturile studiate, ci este o evaluare a gradului de consistență reciprocă a modificărilor caracteristicilor. Stabilirea unei relaţii cauză-efect trebuie neapărat precedată de o analiză a naturii calitative a fenomenelor.

Relația de corelație empirică

Apropierea sau puterea unei relații dintre două caracteristici poate fi măsurată printr-un indicator numit raportul de corelație empirică. Acest indicator se numește empiric, deoarece poate fi calculat pe baza grupării obișnuite după factor și atribut rezultat, adică pe baza unui tabel de corelare. Raportul de corelație empirică se obține din regula de adunare a variațiilor, conform căreia , unde este varianța totală; - dispersie intergrup; - dispersia intragrup (media a privatului). Varianta intergrup este o măsură a fluctuației datorată unei trăsături factori. Media variațiilor parțiale este o măsură a fluctuației datorată tuturor celorlalte caracteristici (cu excepția factoriale). Apoi raportul exprimă ponderea fluctuației care rezultă din semnul factorului în fluctuația totală. Rădăcina pătrată a acestui raport se numește raportul de corelație empirică: .

Aceasta implică regula conform căreia, cu cât varianța dintre grupuri este mai mare, cu atât trăsătura factorului afectează mai puternic variația trăsăturii rezultate. Rapoartele componente ale variațiilor sunt calculate din datele din tabelul de corelare folosind următoarele formule:

; ,

unde sunt mediile private; - media generală; - totaluri pe baza de ; - totaluri pe baza de ; - numărul de observații. Aceeași relație se păstrează și pentru valorile condiționate primite prin transformare numerică.

Raportul de varianță în sine (expresia radicală) se numește coeficient de determinare (este egal și cu pătratul raportului de corelație empiric). Raportul de corelație empirică variază într-un interval larg (de la 0 la 1). Dacă este egal cu zero, atunci semnul factorului nu afectează semnul corelației. Dacă =1, atunci semnul rezultat depinde complet de factorul unu. Dacă raportul de corelație empirică este o fracție apropiată de unu, atunci se vorbește despre o relație strânsă între caracteristicile factoriale și efective. Dacă această fracție este mică (aproape de zero), atunci se vorbește despre o legătură slabă între ele.

Relația de corelație empirică

Mai mulți indicatori sunt utilizați pentru a măsura gradul de asociere. La o conexiune în pereche, etanșeitatea conexiunii este determinată, în primul rând, de raportul de corelație, care este notat cu η. Pătratul raportului de corelație este raportul dintre varianța intergrup a trăsăturii rezultate, care exprimă efectul diferențelor în trăsătura factorului de grupare asupra valorii medii a trăsăturii rezultate, și varianța totală a trăsăturii rezultate, care exprimă impactul tuturor cauzelor și condițiilor asupra acesteia. Pătratul raportului de corelație se numește coeficient de determinare.

ny fenomene și semnele lor: ________________ sau rigid deterministe

unde k este numărul de grupuri

N este numărul de observații

y i - valorile inițiale ale caracteristicii efective

y j - valori medii ale atributului efectiv pentru acest grup

y este valoarea medie a caracteristicii

f j este mărimea grupului

Formula de mai sus este utilizată la calcularea indicatorului de apropiere a conexiunii pentru o grupare analitică. La calcularea raportului de corelare în funcție de nivelul de comunicare, se utilizează următoarea formulă:

Suma pătratelor din numărător este varianța caracteristicii rezultate y explicată prin relația cu factorul x (factori). Se calculează din datele individuale obținute pentru fiecare unitate a populației pe baza ecuației de regresie.

Dacă ecuația este aleasă incorect sau se face o eroare la calcularea parametrilor ei, atunci suma pătratelor din numărător poate fi mai mare decât în ​​numitor, iar raportul își va pierde sensul pe care ar trebui să-l aibă. Pentru a evita un rezultat eronat, este mai bine să calculați raportul de corelare folosind următoarea formulă:

Această formulă se bazează pe regula binecunoscută pentru extinderea sumelor abaterilor pătrate la gruparea populației:

D uzual=D intergr+D intragr

Conform acestei reguli, în loc de variația intergrup (factorială), puteți folosi diferența:

D uzual-D intragr

ce dă:

Când calculăm η nu prin grupare, ci prin ecuația de corelație (ecuația de regresie), folosim formula. În acest caz, regula de descompunere pentru suma abaterilor pătrate ale caracteristicii rezultate se scrie ca

D total \u003d D core + D rest

Cel mai important punct care ar trebui învățat acum de oricine dorește să aplice corect metoda analizei corelației-regresiune este interpretarea formulelor (1.2) și (1.3). Această prevedere prevede:

Ecuația de corelație măsoară relația dintre variația caracteristicii rezultate și variația caracteristicii factorilor. Măsurile de etanșeitate a conexiunii măsoară proporția de variație a caracteristicii rezultate, care este asociată cu variația caracteristicii factorului (trăsături).

| următoarea prelegere =>

Top