Empīriskā determinācijas koeficienta vērtība, kas vienāda ar 0, norāda. Koeficients, ko tas mēra, ir formula

Empīriskais determinācijas koeficients tiek plaši izmantots statistikā un ir rādītājs, kas atspoguļo daļu no iegūtā atribūta kopējās dispersijas un raksturo grupēšanas atribūta ietekmes stiprumu uz vispārējās variācijas veidošanos. To var aprēķināt, izmantojot formulu:

Šis koeficients parāda efektīvās pazīmes y variācijas proporciju faktora x ietekmē. Ja nav savienojuma, empīriskais determinācijas koeficients ir vienāds ar nulli un funkcionālas spēcīgs savienojums- vienība.

attēlots kā kvadrātsakne no empīriskais koeficients apņēmības. Tas parāda statistikas datu attiecību ciešumu un tiek noteikts pēc formulas:

kur skaitītājs ir grupas vidējo izkliede;
saucējs ir kopējā dispersija.

korelācijas attiecības ir nulle, ja starp datiem nav attiecības. Šajā gadījumā visas grupas vidējās vērtības būs vienādas un starpgrupu atšķirības nebūs.

Korelācijas koeficients ir vienāds ar vienu, ja attiecības ir funkcionālas. Šajā gadījumā grupas vidējo dispersija būs vienāda ar kopējo dispersiju, t.i., grupas iekšējās variācijas nebūs.

Jo tuvāk korelācijas koeficienta vērtības ir vienam, jo ​​spēcīgāka, tuvāk funkcionālajai atkarībai, saistība starp pazīmēm.

Aprēķināts pēc formulas:

kur fe un ft ir empīriskas un teorētiskas frekvences.

Izmantojot Pīrsona kritērijs tabulas nosaka varbūtību P(x^2). Tabulas ievades ir x^2 vērtības un brīvības pakāpju skaits k = n - p -1.

Ja P > 0,05, tad empīriskais un teorētiskais sadalījums tiek uzskatīts par tuvu. Ja P pieder, sakritība starp tām ir apmierinoša, bet citos gadījumos tā ir nepietiekama.

Aprēķināts pēc formulas:

kur skaitītājs ir trešās kārtas centrālais moments.

b^3 - standartnovirzes kubs.

Šķibuma faktors ir bezdimensiju vērtība, kas ļauj to izmantot dažādiem sadalījumiem. Ar kreisās puses asimetriju, Mo > Mt > xav, ar labās puses asimetriju, apgrieztas attiecības. Tas ļauj izmantot vienkāršāko asimetrijas indikatoru:

Kurtoze statistikā

Empīriskajam sadalījumam ir zināma stāvuma pakāpe attiecībā pret parasto. To nosaka pēc formulas:

kur skaitītājs ir ceturtās kārtas centrālais moments

Kad sadalījums ir sasniedzis maksimumu attiecībā pret normālo, kurtoze būs pozitīva, ja sadalījums ir plakans, tas būs negatīvs. Normālam sadalījumam E = 0.

Ko populācijai nozīmē grupas iekšējā dispersija? Kāda ir tā aprēķināšanas formula? Sniedziet piemēru. Ko nozīmē starpgrupu populācijas dispersija? Kāda ir tā aprēķināšanas formula? Sniedziet piemēru.

Grupas iekšējā dispersija () apzīmē nejaušu variāciju, kas nav atkarīga no grupējuma pamatā esošās pazīmes.

, kur

Grupas vidējais rādītājs

Vidējo grupas iekšējo dispersiju aprēķina šādi: vispirms aprēķina atsevišķu grupu atšķirības (), pēc tam aprēķina vidējo grupas iekšējo dispersiju:

Raksturo sistemātisku variāciju, t.i. pētāmās pazīmes lieluma atšķirības, kas ir grupēšanas pamatā. Šo izkliedi aprēķina pēc formulas

, kur

Atsevišķas grupas vidējā vērtība

n i- vienību skaits grupā

- visas pētījuma populācijas vispārējais aritmētiskais vidējais.

Visi trīs dispersijas veidi ir savstarpēji saistīti: kopējā dispersija ir vienāda ar vidējās grupas iekšējās dispersijas un starpgrupu dispersijas summu:

Šī attiecība atspoguļo likumu, ko sauc dispersijas pievienošanas noteikums.

20.

Ko nozīmē kopējā populācijas dispersija? Kāda ir tā aprēķināšanas formula? Vai grupu grupēšanas veids ietekmē kopējo dispersiju? Sniedziet piemēru.

Kopējā dispersija () raksturo visas populācijas pazīmes variāciju visu to faktoru ietekmē, kas izraisīja šīs izmaiņas. Šo vērtību nosaka pēc formulas

, kur

visas pētījuma populācijas vispārējais aritmētiskais vidējais.

No otras puses, kopējā dispersija ir vienāda ar vidējās grupas iekšējās dispersijas un starpgrupu dispersijas summu:

Šī attiecība atspoguļo likumu, ko sauc dispersijas pievienošanas noteikums.. Pateicoties dispersiju saskaitīšanas noteikumam, ir iespējams noteikt, kāda kopējās dispersijas daļa atrodas grupēšanas pamatā esošā raksturīgā faktora ietekmē.

Jo lielāks ir starpgrupu dispersijas īpatsvars kopējā dispersijā, jo spēcīgāka ir faktora zīmes (ranga) ietekme uz efektīvo (ražošanu).

Šo proporciju raksturo empīrisks determinācijas koeficients:

Zīmju attiecību ciešuma kvalitatīvam novērtējumam tiek izmantotas Čadoka attiecības.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Savienojuma stiprums

trūkst

ļoti vāja

vājš

mērens

uzkrītošs

aizveriet

ļoti tuvu

funkcionāls-

deguna

21.

Ko parāda determinācijas koeficients? Kāda ir tā aprēķināšanas formula? Kādās vienībās mēra šo rādītāju? Kādas ir šī indikatora iespējamās vērtības? Ko dara empīriskā korelācijas attiecības? Kāda ir tā aprēķināšanas formula? Kādās vienībās mēra šo rādītāju? Kādas ir šī indikatora iespējamās vērtības?

Empīriskais determinācijas koeficients () raksturo starpgrupu dispersijas daļu kopējā dispersijā:

Tas ņem vērtības no -1 līdz 1 un parāda, cik lielas iezīmes variācijas kopumā ir saistītas ar grupēšanas faktoru.

Starpgrupu dispersija;

kopējā dispersija.

Nosaka pēc formulas:

Pieņem vērtības no -1 līdz 1

Piemērs

Grupa

Stādu skaits grupā, gab.

Vidējā bruto izlaide salīdzināmās cenās, miljoni rubļu

Tagad noteiksim bruto produkcijas vidējo vērtību, kopējo dispersiju un starpgrupu dispersiju rūpnīcu salīdzināmās cenās:

miljons rubļu;

Miljons berzēt.2;

Miljons berzēt.2.

Determinācijas koeficients būs vienāds ar:

Rezultātā empīriskā korelācijas attiecība būs vienāda ar:

Aprēķinātā empīriskās korelācijas koeficienta vērtība norāda uz diezgan augstu statistisko sakarību starp bruto izlaidi salīdzināmās cenās un rūpnīcu ražošanas pamatlīdzekļu vidējām gada izmaksām.

22.

Kā vienfaktoru dispersijas analīzē tiek aprēķināta testa statistika? Kāds ir tā sadalījuma likums saskaņā ar galvenās hipotēzes derīgumu? Kādi ir šī likuma parametri? Kā tiek pieņemts lēmums vienvirziena dispersijas analīzē, pamatojoties uz kritērija statistikas aprēķināto vērtību?

Dispersijas analīzes uzdevums ir izpētīt viena vai vairāku faktoru ietekmi uz aplūkojamo pazīmi.

Vienvirziena dispersijas analīzi izmanto, ja ir pieejami trīs vai vairāki neatkarīgi paraugi, kas iegūti no vienas un tās pašas vispārējās kopas, mainot kādu neatkarīgu faktoru, kuram kaut kādu iemeslu dēļ nav kvantitatīvu mērījumu.

Kā kritērijs ir jāizmanto Fišera kritērijs:

., kur

J 1 ir izlases vidējo noviržu kvadrātā summa no kopējā vidējā

J 2 ir novēroto vērtību noviržu kvadrātā summa no parauga vidējās vērtības

Ja Fišera kritērija aprēķinātā vērtība ir mazāka par tabulas vērtību, nav pamata uzskatīt, ka neatkarīgais faktors ietekmē vidējo vērtību izplatību ( tie. hipotēze neapstiprinājās). Pretējā gadījumā neatkarīgais faktors būtiski ietekmē vidējo vērtību izplatību ( hipotēze ir pareiza).

23-25.

1. Ar vienādiem intervāliem izmantojiet vienkāršo vidējo aritmētisko:

kur y ir sērijas absolūtie līmeņi;
n- sērijas līmeņu skaits.
2. Nevienādiem intervāliem izmantojiet svērto vidējo aritmētisko:

kur u 1 ,...,уn - dinamikas sērijas līmeņi;
t1,... tn - svari, laika intervālu ilgums.

Momentu sēriju vidējais līmenis Dinamika tiek aprēķināta pēc formulas:
1. Ar vienādiem līmeņiem aprēķina pēc vidējo hronoloģisko momentu rindas formulas:

kur u 1 ,...,уn - perioda līmeņi, par kuru veikts aprēķins;
n- līmeņu skaits;
n-1 - laika perioda ilgums.
2. C nevienlīdzīgi līmeņus aprēķina, izmantojot hronoloģiski svērto vidējo formulu:

kur u 1 ,...,уn - laikrindu līmeņi;
t- laika intervāls starp blakus esošajiem līmeņiem

statistikā

Vidējais absolūtais pieaugums ir definēts kā vidējais absolūtais pieaugums vienādos laika intervālos vienā periodā. To aprēķina pēc formulām: 1. Pamatojoties uz ķēdes datiem par absolūto pieaugumu vairāku gadu garumā, vidējo absolūto pieaugumu aprēķina kā vidējo aritmētiski vienkāršu:

kur n ir pakāpju likuma absolūto pieaugumu skaits pētāmajā periodā.
2. Tiek aprēķināts vidējais absolūtais pieaugumscaur pamata absolūto pieaugumu vienādu intervālu gadījumā

kur m - dinamikas sērijas līmeņu skaits pētījuma periodā, ieskaitot bāzes līmeni.

Vidējais pieauguma temps ir brīvs vispārinošs raksturlielums līmeņa maiņas intensitāteidinamikas sērija un parāda, cik reižu dinamikas rindas līmenis mainās vidēji laika vienībā.
Par pamatu un kritēriju vidējā pieauguma (samazinājuma) ātruma aprēķināšanas pareizībai tiek izmantots vispārinošs rādītājs, kas tiek aprēķināts kā ķēdes pieauguma tempu reizinājums, kas vienāds ar pieauguma tempu visā aplūkojamajā periodā. Ja atribūta vērtība tiek veidota kā produkts individuālas iespējas, tad tiek izmantots ģeometriskais vidējais.
Tā kā vidējais augšanas ātrums ir vidējais pieauguma koeficients, kas izteikts procentos, tad ekvivalentajām dinamikas sērijām aprēķini, izmantojot ģeometrisko vidējo, tiek samazināti līdz vidējo pieauguma koeficientu aprēķināšanai no ķēdes koeficientiem, izmantojot “ķēdes metodi”:

kur n ir ķēdes augšanas faktoru skaits;
kts- ķēdes augšanas faktori;
Kb - bāzes pieauguma temps visam periodam.
Vidējā augšanas faktora noteikšanavar vienkāršot, ja laikrindu līmeņi ir skaidri. Tā kā ķēdes augšanas faktoru reizinājums ir vienāds ar bāzes koeficientu, tad bāzes augšanas faktors tiek aizvietots radikālajā izteiksmē.
Formula vidējā augšanas faktora noteikšanaivienāda attāluma dinamikas sērijām saskaņā ar "pamata metodi" būs šāda:

36.

Kādi ir tev zināmie absolūtie seriāla līmeņa izmaiņu rādītāji?

Visus šos rādītājus var noteikt pamata veidā, kad līmenis dotajā periodā salīdzinot ar pirmo (pamata) periodu, vai ķēdes veidā - kad tiek salīdzināti divi blakus periodu līmeņi.

Uzrakstiet aprēķinu formulas.

Galvenās absolūtās izmaiņas ir starpība starp sērijas īpašo un pirmo līmeni, ko nosaka formula

Tas parāda, cik daudz (rindas rādītāju vienībās) viena (i-tā) perioda līmenis ir vairāk vai mazāks par pirmo (pamata) līmeni, un tāpēc var būt ar “+” zīmi (ar pieaugumu līmeņos) vai “–” (ar līmeņa pazemināšanos).

Ķēdes absolūtās izmaiņas ir atšķirība starp konkrēto un iepriekšējo sērijas līmeni, ko nosaka pēc formulas

Tas parāda, cik daudz (rindas rādītāju vienībās) viena (i-tā) perioda līmenis ir vairāk vai mazāks par iepriekšējo līmeni, un var būt ar "+" vai "-" zīmi.

Paskaidrojiet, kā aprēķina metode ir atkarīga no salīdzināšanas bāzes izvēles.

Kādi relatīvie sērijas līmeņa izmaiņu rādītāji jums ir zināmi? Uzrakstiet aprēķinu formulas.

Pamata relatīvās izmaiņas (pamata pieauguma temps vai pamata dinamikas indekss) ir rindas konkrētā un pirmā līmeņa attiecība, ko nosaka pēc formulas

Ķēdes relatīvās izmaiņas (ķēdes augšanas ātrums vai ķēdes dinamikas indekss) ir noteikta un iepriekšējā sērijas līmeņa attiecība, ko nosaka pēc formulas

Paskaidrojiet, kā aprēķina metode ir atkarīga no salīdzināšanas bāzes izvēles.

Relatīvās izmaiņas parāda, cik reizes noteiktā perioda līmenis ir lielāks par jebkura iepriekšējā perioda līmeni (ja i ​​> 1) vai kāda tā daļa ir (i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Kādi ir tev zināmie vidējie seriāla līmeņa izmaiņu rādītāji? Uzrakstiet formulas rindas līmeņu vidējā absolūtā pieauguma, pieauguma ātruma un pieauguma ātruma aprēķināšanai.

Vidējais absolūtais pieaugums tiek definēts kā absolūtā pieauguma vidējais vienādos laika periodos vienā periodā. To aprēķina pēc formulām: 1. Pamatojoties uz ķēdes datiem par absolūto pieaugumu vairāku gadu garumā, vidējo absolūto pieaugumu aprēķina kā vidējo aritmētiski vienkāršu:

kur n ir pakāpju likuma absolūto pieaugumu skaits pētāmajā periodā.

2. Vidējais absolūtais pieaugums tiek aprēķināts, izmantojot pamata absolūto pieaugumu vienādu intervālu gadījumā

kur m - dinamikas sērijas līmeņu skaits pētījuma periodā, ieskaitot bāzes līmeni.

Vidējais pieauguma temps ir brīvs vispārinošs raksturlielums dinamikas virknes līmeņu izmaiņu intensitātei un parāda, cik reižu dinamikas sērijas līmenis mainās vidēji laika vienībā.

Par pamatu un kritēriju vidējā pieauguma (samazinājuma) ātruma aprēķināšanas pareizībai tiek izmantots vispārinošs rādītājs, kas tiek aprēķināts kā ķēdes pieauguma tempu reizinājums, kas vienāds ar pieauguma tempu visā aplūkojamajā periodā. Ja raksturīgo vērtību veido kā atsevišķu iespēju reizinājumu, tad izmanto ģeometrisko vidējo.

Tā kā vidējais augšanas ātrums ir vidējais pieauguma koeficients, kas izteikts procentos, tad ekvivalentajām dinamikas sērijām aprēķini, izmantojot ģeometrisko vidējo, tiek samazināti līdz vidējo pieauguma koeficientu aprēķināšanai no ķēdes koeficientiem, izmantojot “ķēdes metodi”:

kur n ir ķēdes augšanas faktoru skaits;

Кц - pieauguma ķēdes koeficienti;

Kb - bāzes pieauguma temps visam periodam.

Līmeņu izmaiņu ātrums (pieauguma temps) ir relatīvs rādītājs, kas parāda, cik procentu noteiktais līmenis ir lielāks (vai mazāks) par citu līmeni, ņemot vērā salīdzināšanas bāzi. To aprēķina, no relatīvajām izmaiņām atņemot 100%, tas ir, pēc formulas:

vai procentos no absolūtajām izmaiņām līdz līmenim, pret kuru aprēķina absolūtās izmaiņas (bāzes līmenis), tas ir, saskaņā ar formulu:

.

Kādi ir šo rādītāju trūkumi? Kādos gadījumos ir lietderīgi tos izmantot? Kā šos trūkumus var novērst? Uzrakstiet formulas vidējo lielumu aprēķināšanai, kas nodrošina rindas kopējās vērtības saglabāšanu.

38.

Kā noteikt galvenās tendences veidu pēc sērijas līmeņu izmaiņu rādītāju vērtībām? Sniedziet piemērus.

Laikrindas vispārējās tendences identificēšanu var veikt, izlīdzinot laikrindas, izmantojot mainīgā vidējā metodi. Šīs tehnikas būtība ir tāda, ka aprēķinātie (teorētiskie) līmeņi tiek noteikti no sērijas sākotnējiem līmeņiem (empīriskiem datiem).

Šīs metodes piemērošanas galvenais nosacījums ir kustīgo (kustīgo) vidējo saišu aprēķināšana no tāda rindas līmeņu skaita, kas atbilst sērijā novērotās cikla dinamikas ilgumam.

ATBILDE

Komunikācijas tuvuma kvantitatīvais novērtējums pēc empīriskiem datiem sastāv no komunikācijas tuvuma rādītāju aprēķināšanas:

· Empīriskais determinācijas koeficients (empīriskā dispersijas attiecība) - r 2 .

Šo rādītāju aprēķina pēc analītiskā grupējuma (tabulas) datiem kā rezultāta pazīmes Y (d y 2) starpgrupu dispersijas attiecību pret kopējo dispersiju Y (s y 2):

Saskaņā ar dispersijas dekompozīcijas teorēmu starpgrupu dispersija ir saistīta ar kopējo dispersiju: ​​s y 2 =d y 2 +e y 2 . Tad empīrisko determinācijas koeficientu var aprēķināt, izmantojot atlikušo dispersiju, izmantojot formulu:

kur s j 2 ir rezultāta Y dispersija j-tajā grupā.

Empīriskais determinācijas koeficients raksturo grupēšanas atribūta (X) ietekmes stiprumu uz iegūtā atribūta Y kopējās variācijas veidošanos un parāda rezultāta atribūta variācijas procentuālo daļu (daļa) no pamatā esošā atribūta faktora. grupēšana.

R 2 ir ērti aprēķināt tabulā:

Zīmes faktors X j Nj Iezīmes rezultāta vidējā vērtība s j 2 N j
x1 N 1 s 1 2 N 1
x2 N 2 s 2 2 N 2
.... ...
X m N m s m 2 N m
Kopā N X es j 2

Tad .

Apsveriet piemēru. Dots 20 strādnieku kopums, ko raksturo šādi raksturlielumi: Y - strādnieka izlaide (gabals / maiņa) un X - kvalifikācija (rangs). Sākotnējie dati ir parādīti tabulā:

X
Y

Nepieciešams novērtēt pazīmju attiecību ciešumu, izmantojot empīrisko determinācijas koeficientu (r 2).

Lai aprēķinātu r 2, mēs veiksim populācijas analītisko grupēšanu. Kā zīmes faktoru mēs ņemam X (strādnieka kategoriju), kā zīmi-rezultātu - Y, strādnieka izvadi). Analītiskā grupēšana tiek veikta, pamatojoties uz X. Šajā gadījumā tā būs diskrēta (jo atribūta X vērtības diezgan bieži atkārtojas). Grupu skaits ir vienāds ar atribūta X vērtību skaitu apkopojumā, t.i. 6. R 2 grupēšanas un aprēķina rezultāti apkopoti tabulā:

Zīmes faktors X Rezultāta atribūts Y Vienību skaits grupā, N j zīme-rezultāta vidējā vērtība grupā, ( - ) 2 N j Iezīmes-rezultāta izkliede grupā, s 2 j s 2 j N j
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 \u003d ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 \u003d 1,56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 \u003d ((11-12,5) 2 + (14-12,5) 2) / 2 \u003d 2,25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 \u003d ((15-16,75) 2 + (17-16,75) 2 ++ (17-16,75) 2 + (18-16,75) 2) / 4 \u003d 1,9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 \u003d ((23-24,75) 2 + (24-24,75) 2 + (27-24,75) 2 + (25-24,75) 2) / 4 \u003d 2,19 8,75
=17,1 429,1 40,7

Empīriskais determinācijas koeficients ir vienāds ar rezultāta atribūta (d y 2) starpgrupu dispersijas attiecību pret rezultāta atribūta kopējo dispersiju (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2) + e y 2).

Starpgrupu dispersija Y būs vienāda ar: d y 2 = å( - ) 2 N j / N = 429,1/20=21,45.

Atlikusī dispersija Y būs: e y 2 = ås 2 j ·N j / N= 40,7/20= 2,035.

Tad: r 2 \u003d 21,45 / (21,45 + 2,035) \u003d 429,1 / (429,1 + 40,7) \u003d 0,913.

Secinājums: 91,3% no strādnieku izlaides svārstībām ir saistītas ar izlādes faktora ietekmi.

· Empīriskā korelācijas sakarība - r.

Šis rādītājs ir empīriskā determinācijas koeficienta sakne. Tas parāda savienojuma blīvumu (ne tikai lineāru!) starp grupēšanu un produktīvajām iezīmēm. Empīriskās korelācijas koeficienta pieļaujamo vērtību diapazons ir no 0 līdz +1.

Visciešākā iespējamā saikne ir funkcionāls savienojums, kad katru atribūta-rezultāta Y vērtību unikāli nosaka atribūta-faktora X vērtība (t.i., grupēšanas rezultāts). Šajā gadījumā grupas vidējā dispersija (d y 2) ir vienāda ar kopējo dispersiju (s y 2), t.i. grupas iekšienē nebūs variāciju. Šajā gadījumā atlikušā dispersija (e y 2) ir vienāda ar 0, un empīriskais determinācijas koeficients ir vienāds ar 1.

Ja starp zīmēm nav savienojuma, tad visi grupu vidējie ir vienādi viens ar otru, starpgrupu variācijas nebūs (d y 2 =0), un empīriskais determinācijas koeficients ir 0.

Aprēķināsim mūsu piemēra empīriskās korelācijas koeficientu: r= 0,9555. Secinājums: "strādnieka ražošanas" un "izlādes" pazīmes ir diezgan cieši saistītas.

Rādītājus r un r 2 nosaka ne tikai saiknes esamība starp pazīmēm X un Y, bet arī primāro datu grupēšanas fakts. Palielinoties grupu skaitam m, starpgrupu dispersija d 2 pieaug un tuvojas kopējai dispersijai. Ja grupu skaits ir mazāks par populācijas vienību skaitu N, tad r un r 2 vērtības nekad nebūs vienādas ar 1 pat ar stingru funkcionālu sakarību.

Ņemiet vērā, ka sakarības tuvuma rādītāja vērtība pati par sevi nav pierādījums cēloņsakarības esamībai starp pētītajām pazīmēm, bet gan novērtējums pazīmju izmaiņu savstarpējās konsekvences pakāpei. Pirms cēloņu un seku attiecību noteikšanas noteikti ir jāveic parādību kvalitatīvā rakstura analīze.

Empīriskā korelācijas sakarība

Divu pazīmju attiecības ciešumu vai stiprumu var izmērīt ar indikatoru, ko sauc par empīrisko korelācijas koeficientu. Šo rādītāju sauc par empīrisku, jo to var aprēķināt, pamatojoties uz parasto grupēšanu pēc faktora un rezultējošā atribūta, tas ir, pamatojoties uz korelācijas tabulu. Empīriskā korelācijas attiecība tiek iegūta no dispersiju saskaitīšanas noteikuma, saskaņā ar kuru , kur ir kopējā dispersija; - starpgrupu dispersija; - grupas iekšējā (privātās vidējās) izkliede. Starpgrupu dispersija ir faktora iezīmes izraisītas svārstības. Daļējo dispersiju vidējā vērtība ir visu citu (izņemot faktoriālo) pazīmju izraisīto svārstību mērs. Tad koeficients izsaka faktora zīmes izraisīto svārstību īpatsvaru kopējā svārstībā. Šīs attiecības kvadrātsakni sauc par empīrisko korelācijas koeficientu: .

Tas nozīmē, ka jo lielāka ir starpgrupu dispersija, jo spēcīgāka faktora iezīme ietekmē iegūtās pazīmes variāciju. Noviržu komponentu attiecības aprēķina no korelācijas tabulas datiem, izmantojot šādas formulas:

; ,

kur ir privātie vidējie rādītāji; - vispārējais vidējais; - kopsummas, pamatojoties uz ; - kopsummas, pamatojoties uz ; - novērojumu skaits. Tāda pati sakarība tiek saglabāta arī nosacītajām vērtībām, kas iegūtas ar skaitlisko transformāciju.

Pats dispersijas koeficients (radikālā izteiksme) tiek saukts par determinācijas koeficientu (tas ir arī vienāds ar empīriskās korelācijas koeficienta kvadrātu). Empīriskā korelācijas attiecība svārstās plašā diapazonā (no 0 līdz 1). Ja tas ir vienāds ar nulli, tad faktora zīme neietekmē korelācijas zīmi. Ja =1, tad rezultējošā zīme pilnībā ir atkarīga no faktora viens. Ja empīriskā korelācija ir daļa, kas ir tuvu vienam, tad viņi runā par ciešu saistību starp faktoriālajiem un efektīvām pazīmēm. Ja šī daļa ir maza (tuvu nullei), tad runā par vāju savienojumu starp tiem.

Empīriskā korelācijas sakarība

Asociācijas ciešuma mērīšanai tiek izmantoti vairāki rādītāji. Ar pāra savienojumu savienojuma blīvumu, pirmkārt, nosaka korelācijas koeficients, ko apzīmē ar η. Korelācijas koeficienta kvadrāts ir iegūtās pazīmes starpgrupu dispersijas attiecība, kas izsaka grupēšanas faktora pazīmes atšķirību ietekmi uz iegūtās pazīmes vidējo vērtību pret iegūtās pazīmes kopējo dispersiju, kas izsaka visu cēloņu un apstākļu ietekme uz to. Korelācijas koeficienta kvadrātu sauc par determinācijas koeficientu.

ny parādības un to pazīmes: ________________ vai stingri deterministiskas

kur k ir grupu skaits

N ir novērojumu skaits

y i - efektīvās pazīmes sākotnējās vērtības

y j - šīs grupas efektīvā atribūta vidējās vērtības

y ir objekta vidējā vērtība

f j ir grupas lielums

Iepriekš minētā formula tiek izmantota, aprēķinot savienojuma tuvuma rādītāju analītiskajai grupai. Aprēķinot korelācijas koeficientu pēc komunikācijas līmeņa, tiek izmantota šāda formula:

Kvadrātu summa skaitītājā ir iegūtās pazīmes y dispersija, kas izskaidrota ar saistību ar faktoru x (faktori). To aprēķina no atsevišķiem datiem, kas iegūti katrai populācijas vienībai, pamatojoties uz regresijas vienādojumu.

Ja vienādojums ir izvēlēts nepareizi vai tiek pieļauta kļūda, aprēķinot tā parametrus, tad kvadrātu summa skaitītājā var būt lielāka nekā saucējā, un attiecība zaudēs nozīmi, kādai tai vajadzētu būt. Lai izvairītos no kļūdaina rezultāta, labāk ir aprēķināt korelācijas koeficientu, izmantojot šādu formulu:

Šī formula ir balstīta uz labi zināmo noteikumu par noviržu kvadrātu summas paplašināšanu, grupējot populāciju:

D kopīgs=D intergr+D intragr

Saskaņā ar šo noteikumu starpgrupu (faktoriālās) dispersijas vietā varat izmantot atšķirību:

D kopīgs-D intragr

ko dod:

Aprēķinot η nevis pēc grupēšanas, bet pēc korelācijas vienādojuma (regresijas vienādojuma), izmantojam formulu. Šajā gadījumā dekompozīcijas noteikums iegūtās pazīmes kvadrātu noviržu summai tiek uzrakstīts kā

D kopā \u003d D kodols + D atpūta

Vissvarīgākais, kas tagad būtu jāapgūst ikvienam, kurš vēlas pareizi pielietot korelācijas-regresijas analīzes metodi, ir (1.2) un (1.3) formulu interpretācija. Šis noteikums skan:

Korelācijas vienādojums mēra attiecības starp iegūtās pazīmes variāciju un faktora pazīmes(-u) variāciju. Savienojuma blīvuma mēri mēra iegūtās pazīmes variācijas proporciju, kas saistīta ar faktora pazīmes (iezīmju) variāciju.

| nākamā lekcija ==>

Tops