Empīriskais determinācijas koeficients parāda. Mūsu piemēram, empīriskā korelācija

Ko populācijai nozīmē grupas iekšējā dispersija? Kāda ir tā aprēķināšanas formula? Sniedziet piemēru. Ko nozīmē starpgrupu populācijas dispersija? Kāda ir tā aprēķināšanas formula? Sniedziet piemēru.

Grupas iekšējā dispersija () apzīmē nejaušu variāciju, kas nav atkarīga no grupējuma pamatā esošās pazīmes.

, kur

Grupas vidējais rādītājs

Vidējo grupas iekšējo dispersiju aprēķina šādi: vispirms aprēķina atsevišķu grupu atšķirības (), pēc tam aprēķina vidējo grupas iekšējo dispersiju:

Raksturo sistemātisku variāciju, t.i. pētāmās pazīmes lieluma atšķirības, kas ir grupēšanas pamatā. Šo izkliedi aprēķina pēc formulas

, kur

Atsevišķas grupas vidējā vērtība

n i- vienību skaits grupā

- visas pētījuma populācijas vispārējais aritmētiskais vidējais.

Visi trīs dispersijas veidi ir savstarpēji saistīti: kopējā dispersija ir vienāda ar vidējās grupas iekšējās dispersijas un starpgrupu dispersijas summu:

Šī attiecība atspoguļo likumu, ko sauc dispersijas pievienošanas noteikums.

20.

Ko nozīmē kopējā populācijas dispersija? Kāda ir tā aprēķināšanas formula? Vai grupu grupēšanas veids ietekmē kopējo dispersiju? Sniedziet piemēru.

Kopējā dispersija () raksturo visas populācijas pazīmes variāciju visu to faktoru ietekmē, kas izraisīja šīs izmaiņas. Šo vērtību nosaka pēc formulas

, kur

visas pētījuma populācijas vispārējais aritmētiskais vidējais.

No otras puses, kopējā dispersija ir vienāda ar vidējās grupas iekšējās dispersijas un starpgrupu dispersijas summu:

Šī attiecība atspoguļo likumu, ko sauc dispersijas pievienošanas noteikums.. Pateicoties dispersiju saskaitīšanas noteikumam, ir iespējams noteikt, kāda kopējās dispersijas daļa atrodas grupēšanas pamatā esošā raksturīgā faktora ietekmē.

Jo augstāks ir starpgrupu dispersijas īpatsvars kopējā dispersijā, jo spēcīgāka ir faktora atribūta (ranga) ietekme uz rezultātu (produkciju).

Šo proporciju raksturo empīrisks determinācijas koeficients:

Zīmju attiecību ciešuma kvalitatīvam novērtējumam tiek izmantotas Čadoka attiecības.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Savienojuma stiprums

trūkst

ļoti vāja

vājš

mērens

uzkrītošs

aizveriet

ļoti tuvu

funkcionāls-

deguna

21.

Ko parāda determinācijas koeficients? Kāda ir tā aprēķināšanas formula? Kādās vienībās mēra šo rādītāju? Kādas ir šī indikatora iespējamās vērtības? Ko parāda empīriskā korelācija? Kāda ir tā aprēķināšanas formula? Kādās vienībās mēra šo rādītāju? Kādas ir šī indikatora iespējamās vērtības?

Empīriskais determinācijas koeficients () raksturo starpgrupu dispersijas daļu kopējā dispersijā:

Tas ņem vērtības no -1 līdz 1 un parāda, cik lielas iezīmes variācijas kopumā ir saistītas ar grupēšanas faktoru.

Starpgrupu dispersija;

kopējā dispersija.

Nosaka pēc formulas:

Pieņem vērtības no -1 līdz 1

Piemērs

Grupa

Stādu skaits grupā, gab.

Vidējā bruto izlaide salīdzināmās cenās, miljoni rubļu

Tagad noteiksim bruto produkcijas vidējo vērtību, kopējo dispersiju un starpgrupu dispersiju rūpnīcu salīdzināmās cenās:

miljons rubļu;

Miljons berzēt.2;

Miljons berzēt.2.

Determinācijas koeficients būs vienāds ar:

Rezultātā empīriskā korelācijas attiecība būs vienāda ar:

Aprēķinātā empīriskās korelācijas koeficienta vērtība norāda uz diezgan augstu statistisko sakarību starp bruto izlaidi salīdzināmās cenās un rūpnīcu ražošanas pamatlīdzekļu vidējām gada izmaksām.

22.

Kā vienfaktoru dispersijas analīzē tiek aprēķināta testa statistika? Kāds ir tā sadalījuma likums saskaņā ar galvenās hipotēzes derīgumu? Kādi ir šī likuma parametri? Kā tiek pieņemts lēmums vienvirziena dispersijas analīzē, pamatojoties uz kritērija statistikas aprēķināto vērtību?

Dispersijas analīzes uzdevums ir izpētīt viena vai vairāku faktoru ietekmi uz aplūkojamo pazīmi.

Vienvirziena dispersijas analīzi izmanto, ja ir pieejami trīs vai vairāki neatkarīgi paraugi, kas iegūti no vienas un tās pašas vispārējās kopas, mainot kādu neatkarīgu faktoru, kuram kaut kādu iemeslu dēļ nav kvantitatīvu mērījumu.

Kā kritērijs ir jāizmanto Fišera kritērijs:

., kur

J 1 ir izlases vidējo noviržu kvadrātā summa no kopējā vidējā

J 2 ir novēroto vērtību noviržu kvadrātā summa no parauga vidējās vērtības

Ja Fišera kritērija aprēķinātā vērtība ir mazāka par tabulas vērtību, nav pamata uzskatīt, ka neatkarīgais faktors ietekmē vidējo vērtību izplatību ( tie. hipotēze neapstiprinājās). Pretējā gadījumā neatkarīgais faktors būtiski ietekmē vidējo vērtību izplatību ( hipotēze ir pareiza).

23-25.

1. Ar vienādiem intervāliem izmantojiet vienkāršo vidējo aritmētisko:

kur y ir sērijas absolūtie līmeņi;
n- sērijas līmeņu skaits.
2. Nevienādiem intervāliem izmantojiet svērto vidējo aritmētisko:

kur u 1 ,...,уn - dinamikas sērijas līmeņi;
t1,... tn - svari, laika intervālu ilgums.

Momentu sēriju vidējais līmenis Dinamika tiek aprēķināta pēc formulas:
1. Ar vienādiem līmeņiem aprēķina pēc vidējo hronoloģisko momentu rindas formulas:

kur u 1 ,...,уn - perioda līmeņi, par kuru veikts aprēķins;
n- līmeņu skaits;
n-1 - laika perioda ilgums.
2. C nevienlīdzīgi līmeņus aprēķina, izmantojot hronoloģiski svērto vidējo formulu:

kur u 1 ,...,уn - laikrindu līmeņi;
t- laika intervāls starp blakus esošajiem līmeņiem

statistikā

Vidējais absolūtais pieaugums ir definēts kā vidējais absolūtais pieaugums vienādos laika intervālos vienā periodā. To aprēķina pēc formulām: 1. Pamatojoties uz ķēdes datiem par absolūto pieaugumu vairāku gadu garumā, vidējo absolūto pieaugumu aprēķina kā vidējo aritmētiski vienkāršu:

kur n ir pakāpju likuma absolūto pieaugumu skaits pētāmajā periodā.
2. Tiek aprēķināts vidējais absolūtais pieaugumscaur pamata absolūto pieaugumu vienādu intervālu gadījumā

kur m - dinamikas sērijas līmeņu skaits pētījuma periodā, ieskaitot bāzes līmeni.

Vidējais pieauguma temps ir brīvs vispārinošs raksturlielums līmeņa maiņas intensitāteidinamikas sērija un parāda, cik reižu dinamikas rindas līmenis mainās vidēji laika vienībā.
Par pamatu un kritēriju vidējā pieauguma (samazinājuma) ātruma aprēķināšanas pareizībai tiek izmantots vispārinošs rādītājs, kas tiek aprēķināts kā ķēdes pieauguma tempu reizinājums, kas vienāds ar pieauguma tempu visā aplūkojamajā periodā. Ja atribūta vērtība tiek veidota kā produkts individuālas iespējas, tad tiek izmantots ģeometriskais vidējais.
Tā kā vidējais augšanas ātrums ir vidējais pieauguma koeficients, kas izteikts procentos, tad ekvivalentajām dinamikas sērijām aprēķini, izmantojot ģeometrisko vidējo, tiek samazināti līdz vidējo pieauguma koeficientu aprēķināšanai no ķēdes koeficientiem, izmantojot “ķēdes metodi”:

kur n ir ķēdes augšanas faktoru skaits;
kts- ķēdes augšanas faktori;
Kb - bāzes pieauguma temps visam periodam.
Vidējā augšanas faktora noteikšanavar vienkāršot, ja laikrindu līmeņi ir skaidri. Tā kā ķēdes augšanas faktoru reizinājums ir vienāds ar bāzes koeficientu, tad bāzes augšanas faktors tiek aizvietots radikālajā izteiksmē.
Formula vidējā augšanas faktora noteikšanaivienāda attāluma dinamikas sērijām saskaņā ar "pamata metodi" būs šāda:

36.

Kādi ir tev zināmie absolūtie seriāla līmeņa izmaiņu rādītāji?

Visus šos rādītājus var noteikt pamata veidā, kad līmenis dotajā periodā salīdzinot ar pirmo (pamata) periodu, vai ķēdes veidā - kad tiek salīdzināti divi blakus periodu līmeņi.

Uzrakstiet aprēķinu formulas.

Galvenās absolūtās izmaiņas ir starpība starp sērijas īpašo un pirmo līmeni, ko nosaka formula

Tas parāda, cik daudz (rindas rādītāju vienībās) viena (i-tā) perioda līmenis ir vairāk vai mazāks par pirmo (pamata) līmeni, un tāpēc var būt ar “+” zīmi (ar pieaugumu līmeņos) vai “–” (ar līmeņa pazemināšanos).

Ķēdes absolūtās izmaiņas ir atšķirība starp konkrēto un iepriekšējo sērijas līmeni, ko nosaka pēc formulas

Tas parāda, cik daudz (rindas rādītāju vienībās) viena (i-tā) perioda līmenis ir vairāk vai mazāks par iepriekšējo līmeni, un var būt ar "+" vai "-" zīmi.

Paskaidrojiet, kā aprēķina metode ir atkarīga no salīdzināšanas bāzes izvēles.

Kādi relatīvie sērijas līmeņa izmaiņu rādītāji jums ir zināmi? Uzrakstiet aprēķinu formulas.

Pamata relatīvās izmaiņas (pamata pieauguma temps vai pamata dinamikas indekss) ir rindas specifiskā un pirmā līmeņa attiecība, ko nosaka pēc formulas

Ķēdes relatīvās izmaiņas (ķēdes augšanas ātrums vai ķēdes dinamikas indekss) ir noteikta un iepriekšējā sērijas līmeņa attiecība, ko nosaka pēc formulas

Paskaidrojiet, kā aprēķina metode ir atkarīga no salīdzināšanas bāzes izvēles.

Relatīvās izmaiņas parāda, cik reizes noteiktā perioda līmenis ir lielāks par jebkura iepriekšējā perioda līmeni (ja i ​​> 1) vai kāda tā daļa ir (i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Kādi ir tev zināmie vidējie seriāla līmeņa izmaiņu rādītāji? Uzrakstiet formulas rindas līmeņu vidējā absolūtā pieauguma, pieauguma ātruma un pieauguma ātruma aprēķināšanai.

Vidējais absolūtais pieaugums tiek definēts kā absolūtā pieauguma vidējais vienādos laika periodos vienā periodā. To aprēķina pēc formulām: 1. Pamatojoties uz ķēdes datiem par absolūto pieaugumu vairāku gadu garumā, vidējo absolūto pieaugumu aprēķina kā vidējo aritmētiski vienkāršu:

kur n ir pakāpju likuma absolūto pieaugumu skaits pētāmajā periodā.

2. Vidējais absolūtais pieaugums tiek aprēķināts, izmantojot pamata absolūto pieaugumu vienādu intervālu gadījumā

kur m - dinamikas sērijas līmeņu skaits pētījuma periodā, ieskaitot bāzes līmeni.

Vidējais pieauguma temps ir brīvs vispārinošs raksturlielums dinamikas virknes līmeņu izmaiņu intensitātei un parāda, cik reižu dinamikas sērijas līmenis vidēji mainās laika vienībā.

Par pamatu un kritēriju vidējā pieauguma (samazinājuma) ātruma aprēķināšanas pareizībai tiek izmantots vispārinošs rādītājs, kas tiek aprēķināts kā ķēdes pieauguma tempu reizinājums, kas vienāds ar pieauguma tempu visā aplūkojamajā periodā. Ja raksturīgo vērtību veido kā atsevišķu iespēju reizinājumu, tad izmanto ģeometrisko vidējo.

Tā kā vidējais augšanas ātrums ir vidējais pieauguma koeficients, kas izteikts procentos, tad ekvivalentajām dinamikas sērijām aprēķini, izmantojot ģeometrisko vidējo, tiek samazināti līdz vidējo pieauguma koeficientu aprēķināšanai no ķēdes koeficientiem, izmantojot “ķēdes metodi”:

kur n ir ķēdes augšanas faktoru skaits;

Кц - pieauguma ķēdes koeficienti;

Kb - bāzes pieauguma temps visam periodam.

Līmeņu izmaiņu ātrums (pieauguma temps) ir relatīvs rādītājs, kas parāda, cik procentu noteiktais līmenis ir lielāks (vai mazāks) par citu līmeni, ņemot vērā salīdzināšanas bāzi. To aprēķina, no relatīvajām izmaiņām atņemot 100%, tas ir, pēc formulas:

vai procentos no absolūtajām izmaiņām līdz līmenim, pret kuru aprēķina absolūtās izmaiņas (bāzes līmenis), tas ir, saskaņā ar formulu:

.

Kādi ir šo rādītāju trūkumi? Kādos gadījumos ir lietderīgi tos izmantot? Kā šos trūkumus var novērst? Uzrakstiet formulas vidējo lielumu aprēķināšanai, kas nodrošina rindas kopējās vērtības saglabāšanu.

38.

Kā noteikt galvenās tendences veidu pēc sērijas līmeņu izmaiņu rādītāju vērtībām? Sniedziet piemērus.

Laikrindas vispārējās tendences identificēšanu var veikt, izlīdzinot laikrindas, izmantojot mainīgā vidējā metodi. Šīs tehnikas būtība ir tāda, ka aprēķinātie (teorētiskie) līmeņi tiek noteikti no sērijas sākotnējiem līmeņiem (empīriskiem datiem).

Šīs metodes piemērošanas galvenais nosacījums ir kustīgo (kustīgo) vidējo saišu aprēķināšana no tāda rindas līmeņu skaita, kas atbilst sērijā novērotās cikla dinamikas ilgumam.

Empīriskā korelācijas sakarība

Divu pazīmju attiecības ciešumu vai stiprumu var izmērīt ar indikatoru, ko sauc par empīrisko korelācijas koeficientu. Šo rādītāju sauc par empīrisku, jo to var aprēķināt, pamatojoties uz parasto grupēšanu pēc faktora un rezultējošā atribūta, tas ir, pamatojoties uz korelācijas tabulu. Empīriskā korelācija tiek iegūta no dispersijas saskaitīšanas likuma, saskaņā ar kuru , kur
- kopējā dispersija;
- starpgrupu dispersija;
- grupas iekšējā (privātās vidējās) izkliede. Starpgrupu dispersija ir faktora iezīmes izraisītas svārstības. Daļējo dispersiju vidējā vērtība ir visu citu (izņemot faktoriālo) pazīmju izraisīto svārstību mērs. Tad koeficients izsaka faktora zīmes izraisīto svārstību īpatsvaru kopējā svārstībā. Šīs attiecības kvadrātsakni sauc par empīrisko korelācijas koeficientu:
.

Tas nozīmē, ka jo lielāka ir starpgrupu dispersija, jo spēcīgāka faktora iezīme ietekmē iegūtās pazīmes variāciju. Noviržu komponentu attiecības aprēķina no korelācijas tabulas datiem, izmantojot šādas formulas:

;
,

kur ir privātie vidējie rādītāji; - vispārējais vidējais; - kopsummas pēc pazīmēm ; - kopsummas pēc pazīmēm ;
- novērojumu skaits. Tāda pati attiecība attiecas uz nosacītajām vērtībām
, kas iegūts ar skaitlisko pārveidošanu .

Pats dispersijas koeficients (radikālā izteiksme) tiek saukts par determinācijas koeficientu (tas ir arī vienāds ar empīriskās korelācijas koeficienta kvadrātu). Empīriskā korelācijas attiecība svārstās plašā diapazonā (no 0 līdz 1). Ja tas ir vienāds ar nulli, tad faktora zīme neietekmē korelācijas zīmi. Ja =1, kas nozīmē, ka rezultējošā zīme ir pilnībā atkarīga no faktora viens. Ja empīriskā korelācijas koeficients ir daļskaitlis, kas ir tuvu vienam, tad viņi runā par ciešu saistību starp faktoriālās un efektīvās pazīmes. Ja šī daļa ir maza (tuvu nullei), tad runā par vāju savienojumu starp tiem.

Lineārās korelācijas koeficients un korelācijas indekss

Divu statistiski saistītu pazīmju attiecības ciešuma mērs ir lineārās korelācijas koeficients vai vienkārši korelācijas koeficients. Tam ir tāda pati nozīme kā empīriskajai korelācijas attiecībai, taču tam var būt gan pozitīvas, gan negatīvas vērtības. Korelācijas koeficientam ir stingra matemātiska izteiksme lineārai sakarībai. Pozitīva vērtība norāda uz tiešu saistību starp pazīmēm, negatīva vērtība norāda uz pretējo.

Pāru korelācijas koeficientu lineāras komunikācijas formas gadījumā aprēķina pēc formulas

,

un tā parauga vērtība - pēc formulas

Ar nelielu novērojumu skaitu ir ērti aprēķināt izlases korelācijas koeficientu, izmantojot šādu formulu:

Intervālā mainās korelācijas koeficienta vērtība
.

Plkst
starp abiem mainīgajiem pastāv funkcionāla saistība, kad
- tiešs funkcionāls savienojums. Ja
, tad X un Y vērtības paraugā nav korelētas; ja gadījuma lielumu sistēma
ir divdimensiju normālais sadalījums, tad arī lielumi X un Y būs neatkarīgi.

Ja korelācijas koeficients ir intervālā
, tad starp X un Y pastāv apgriezta korelācija. To apstiprina arī sākotnējās informācijas vizuālā analīze. Šajā gadījumā Y novirzi no vidējās vērtības ņem ar pretēju zīmi.

Ja katrs X un Y vērtību pāris visbiežāk vienlaikus ir virs (zem) atbilstošajām vidējām vērtībām, tad starp vērtībām pastāv tieša korelācija un korelācijas koeficients ir intervālā
.

No otras puses, ja X vērtības novirze no vidējās vērtības vienlīdz bieži izraisa Y vērtības novirzes uz leju no vidējās vērtības un novirzes visu laiku ir atšķirīgas, tad mēs varam pieņemt, ka korelācijas koeficientam ir tendence uz nulli.

Jāņem vērā, ka korelācijas koeficienta vērtība nav atkarīga no mērvienībām un atskaites punkta izvēles. Tas nozīmē, ka, ja mainīgie X un Y tiek samazināti (palielināti) par K reizes vai ar tādu pašu skaitli C, tad korelācijas koeficients nemainīsies.

Lai vienkāršotu korelācijas blīvuma mēra aprēķinu, bieži tiek izmantots korelācijas indekss, ko nosaka pēc šādām formulām:

,
,

kur
- atlikušā dispersija, kas raksturo iegūtā atribūta izmaiņas citu neņemtu faktoru ietekmē.

Daudzkārtēja korelācija

Daudzkārtēja korelācija - rezultējošā un divu vai vairāku pētījumā iekļauto faktoru raksturlielumu atkarība. Rādītāju, kas norāda uz rezultējošās un divu vai vairāku faktoru pazīmju attiecības tuvumu, sauc par daudzkārtējo jeb kumulatīvo korelācijas koeficientu, un to apzīmē ar R. Kumulatīvais koeficients nozīmē lineāras attiecības esamību starp katru pazīmju pāri, ko var izteikts, izmantojot pāru korelācijas koeficientus. Ja ir kumulatīvs sakarības saspringuma mērs starp efektīvo pazīmi () un divām faktoru pazīmēm ( un ), tad kumulatīvās korelācijas koeficienta aprēķinu veic pēc formulas:

,

Kur apakšindeksi norāda, starp kurām pazīmēm pāru attiecības tiek pētītas.

Pāru korelācijas koeficientu aprēķināšanas formulās mainās tikai vienu vai otru faktoru apzīmējošie simboli. Tātad, ja korelācijas koeficientu starp un aprēķina pēc formulas , tad korelācijas koeficientu starp un aprēķina: ; starp un — tātad:

Norēķinu daļa

31. uzdevums

    Par desmit uzņēmumiem ir pieejami šādi dati par pārskata periodu:

2. tabula

Uzņēmumi

Ražošanas pamatlīdzekļu vidējās gada izmaksas, milj.

Izlaide, miljoni rubļu

Lai izpētītu saistību starp pamatlīdzekļu vidējo gada izmaksu lielumu un izlaidi, aprēķina lineāro attiecību vienādojumu.

2. Pamatojoties uz dotajiem datiem: a) aprēķina: lineārās korelācijas koeficientu; b) pārbaudīt saziņas formas izvēles pareizību, aprēķinot korelācijas indeksu.

    Izmantojot izklājlapu procesoru Microsoft Excel, mēs izveidosim darblapu:

3. tabula

Summu aprēķins taisnes vienādojuma parametru aprēķināšanai

239,74 * 1236 = 539,1 varbūtības sadalījums... ekonomisks analīze, atrisināts, pamatojoties uz regresija ekonomisks modeļiem. Apskatīsim y - efektīvo zīmi un x - koeficienta zīmes. Metodes salīdzināmi-regresija analīze ...

  • Disciplīnas "Socioloģisko datu analīzes datormetodes" programma (Ievads matemātiskajā statistikā un datu analīzē) Virzienam 040200. 68 "Socioloģija"

    disciplīnas programma

    Lietojumprogrammas. 11 3 2 6 Dispersīvs analīze 9 2 2 5 Dubultā un daudzkārtējā regresīvs analīze 9 2 2 5 Koeficientu īpašības... pēc SPSS lietotāja 11.0 Siskov V.I. korelācija analīze iekšā ekonomisks pētījumiem. M. 1975. Edduss M., Stensfīlda...

  • G. L. Savitskaja uzņēmuma saimnieciskās darbības analīze

    Dokuments

    Izcilība, jaunākās tehnikas ekonomisks pētījumiem. Analīze jābūt sarežģītai. Pētījumu sarežģītība ... par vidējās stundas produkcijas līmeni salīdzināmi-regresīvs analīze. daudzfaktoriālā korelācija vidējās stundas produkcijas modelis...

  • 3. Empīriskās korelācijas koeficientu aprēķina pēc formulas

    Starpgrupu dispersija, kas raksturo grupas vidējo novirzes kvadrāta vērtību no efektīvā atribūta vispārējā vidējā.

    Kopējā dispersija, kas parāda iegūtā objekta vērtības noviržu vidējo vērtību kvadrātā no to vidējā līmeņa.

    Izveidosim tabulu, lai aprēķinātu kopējo dispersiju (sk. 8. tabulu)

    8. tabula

    Datu tabula kopējās dispersijas noteikšanai

    N, p/p Pārtikas izdevumi
    1 21 441
    2 16 256
    3 26,1 681,21
    4 28 784
    5 26 676
    6 22,5 506,25
    7 27,6 761,76
    8 35 1225
    9 23,9 571,21
    10 22,5 506,25
    11 15 225
    12 25,2 635,04
    13 29 841
    14 21,4 457,96
    15 24,9 620,01
    16 24,8 615,04
    17 16 256
    18 23,6 556,96
    19 27,2 739,84
    20 35 1225
    21 17 289
    22 23,8 566,44
    23 22,6 510,76
    24 25 625
    25 27 729
    26 30 900
    27 35 1225
    28 25,4 645,16
    29 27,2 739,84
    30 26,3 691,69
    Kopā 750 19502,42

    Iegūtā atribūta kopējo dispersiju aprēķina pēc formulas:

    =

    Starpgrupu dispersiju aprēķina pēc formulas:

    Izveidosim palīgtabulu datu aprēķināšanai (skat. 9. tabulu)


    9. tabula

    Datu tabula starpgrupu dispersijas aprēķināšanai

    Grupas numurs Mājsaimniecību skaits, gab Izdevumi par pārtiku, tūkstoši rubļu
    Kopā Vidēji uz vienu mājsaimniecību
    f
    1 28-40 3 48 16 -9 81 243
    2 40-52 5 105 21 -4 16 80
    3 52-64 12 300 25 0 0 0
    4 64-76 6 165 27,5 2,5 6,25 37,5
    5 76-88 4 132 33 8 64 256
    Kopā 30 750 616,5

    Secinājums: sakarība starp faktoriem ir ļoti cieša, jo ņem vērtības no 0,9 līdz 0,99.

    Determinācijas koeficients ir empīriskās korelācijas kvadrāts. Sekojoši,

    (81,9%)

    Secinājums: izlaide šajos uzņēmumos ir atkarīga no 81,9% kapitāla produktivitātes un 18,1% no citiem faktoriem.

    3. uzdevums

    Pamatojoties uz 1. uzdevuma rezultātiem ar varbūtību 0,9543, nosakiet:

    1. Vidējo bruto ienākumu uz vienu mājsaimniecības locekli gadā izlases kļūda un robežas, kurās tie atradīsies vispārējā populācijā.

    2. Izlases kļūda mājsaimniecību īpatsvaram, kuru bruto ienākumi ir mazāki par 52 tūkstošiem rubļu. un vairāk nekā miljons rubļu. un robežas, kurās atradīsies vispārējā akcija.

    1. Vidējās vērtības izlases kļūdu nosaka pēc formulas:

    , kur

    izlases dispersija;

    n - izlases lielums;

    t ir ticamības koeficients, ko nosaka no Laplasa integrālās funkcijas vērtību tabulas noteiktai varbūtībai. Šajā gadījumā pie P=0,954 vērtība t=2.

    N-vienību skaits kopējā populācijā, N=6000 gab.

    Aprēķināsim dispersiju. Dati tiks parādīti tabulas veidā (sk. 11. tabulu).

    11. tabula

    Dati aktīvu atdeves līmeņa dispersijas aprēķināšanai

    Grupas numurs Mājsaimniecību grupēšana pēc bruto ienākumiem Mājsaimniecību skaits, gab
    f
    1 28-40 3 34 -25,1 630,01 1890,03
    2 40-52 5 46 -13,1 171,61 858,05
    3 52-64 12 58 -1,1 1,21 14,52
    4 64-76 6 70 10,9 118,81 712,86
    5 76-88 4 82 22,9 524,41 2097,64
    Kopā 30 5573,1

    Empīriskā korelācijas sakarība

    Asociācijas ciešuma mērīšanai tiek izmantoti vairāki rādītāji. Ar pāra savienojumu savienojuma blīvumu, pirmkārt, nosaka korelācijas koeficients, ko apzīmē ar η. Korelācijas koeficienta kvadrāts ir iegūtās pazīmes starpgrupu dispersijas attiecība, kas izsaka grupēšanas faktora pazīmes atšķirību ietekmi uz iegūtās pazīmes vidējo vērtību pret iegūtās pazīmes kopējo dispersiju, kas izsaka visu cēloņu un apstākļu ietekme uz to. Korelācijas koeficienta kvadrātu sauc par determinācijas koeficientu.

    ny parādības un to pazīmes: ________________ vai stingri deterministiskas

    kur k ir grupu skaits

    N ir novērojumu skaits

    y i - efektīvās pazīmes sākotnējās vērtības

    y j - šīs grupas efektīvā atribūta vidējās vērtības

    y ir objekta vidējā vērtība

    f j ir grupas lielums

    Iepriekš minētā formula tiek izmantota, aprēķinot savienojuma tuvuma rādītāju analītiskajai grupai. Aprēķinot korelācijas koeficientu pēc komunikācijas līmeņa, tiek izmantota šāda formula:

    Kvadrātu summa skaitītājā ir iegūtās pazīmes y dispersija, kas izskaidrota ar saistību ar faktoru x (faktori). To aprēķina no atsevišķiem datiem, kas iegūti katrai populācijas vienībai, pamatojoties uz regresijas vienādojumu.

    Ja vienādojums ir izvēlēts nepareizi vai tiek pieļauta kļūda, aprēķinot tā parametrus, tad kvadrātu summa skaitītājā var būt lielāka nekā saucējā, un attiecība zaudēs nozīmi, kādai tai vajadzētu būt. Lai izvairītos no kļūdaina rezultāta, labāk ir aprēķināt korelācijas koeficientu, izmantojot šādu formulu:

    Šī formula ir balstīta uz labi zināmo noteikumu par noviržu kvadrātu summas paplašināšanu, grupējot populāciju:

    D kopīgs=D intergr+D intragr

    Saskaņā ar šo noteikumu starpgrupu (faktoriālās) dispersijas vietā varat izmantot atšķirību:

    D kopīgs-D intragr

    ko dod:

    Aprēķinot η nevis pēc grupēšanas, bet pēc korelācijas vienādojuma (regresijas vienādojuma), izmantojam formulu. Šajā gadījumā dekompozīcijas noteikums iegūtās pazīmes kvadrātu noviržu summai tiek uzrakstīts kā

    D kopā \u003d D kodols + D atpūta

    Vissvarīgākais punkts, kas tagad būtu jāapgūst ikvienam, kurš vēlas pareizi pielietot korelācijas-regresijas analīzes metodi, ir (1.2) un (1.3) formulu interpretācija. Šis noteikums skan:

    Korelācijas vienādojums mēra saistību starp iegūtās pazīmes variāciju un faktora pazīmes(-u) variāciju. Savienojuma blīvuma mēri mēra iegūtās pazīmes variācijas proporciju, kas saistīta ar faktora pazīmes (iezīmju) variāciju.

    | nākamā lekcija ==>

    Empīriskā korelācijas attiecība mēra, cik lielu daļu no iegūtā atribūta kopējām svārstībām izraisa pētītais faktors. Empīriskās korelācijas vidējais rādītājs svārstās no 0 līdz 1.

    Empīriskā korelācija parasti tiek atrasta šādus veidus uzdevumi:

    • 1) ja nepieciešams izveidot analītisku grupējumu divām datu sērijām X un Y
    • 2) grupēšana jau ir veikta, nepieciešams pārbaudīt dispersiju pievienošanas noteikumu
    • 3) divām datu rindām X un Y jāatrod regresijas vienādojums un jānovērtē tā nozīme

    dispersijas formula alternatīva funkcija

    Pamatojoties uz iepriekš minēto, mēs varam iegūt formulu alternatīvas pazīmes dispersijas atrašanai, ja zinām šādas pazīmes procentuālo daudzumu kopējā izlasē.

    Sākotnēji mēs pieņemam, ka funkcijai ir tikai divas vērtības.

    Tādējādi to elementu proporcijas summa, kurā statistikas sērijas elementiem ir atribūta vērtība "nē" un sērijas elementiem, kuriem ir atribūta vērtība "jā", ir vienāda ar vienu.

    Lai atrastu rindas vidējo vērtību, statistiskās rindas vidējās svērtās vērtības noteikšanas formulā aizstājam alternatīvo pazīmju (0 un 1) vērtības. No kurienes, diezgan acīmredzami, būs vienība saucējā, bet elementu procentuālā vērtība "1" skaitītājā. Tas ir, tieši elementu ar atribūtu "1" procentuālā vērtība. (Formula 2)

    Dispersijas formula ir katras datu sērijas vērtības kvadrātveida noviržu vidējā svērtā vērtība. (Formula 3)

    Tā kā mūsu sērijās datiem ir tikai divu veidu vērtības - "0" un "1", tad formula dispersijas atrašanai sērijai ar alternatīvu pazīmi tiek reducēta uz formulu 4. Paskaidrojums. tā kā mēs tikko secinājām, ka izlases vidējais ir vienāds ar p (2. formula), tad starpības kvadrāta vērtība starp vērtību (0/1) un vidējo vērtību saskaņā ar 1. formulu būs (1- p)2 pirmajā gadījumā un otrajā gadījumā (1-q)2 , tagad piemērojot pirmās formulas secinājumu: q = 1 - p, p = 1- q . Mēs iegūstam p2 un q2 . Attiecīgi vērtību "0" un "1" proporcija ir vienāda ar p un q, kā rezultātā skaitītājā, un izrādās q2 p un p2 q. Vērtību "0" un "1" pazīmju daļu summa saskaņā ar 1. formulu ir vienāda ar 1. Rezultātā 4. formula iegūst vērtību pq, kas būs vienāda ar dispersijas vērtību alternatīvā funkcija. Pamatojoties uz atrasto alternatīvās pazīmes dispersijas vērtību, mēs atradīsim standarta novirzi (5. formula). Ievietojot Formulas 1 vērtību Formulā 5, mēs iegūstam standarta novirzes formulu sērijas ar alternatīvu pazīmi dispersijai.

    
    Tops