Empīriskā korelācijas koeficienta formula. Determinācijas koeficients un empīriskā korelācija

Risinājums. Lai aprēķinātu grupu izkliedi, mēs aprēķinām katras grupas vidējos lielumus:

PC.; PC.

Starpposma dispersiju aprēķini pa grupām ir parādīti tabulā. 3.2. Aizvietojot iegūtās vērtības formulā (3.4), mēs iegūstam:

Grupu novirzes vidējais rādītājs

Tad mēs aprēķinām starpgrupu dispersiju. Lai to izdarītu, vispirms definējam kopējo vidējo vērtību kā grupu vidējo svērto vērtību:

Tagad mēs definējam starpgrupu dispersiju

Tādējādi kopējā dispersija saskaņā ar dispersiju saskaitīšanas noteikumu:

Pārbaudīsim rezultātu, aprēķinot kopējo dispersiju parastajā veidā:

Pamatojoties uz dispersiju pievienošanas noteikumu, ir iespējams noteikt grupēšanas (faktoriālās) un efektīvās pazīmes attiecības ciešuma rādītāju. To sauc par empīrisko korelācijas koeficientu, apzīmē (“this”) un aprēķina pēc formulas

Mūsu piemēram, empīriskā korelācijas attiecības

.

Vērtība 0,86 raksturo būtisku saistību starp grupēšanu un veiktspējas raksturlielumiem.

Vērtību sauc par determinācijas koeficientu un parāda starpgrupu dispersijas daļu kopējā dispersijā.

Līdzās kvantitatīvo pazīmju variācijai var novērot arī kvalitatīvo pazīmju variāciju. Šāds variāciju pētījums, tāpat kā kvantitatīvo pazīmju proporcijas, tiek panākts, aprēķinot un analizējot šādus dispersiju veidus.

Daļas iekšējās grupas dispersiju nosaka pēc formulas

. (3.17)

Grupas iekšējo dispersiju vidējo vērtību aprēķina kā

. (3.18)

Starpgrupu dispersijas formula ir šāda:

, (3.19)

Kur n i– vienību skaits atsevišķās grupās;

- pētāmās pazīmes īpatsvars visā populācijā, ko nosaka pēc formulas

Kopējai dispersijai ir forma

. (3.21)

Trīs dispersijas veidi ir saistīti viens ar otru šādi:

. (3.22)

Piemērs 3.4

Definēsim grupu dispersijas, grupas vidējo, starpgrupu un kopējās dispersijas atbilstoši tabulas datiem. 3.3.

3.3. tabula

Skaits un īpaša gravitāte viena no kategorijām
liellopu fermu teritorija



Risinājums

Noteiksim slaucamo govju īpatsvaru kopumā trim saimniecībām:

Kopējā slaucamo govju proporcijas atšķirība:

Grupas iekšējās atšķirības:

; ; .

Vidējās atšķirības grupas ietvaros:

Starpgrupu dispersija:

Izmantojot dispersiju pievienošanas noteikumu, iegūstam: 0,1025+0,0031=0,1056. Piemērs ir pareizs.

Piemērs 3.5

Saskaņā ar izlases aptauju algas sabiedriskajā sektorā strādājošie saņēma šādus rādītājus (3.4. tabula).

3.4. tabula

Definēt:

1) vidējā alga divās nozarēs;

2) algu dispersija:

a) grupu izkliedes (nozares) vidējā vērtība,

b) starpgrupu (starpnozaru),

3) determinācijas koeficients;

4) empīriskā korelācija.

Risinājums

1. Divu nozaru strādnieku vidējo algu aprēķina pēc formulas (2.10):

berzēt.

2. Algu atšķirības:

a) grupu izkliedes vidējā vērtība saskaņā ar (3.14.)

b) starpgrupu izkliede saskaņā ar (3.12.)

c) kopējā dispersija, kas iegūta, pamatojoties uz dispersiju saskaitīšanas noteikumu (3.15.):

3. Determinācijas koeficients ir vienāds ar vērtību

tie. jeb 44,24%.

Tas liecina, ka atalgojums par 44,24% ir atkarīgs no darbinieku nozaru piederības un par 55,76% - no nozares iekšējiem apsvērumiem.

Saskaņā ar formulu (3.16) empīriskā korelācijas attiecība ,

kas liecina par būtisku ietekmi uz nozaru pazīmju algu diferenciāciju.

3.2. UZDEVUMI NEATKARĪGAM RISINĀJUMAM

Uzdevums 3.1

Atbilstoši 60 strādājošo sadalījumam pēc tarifu kategorijas ir pieejami šādi dati (3.5. tabula).

3.5. tabula

Definēt:

1) strādnieku vidējās algas kategorija;

2) vidējā lineārā novirze;

3) dispersija;

4) standartnovirze;

5) variācijas koeficients.

Uzdevums 3.2

Pēc vienas augstskolas 1. un 2. kursa eksāmenu sesijas rezultātiem pieejami šādi dati: 1. kursā 85% studentu sesiju nokārtoja bez divniekiem, 2. kursā - 90%.

Katram kursam nosakiet to studentu īpatsvara dispersiju, kuri veiksmīgi nokārtojuši sesiju.

Uzdevums 3.3

Reģiona akciju sabiedrības pēc vidējā darbinieku skaita uz 2004.gada 1.janvāri sadalījās šādi (3.6.tabula).

3.6. tabula

Aprēķināt:

1) vidējā lineārā novirze;

2) dispersija;

3) standartnovirze;

4) variācijas koeficients.

Uzdevums 3.4

Ir dati par uzņēmuma darbinieku ģimeņu sadalījumu pēc bērnu skaita (3.7. tabula).

3.7. tabula

Aprēķināt:

1) grupas iekšējā izkliede;

2) grupas iekšējo dispersiju vidējais rādītājs;

3) starpgrupu dispersija;

4) kopējā dispersija.

Pārbaudiet aprēķinu pareizību, izmantojot dispersiju saskaitīšanas noteikumu.

Uzdevums 3.5

Eksportam paredzētās produkcijas pašizmaksas sadalījumu pa uzņēmuma veikaliem attēlo šādi dati (3.8. tabula).

3.8. tabula

Aprēķināt:

1) vidējo eksporta produkcijas grupu iekšējo, starpgrupu un kopējo daļu;

2) determinācijas koeficients un empīriskā korelācija.

Uzdevums 3.6

Saskaņā ar pilsētas komercbanku aptauju 70% no kopējā klientu skaita bija juridiskas personas ar vidējo kredītu 120 tūkstošu rubļu apjomā. un variācijas koeficients 25%, un 20% - privātpersonām ar vidējo aizdevuma apmēru 20 tūkstoši rubļu. ar vidējo kvadrātveida novirzi 6 tūkstoši rubļu.

Izmantojot dispersiju pievienošanas noteikumus, nosakiet aizdevuma lieluma un klienta veida attiecības ciešumu, aprēķinot empīrisko korelācijas koeficientu.

4. sadaļa. Selektīvā novērošana

4.1. METODISKIE NORĀDĪJUMI
UN TIPISKO UZDEVUMU RISINĀJUMS

Izlases novērošanas mērķis ir noteikt vispārējās populācijas raksturlielumus - vispārējo vidējo ( o) un vispārējo īpatsvaru ( R). Izlases kopas raksturlielumi - izlases vidējais () un izlases īpatsvars () atšķiras no vispārīgajiem raksturlielumiem ar izlases kļūdas lielumu (). Tāpēc, lai noteiktu vispārējās kopas raksturlielumus, ir jāaprēķina izlases kļūda jeb reprezentativitātes kļūda, ko nosaka ar varbūtību teorijā izstrādātām formulām katram izlases veidam un atlases metodei.

Pareiza nejauša un mehāniska paraugu ņemšana. Nejaušas atkārtotas izlases gadījumā izlases robežkļūdu vidējam () un proporcijai () aprēķina pēc formulām

; (4.1)

(4.2)

kur ir izlases kopas dispersija;

n– izlases lielums;

t ir ticamības koeficients, ko nosaka no Laplasa integrālās funkcijas vērtību tabulas noteiktai varbūtībai ( P dos.) (A1 tabula).

Ar neatkārtotu nejaušu un mehānisku atlasi izlases robežkļūda tiek aprēķināta pēc formulām

; (4.3)

, (4.4)

Kur N- kopējās populācijas lielums.

Piemērs 4.1

Lai noteiktu ogļu pelnu saturu atradnē, izlases veidā tika pārbaudīti 100 akmeņogļu paraugi. Aptaujas rezultātā tika noskaidrots, ka vidējais pelnu saturs oglēs izlasē ir 16%, standartnovirze ir 5%. Desmit paraugos ogļu pelnu saturs bija vairāk nekā 20%. Ar varbūtību 0,954 noteikt robežas, kurās būs vidējais ogļu pelnu saturs atradnē un ogļu īpatsvars ar pelnu saturu virs 20%.

Risinājums

Vidējais pelnu saturs oglēs būs robežās

Lai noteiktu vispārējā vidējā robežas, mēs aprēķinām vidējo izlases robežkļūdu, izmantojot formulu (4.1):

. (4.5)

Ar varbūtību 0,954 var apgalvot, ka ogļu vidējais pelnu saturs atradnē būs 16% 1% vai 15% 17% robežās.

Ogļu īpatsvars ar pelnu saturu vairāk nekā 20% būs robežās

Izlases daļu nosaka pēc formulas

Kur m ir vienību proporcija ar pazīmi

Daļai () izlases kļūdu aprēķina pēc formulas (4.2):

vai ±6%.

Ar varbūtību 0,954 var apgalvot, ka ogļu ar pelnu saturu vairāk nekā 20% īpatsvars atradnē būs robežās. , vai .

Piemērs 4.2

Lai noteiktu vidējo īstermiņa kredīta izmantošanas termiņu bankā, tika veikta 5% mehāniskā parauga, kurā bija iekļauti 100 konti. Aptaujas rezultātā tika noskaidrots, ka vidējais īstermiņa kredīta izmantošanas termiņš ir 30 dienas ar standarta novirzi 9 dienas. Piecos kontos aizdevuma izmantošanas termiņš pārsniedza 60 dienas. Ar varbūtību 0,954 nosaki ierobežojumus, kuros būs īstermiņa kredīta izmantošanas termiņš kopējā populācijā un to kontu īpatsvars, kuru īstermiņa kredīta izmantošanas termiņš pārsniedz 60 dienas.

Risinājums

Vidējais termiņš bankas aizdevuma izmantošana ir ietvaros

.

Tā kā paraugu ņemšana ir mehāniska, izlases kļūdu nosaka pēc formulas (2.3):

diena.

Ar varbūtību 0,954 var apgalvot, ka īstermiņa kredīta izmantošanas termiņš bankā ir robežās = 30 dienas 2 dienas, vai

28 dienas dienā.

Kredītu īpatsvars, kuru termiņš pārsniedz 60 dienas, ir robežās

Izlases daļa būs

Daļas izlases kļūdu nosaka pēc formulas (4.4):

jeb 4,2%.

Ar varbūtību 0,954 var apgalvot, ka banku kredītu īpatsvars ar termiņu ilgāku par 60 dienām būs robežās. vai

Tipisks paraugs. Tipiskā (zonētā) atlasē vispārējā populācija tiek sadalīta viendabīgās tipiskās grupās, apgabalos. Tiek veikta novērošanas vienību atlase izlases komplektā dažādas metodes. Apsveriet tipisku paraugu ar proporcionālu atlasi tipiskās grupās.

Izlases lielumu no tipiskas grupas atlasē proporcionāli tipisko grupu skaitam nosaka pēc formulas

Kur n i ir izlases lielums no tipiskas grupas;

N i ir tipiskas grupas apjoms.

Izlases vidējā un proporcijas robežkļūda neatkārtojamai nejaušībai un mehāniskā veidā atlase tipiskajās grupās tiek aprēķināta pēc formulām

; (4.8)

, (4.9)

kur ir izlases populācijas dispersija.

Piemērs 4.3

Lai noteiktu laulībā stājošo vīriešu vidējo vecumu, rajonā tika veikta 5% tipiskā izlase ar vienību atlasi proporcionāli tipisko grupu lielumam. Grupu ietvaros tika izmantota mehāniskā atlase. Dati ir apkopoti tabulā. 4.1.

4.1. tabula

Ar varbūtību 0,954 nosakiet robežas, kurās vidējais vecums vīriešu apprecas un to vīriešu īpatsvars, kuri precas otrreiz.

Risinājums

Vīriešu vidējais laulības vecums ir robežās

.

Izlases populācijas vīriešu vidējo laulību vecumu nosaka pēc vidējā svērtā formulas

= gadā.

Vidējo izlases dispersiju nosaka pēc formulas
vidū

=

Mēs aprēķinām izlases robežkļūdu, izmantojot formulu (4.8):

gadā.

Ar varbūtību 0,954 var apgalvot, ka vīriešu vidējais vecums, kas stājas laulībā, būs gada robežās, vai

24 gadus vecs.

To vīriešu īpatsvars, kuri apprecēsies atkārtoti, būs robežās

Izlases daļu nosaka pēc vidējās vērtības formulas

jeb 14%.

Alternatīvas pazīmes vidējo izlases dispersiju aprēķina pēc formulas

(4.12)

Daļas izlases kļūdu nosaka pēc formulas (4.9.):

vai 6%.

Ar varbūtību 0,954 var apgalvot, ka to vīriešu īpatsvars, kuri apprecas otrreiz, būs robežās. , vai .

sērijveida paraugu ņemšana. Izmantojot seriālo atlases metodi, vispārējā populācija tiek sadalīta vienāda lieluma grupās - sērijās. Paraugu komplektā tiek atlasītas sērijas. Sērijas ietvaros tiek veikta nepārtraukta sērijā iekritušo vienību novērošana.

Neatkārtotas sērijas atlases gadījumā izlases vidējās un proporcijas robežkļūdas nosaka pēc formulas

, (4.13)

kur ir starpsēriju dispersija;

R ir sēriju skaits vispārējā populācijā;

r– atlasīto sēriju skaits.

Piemērs 4.4

Uzņēmuma cehā strādā 10 strādnieku brigādes. Lai pētītu viņu darba ražīgumu, tika veikta 20% sērijveida izlase, kurā bija iekļautas 2 brigādes. Aptaujas rezultātā tika noskaidrots, ka brigādes strādnieku vidējā izlaide bija 4,6 un 3 tonnas.Ar varbūtību 0,997 nosakiet robežas, kurās būs ceha darbinieku vidējā izlaide. t, vai T.

Piemērs 4.5

Noliktavā gatavie izstrādājumi Darbnīcā ir 200 detaļu kastes, katrā kastē 40 gab. Lai pārbaudītu gatavās produkcijas kvalitāti, tika izgatavots 10% sērijas paraugs. Paraugu ņemšanas rezultātā tika konstatēts, ka bojāto detaļu īpatsvars ir 15%. Sērijas parauga dispersija ir 0,0049.

Ar varbūtību 0,997 nosakiet robežas, kurās atrodas bojāto produktu īpatsvars kastīšu partijā.

Risinājums

Bojāto daļu īpatsvars būs robežās

Noteiksim daļas izlases robežkļūdu pēc formulas (4.13):

jeb 4,4%.

Ar varbūtību 0,997 var apgalvot, ka bojāto detaļu īpatsvars partijā ir robežās no 10,6% 19,6%.

Piemērs 4.6

Apgabalā, kas sastāv no 20 rajoniem, tika veikts izlases ražas apsekojums, pamatojoties uz sēriju (rajonu) atlasi. Izlases vidējie rādītāji pa rajoniem sastādīja attiecīgi 14,5 c/ha; 16; 15,5; 15 un 14 q/ha. Ar varbūtību 0,954 atrodiet ražas robežas visā apgabalā.

Risinājums

Aprēķiniet kopējo vidējo:

c/ha.

Starpgrupu (starpsēriju) dispersija

Tagad noteiksim sērijveida neatkārtojas parauga robežkļūdu (t = 2, P dov = 0,954), izmantojot formulu (4.13):

.

Tāpēc ienesīgums reģionā (ar varbūtību 0,954) būs robežās

15-1,7≤ ≤15+1,7,

13,3 c/ha ≤ ≤16,7 c/ha.

Izlases novērošanas projektēšanas praksē rodas nepieciešamība atrast izlases lielumu, kas nepieciešams, lai nodrošinātu noteiktu precizitāti vispārīgo raksturlielumu - vidējā un proporcijas - aprēķināšanā. Šajā gadījumā izlases robežkļūda, tās rašanās varbūtība un pazīmes variācijas ir zināmas iepriekš.

Izmantojot izlases veida atkārtotu atlasi, izlases lielums tiek noteikts pēc izteiksmes

Ar nejaušu, neatkārtotu un mehānisku atlasi izlases lielumu aprēķina pēc formulas

. (4.16)

Tipiskam paraugam

. (4.17)

Sērijveida paraugu ņemšanai

. (4.18)

Piemērs 4.7

Rajonā dzīvo 2000 ģimeņu. To izlases aptauju plānots veikt ar nejaušas neatkārtotas atlases metodi, lai noskaidrotu vidējo ģimenes lielumu. Nosakiet nepieciešamo izlases lielumu ar nosacījumu, ka ar varbūtību 0,954 izlases kļūda nepārsniedz vienu personu ar trīs cilvēku standartnovirzi (= 3).

Risinājums

Ar neatkārtotu nejaušu atlasi izlases lielums saskaņā ar formulu (4.16.) būs ģimenes.

Izlases lielums: vismaz 36 ģimenes.

Piemērs 4.8

Pilsētā A ir 10 000 ģimeņu. Ar mehāniskās izlases palīdzību paredzēts noteikt to ģimeņu īpatsvaru, kurās ir trīs un vairāk bērni. Kādam jābūt izlases lielumam, lai ar varbūtību 0,954 izlases kļūda nepārsniegtu 0,02, ja ir zināms, ka dispersija ir 0,2 no iepriekšējiem apsekojumiem?

Risinājums

Noteiksim nepieciešamo izlases lielumu pēc formulas (4.16):

.

Parauga lielums: ne mazāks par 1667.

Statistikā bieži ir jāsalīdzina divu (vai vairāku) paraugu rezultāti. Pamatojoties uz divu izlases vidējo (vai daļu) salīdzinājumu, tiek izdarīts secinājums par to nesakritības nejaušību vai nozīmīgumu.

Šim nolūkam absolūto starpību starp izlases vidējo rādītāju rādītājiem salīdzina ar starpības vidējo kļūdu:

. (4.19)

Atrasts t aprēķins salīdzinot ar t cilne. Autors t- Studenta sadalījums (P2 tabula) brīvības pakāpju skaitam v=n 1 +n 2 -2 un dotais nozīmīguma līmenis a. (Šeit n 1 un n 2 – salīdzināto paraugu apjomi).

Empīriskā korelācijas sakarība

Divu pazīmju attiecības ciešumu vai stiprumu var izmērīt ar indikatoru, ko sauc par empīrisko korelācijas koeficientu. Šo rādītāju sauc par empīrisku, jo to var aprēķināt, pamatojoties uz parasto grupēšanu pēc faktora un rezultējošā atribūta, tas ir, pamatojoties uz korelācijas tabulu. Empīriskā korelācija tiek iegūta no dispersijas saskaitīšanas likuma, saskaņā ar kuru , kur
- kopējā dispersija;
- starpgrupu dispersija;
- grupas iekšējā (privātās vidējās) izkliede. Starpgrupu dispersija ir faktora atribūta izraisītas svārstības. Daļējo dispersiju vidējā vērtība ir visu citu (izņemot faktoriālo) pazīmju izraisīto svārstību mērs. Tad attiecības
izsaka faktora zīmes dēļ radušos svārstību īpatsvaru kopējā svārstībā. Šīs attiecības kvadrātsakni sauc par empīrisko korelācijas koeficientu:
.

Tas nozīmē, ka jo lielāka ir starpgrupu dispersija, jo spēcīgāka faktora iezīme ietekmē iegūtās pazīmes variāciju. Noviržu komponentu attiecības aprēķina no korelācijas tabulas datiem, izmantojot šādas formulas:

;
,

kur ir privātie vidējie rādītāji; - vispārējais vidējais; - kopsummas pēc pazīmēm ; - kopsummas pēc pazīmēm ;
- novērojumu skaits. Tāda pati sakarība tiek saglabāta arī nosacītajām vērtībām, kas iegūtas ar skaitlisko transformāciju.

Pats dispersijas koeficients (radikālā izteiksme) tiek saukts par determinācijas koeficientu (tas ir arī vienāds ar empīriskās korelācijas koeficienta kvadrātu). Empīriskā korelācijas attiecība svārstās plašā diapazonā (no 0 līdz 1). Ja tas ir vienāds ar nulli, tad faktora zīme neietekmē korelācijas zīmi. Ja =1, kas nozīmē, ka rezultējošā zīme ir pilnībā atkarīga no faktora viens. Ja empīriskā korelācija ir daļa, kas ir tuvu vienotībai, tad tiek runāts par ciešs savienojums starp faktoriālām un rezultējošām pazīmēm. Ja šī daļa ir maza (tuvu nullei), tad runā par vāju savienojumu starp tiem.

Lineārās korelācijas koeficients un korelācijas indekss

Divu statistiski saistītu pazīmju attiecības ciešuma mērs ir lineārās korelācijas koeficients vai vienkārši korelācijas koeficients. Tam ir tāda pati nozīme kā empīriskajai korelācijas attiecībai, taču tam var būt gan pozitīvas, gan negatīvas vērtības. Korelācijas koeficientam ir stingra matemātiska izteiksme lineārai sakarībai. Pozitīva vērtība norāda uz tiešu saistību starp pazīmēm, negatīva vērtība norāda uz pretējo.

Pāru korelācijas koeficientu lineāras komunikācijas formas gadījumā aprēķina pēc formulas

un tā parauga vērtība - pēc formulas

Ar nelielu novērojumu skaitu ir ērti aprēķināt izlases korelācijas koeficientu, izmantojot šādu formulu:

Intervālā mainās korelācijas koeficienta vērtība
.

Plkst
starp abiem mainīgajiem pastāv funkcionāla saistība, kad
- tiešs funkcionāls savienojums. Ja
, tad X un Y vērtības paraugā nav korelētas; ja gadījuma lielumu sistēma
ir divdimensiju normālais sadalījums, tad arī lielumi X un Y būs neatkarīgi.

Ja korelācijas koeficients ir intervālā
, tad starp X un Y pastāv apgriezta korelācija. To apstiprina arī sākotnējās informācijas vizuālā analīze. Šajā gadījumā Y novirzi no vidējās vērtības ņem ar pretēju zīmi.

Ja katrs X un Y vērtību pāris visbiežāk vienlaikus ir virs (zem) atbilstošajām vidējām vērtībām, tad starp vērtībām pastāv tieša korelācija un korelācijas koeficients ir intervālā
.

No otras puses, ja X vērtības novirze no vidējās vērtības vienlīdz bieži izraisa Y vērtības novirzes uz leju no vidējās vērtības un novirzes visu laiku ir atšķirīgas, tad mēs varam pieņemt, ka korelācijas koeficientam ir tendence uz nulli.

Jāņem vērā, ka korelācijas koeficienta vērtība nav atkarīga no mērvienībām un atskaites punkta izvēles. Tas nozīmē, ka, ja mainīgie X un Y tiek samazināti (palielināti) par K reizes vai ar tādu pašu skaitli C, tad korelācijas koeficients nemainīsies.

Lai vienkāršotu korelācijas blīvuma mēra aprēķinu, bieži tiek izmantots korelācijas indekss, ko nosaka pēc šādām formulām:

,
,

Kur
- atlikušā dispersija, kas raksturo iegūtā atribūta izmaiņas citu neņemtu faktoru ietekmē.

Daudzkārtēja korelācija

Daudzkārtēja korelācija - rezultējošā un divu vai vairāku pētījumā iekļauto faktoru raksturlielumu atkarība. Rādītāju, kas norāda uz rezultējošās un divu vai vairāku faktoru pazīmju attiecības tuvumu, sauc par daudzkārtējo jeb kumulatīvo korelācijas koeficientu, un to apzīmē ar R. Kumulatīvais koeficients nozīmē lineāras attiecības esamību starp katru pazīmju pāri, ko var izteikts, izmantojot pāru korelācijas koeficientus. Ja ir kumulatīvs sakarības saspringuma mērs starp efektīvo pazīmi () un divām faktoru pazīmēm ( un ), tad kumulatīvās korelācijas koeficienta aprēķinu veic pēc formulas:

,

Kur apakšindeksi norāda, starp kurām pazīmēm pāru attiecības tiek pētītas.

Pāru korelācijas koeficientu aprēķināšanas formulās mainās tikai vienu vai otru faktoru apzīmējošie simboli. Tātad, ja korelācijas koeficientu starp un aprēķina pēc formulas , tad korelācijas koeficientu starp un aprēķina: ; starp un — tātad:

Norēķinu daļa

31. uzdevums

    Par desmit uzņēmumiem ir pieejami šādi dati par pārskata periodu:

2. tabula

Uzņēmumi

Ražošanas pamatlīdzekļu vidējās gada izmaksas, milj.

Izlaide, miljoni rubļu

Lai izpētītu saistību starp pamatlīdzekļu vidējo gada izmaksu lielumu un izlaidi, aprēķina lineāro attiecību vienādojumu.

2. Pamatojoties uz dotajiem datiem: a) aprēķina: lineārās korelācijas koeficientu; b) pārbaudīt saziņas formas izvēles pareizību, aprēķinot korelācijas indeksu.

    Izmantojot izklājlapu procesoru Microsoft Excel, mēs izveidosim darblapu:

3. tabula

Summu aprēķins taisnes vienādojuma parametru aprēķināšanai

239,74 * 1236 = 539,1 varbūtības sadalījums... ekonomisks analīze, atrisināts, pamatojoties uz regresija ekonomisks modeļiem. Apskatīsim y - efektīvo zīmi un x - koeficienta zīmes. Metodes salīdzināmi-regresija analīze ...

  • Disciplīnas "Socioloģisko datu analīzes datormetodes" programma (Ievads matemātiskajā statistikā un datu analīzē) Virzienam 040200. 68 "Socioloģija"

    disciplīnas programma

    Lietojumprogrammas. 11 3 2 6 Dispersīvs analīze 9 2 2 5 Dubultā un daudzkārtējā regresīvs analīze 9 2 2 5 Koeficientu īpašības... pēc SPSS lietotāja 11.0 Siskov V.I. korelācija analīze V ekonomisks pētījumiem. M. 1975. Edduss M., Stensfīlda...

  • G. L. Savitskaja uzņēmuma saimnieciskās darbības analīze

    Dokuments

    izcilība, jaunākās metodes ekonomisks pētījumiem. Analīze jābūt sarežģītai. Pētījumu sarežģītība ... par vidējās stundas produkcijas līmeni salīdzināmi-regresīvs analīze. daudzfaktoriālā korelācija vidējās stundas produkcijas modelis...

  • Korelācijas analīze ietver savienojuma ciešuma mērīšanu, izmantojot korelācijas koeficientu un korelācijas koeficientu. Izmantojot lineāro atkarības formu, savienojuma stiprums tiek novērtēts ar Pīrsona korelācijas koeficients :

    Korelācijas koeficients svārstās no (-1) līdz (+1), (– 1 r 1).

    Indikatora negatīvā zīme norāda uz atgriezenisko saiti, pozitīva zīme norāda uz tiešu savienojumu. Jo tuvāk rādītāja vērtība vienam, absolūtā vērtībā, jo stiprāks savienojums, jo tuvāk nullei, jo vājāks savienojums.

    Lai izmērītu savienojuma stiprumu ar jebkāda veida atkarību, gan lineāru, gan nelineāru, kā arī lai novērtētu daudzkārtējo savienojumu, izmantojiet teorētiskā korelācija (korelācijas indekss). Tās aprēķins ir balstīts uz dispersijas pievienošanas noteikumu:

    Kur kopējā dispersija - atspoguļo efektīvās pazīmes variāciju visu uz to iedarbojošo faktoru dēļ;

    vai

    faktoru dispersija , atspoguļo efektīvās pazīmes variāciju faktora dēļ (X).

    atlikušā dispersija , atspoguļo efektīvās funkcijas variācijas visu faktoru dēļ, izņemot faktoru (X);

    Teorētiskā korelācijas attiecība ir kvadrātsakne no faktoriālās dispersijas attiecības pret kopējo dispersiju:

    saknes izteiksme - determinācijas koeficients :

    parāda iegūtās pazīmes variācijas proporciju faktorpazīmes ietekmes dēļ kopējā variācijā. Jo lielāka šī proporcija, jo spēcīgāka ir saistība starp pazīmēm.

    Teorētiskā korelācijas attiecība mainās no 0 uz 1 (0 R 1) .Rādītāja vērtība ir tuvāk vienam, jo ​​stiprākas attiecības.

    Lai novērtētu attiecību stiprumu, varat izmantot mērogā H Eddoka:

    Galvenā attīstības tendence un metodes tās noteikšanai

    Katrai dinamikas rindai ir sava attīstības tendence, t.i. vispārējais virziens uz parādības līmeņa paaugstināšanos, samazināšanos vai stabilizāciju laika gaitā. Šīs tendences smagums ir atkarīgs no nemainīgu, periodisku (sezonālu) un nejaušu faktoru ietekmes uz dinamikas rindu līmeņiem. Tāpēc jārunā ne tikai par attīstības tendenci, bet gan par galveno tendenci.

    Galvenā attīstības tendence (tendence) sauc par vienmērīgām un stabilām parādības līmeņa izmaiņām laikā, bez periodiskām un nejaušām svārstībām.

    Lai noteiktu tendenci, dinamikas sērijas tiek apstrādātas ar intervālu palielināšanas, mainīgā vidējā un analītiskās izlīdzināšanas metodēm.

    Intervāla rupjības metode ir balstīta uz laika periodu konsolidāciju, kas ietver virknes dinamikas līmeņus. Lai to izdarītu, tiek apvienoti sākotnējie dati, t.i. summēti vai vidēji aprēķināti ilgākos laika intervālos līdz Vispārējā tendence attīstība nebūs pietiekami skaidra. Piemēram, dienas datus par ražošanu apvieno desmit dienu datos, mēneša datus ceturkšņa datos, gada datus vairāku gadu datos. Metodes priekšrocība ir tās vienkāršība. Trūkums ir tāds, ka izlīdzinātā sērija ir daudz īsāka nekā sākotnējā.

    slīdošā vidējā metode sastāv no tā, ka, pamatojoties uz sākotnējiem datiem, slīdošos vidējos aprēķina no noteikta skaita pirmo sērijas līmeņu, vispirms pēc kārtas, pēc tam no tāda paša līmeņu skaita, sākot no otrā, no trešā. utt. Vidējā vērtība it kā slīd pa dinamisko sēriju, pārvietojoties par vienu intervālu. Slīdošie vidējie rādītāji izlīdzina nejaušas svārstības.

    Shēma 3 līmeņu mainīgā vidējā aprēķināšanai

    Laika intervāls

    (numurs secībā)

    Faktiskie dinamisko sēriju līmeņi

    plkst i

    mainīgie vidējie rādītāji

    plkst sk

    plkst 1

    plkst 2

    plkst 3

    plkst 4

    plkst sc3

    plkst 5

    plkst sc4

    plkst 6

    Izlīdzinātā dinamikas sērija pēc vērtības ir īsāka nekā sākotnējā (l - 1), ja palielināšana tiek veikta nepāra līmeņu skaitā, kur l ir paplašināšanās perioda ilgums. Piemēram, ja l = 3, tad līdzinātā rinda ir par 2 līmeņiem īsāka. Tādējādi izlīdzinātā sērija nav daudz īsāka par sākotnējo.

    Analītiskā izlīdzināšanas metode ir laikrindu faktisko līmeņu aizstāšana ar to teorētiskajām vērtībām, kas aprēķinātas, pamatojoties uz tendenču vienādojumu:

    Tiek aprēķināti vienādojuma parametri mazāko kvadrātu metode:

    Kur plkst– faktiskie līmeņi; plkst ti ir tiem laikā atbilstoši izlīdzinātie (aprēķinātie) līmeņi.

    Ja izstrāde tiek veikta aritmētiskā progresijā (ar vienādiem ķēdes absolūtajiem soļiem), tad lineārā funkcija:

    Ja ģeometriskā progresijā ir dinamika (ar vienādiem ķēdes pieauguma tempiem), tad ir jāizmanto eksponenciālā funkcija:

    plkst t = a 0 A 1 t .

    Ja attīstība notiek ar vienādiem augšanas ātrumiem, to lieto ar jaudas funkcija, piemēram, otrās kārtas (parabola):

    plkst t = a 0 + a 1 t+ a 2 t 2 .

    Tendences vienādojuma pareizas izvēles kritērijs ir tuvinājuma kļūda . Tas atspoguļo dinamikas rindu faktisko līmeņu standartnovirzi no teorētiskajiem:

    Par optimālu tiek uzskatīts vienādojums ar mazāko aproksimācijas kļūdu.

    Apsveriet laika rindu izlīdzināšanas “tehniku” atbilstoši lineārā funkcija:


    Kur A 0 , A 1 ir taisnās līnijas vienādojuma parametri; t- laika rādītāji (parasti perioda vai laika punkta kārtas numurs).

    Līnijas parametri A 0 Un A 1 , kas atbilst mazāko kvadrātu metodei, tiek atrasti, atrisinot šādu normālo vienādojumu sistēmu:

    Kur n ir dinamikas rindas līmeņu skaits; parametrs A 1 atbilst vidējam absolūtajam pieaugumam.

    Lai vienkāršotu laika rādītāju aprēķinu
    var dot tādas vērtības
    , Tad

    Lai to izdarītu, rindās ar nepāra līmeņu skaitu centrālais intervāls tiek ņemts par laika atskaites sākumu, kur t pielīdzināt nullei. Abās nulles pusēs ir attiecīgi negatīvu un pozitīvu naturālo skaitļu rindas, piemēram:

    Laika intervāls

    (numurs secībā)

    t i

    Pāra skaitam līmeņu skaitīšana tiek veikta no diviem centrālajiem intervāliem, kuros t pielīdzināti attiecīgi (-1) un (+1), un abās pusēs ir rindas ar negatīviem un pozitīviem nepāra skaitļiem, piemēram:

    Laika intervāls

    (numurs secībā)

    t i

    Shēma lineāra vienādojuma parametru aprēķināšanai

    Laika intervāli

    Dinamiskās sērijas līmeņi

    plkst i

    t i

    i t 2

    plkst i t i

    plkst ti

    Pamatojoties uz aprēķināto tendenču vienādojumu, ir iespējams ražot ekstrapolācija – iespējamu (projicēto) līmeņu atrašana ārpus sākotnējās dinamikas sērijas.

    ATBILDE

    Komunikācijas tuvuma kvantitatīvais novērtējums pēc empīriskiem datiem sastāv no komunikācijas tuvuma rādītāju aprēķināšanas:

    · Empīriskais determinācijas koeficients (empīriskā dispersijas attiecība) - r 2 .

    Šo rādītāju aprēķina pēc analītiskā grupējuma (tabulas) datiem kā rezultāta pazīmes Y (d y 2) starpgrupu dispersijas attiecību pret kopējo dispersiju Y (s y 2):

    Saskaņā ar dispersijas dekompozīcijas teorēmu starpgrupu dispersija ir saistīta ar kopējo dispersiju: ​​s y 2 =d y 2 +e y 2 . Tad empīrisko determinācijas koeficientu var aprēķināt, izmantojot atlikušo dispersiju, izmantojot formulu:

    kur s j 2 ir rezultāta Y dispersija j-tajā grupā.

    Empīriskais determinācijas koeficients raksturo grupēšanas atribūta (X) ietekmes stiprumu uz iegūtā atribūta Y kopējās variācijas veidošanos un parāda rezultāta atribūta variācijas procentuālo daļu (daļa) no pamatā esošā atribūta faktora. grupējums.

    R 2 ir ērti aprēķināt tabulā:

    Zīmes faktors X j Nj Iezīmes rezultāta vidējā vērtība s j 2 N j
    x1 N 1 s 1 2 N 1
    x2 N 2 s 2 2 N 2
    .... ...
    X m N m s m 2 N m
    Kopā N X es j 2

    Tad .

    Apsveriet piemēru. Dots 20 strādnieku kopums, ko raksturo šādi raksturlielumi: Y - strādnieka izlaide (gabals / maiņa) un X - kvalifikācija (rangs). Sākotnējie dati ir parādīti tabulā:

    X
    Y

    Nepieciešams novērtēt pazīmju attiecību ciešumu, izmantojot empīrisko determinācijas koeficientu (r 2).

    Lai aprēķinātu r 2, mēs veiksim populācijas analītisko grupēšanu. Kā zīmes faktoru mēs ņemam X (strādnieka kategoriju), kā zīmi-rezultātu - Y, strādnieka izvadi). Analītiskā grupēšana tiek veikta, pamatojoties uz X. B Šis gadījums tas būs diskrēts (jo atribūta X vērtības diezgan bieži atkārtojas). Grupu skaits ir vienāds ar atribūta X vērtību skaitu apkopojumā, t.i. 6. R 2 grupēšanas un aprēķina rezultāti apkopoti tabulā:

    Zīmes faktors X Rezultāta atribūts Y Vienību skaits grupā, N j zīme-rezultāta vidējā vērtība grupā, ( - ) 2 N j Iezīmes-rezultāta izkliede grupā, s 2 j s 2 j N j
    (10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 \u003d ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 \u003d 1,56 4,7
    (11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 \u003d ((11-12,5) 2 + (14-12,5) 2) / 2 \u003d 2,25 4,5
    (12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
    (15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 \u003d ((15-16,75) 2 + (17-16,75) 2 ++ (17-16,75) 2 + (18-16,75) 2) / 4 \u003d 1,9 4,75
    (18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
    (23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 \u003d ((23-24,75) 2 + (24-24,75) 2 + (27-24,75) 2 + (25-24,75) 2) / 4 \u003d 2,19 8,75
    =17,1 429,1 40,7

    Empīriskais determinācijas koeficients ir vienāds ar rezultāta atribūta (d y 2) starpgrupu dispersijas attiecību pret rezultāta atribūta kopējo dispersiju (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2) + e y 2).

    Starpgrupu dispersija Y būs vienāda ar: d y 2 = å( - ) 2 N j / N = 429,1/20=21,45.

    Atlikusī dispersija Y būs: e y 2 = ås 2 j ·N j / N= 40,7/20= 2,035.

    Tad: r 2 \u003d 21,45 / (21,45 + 2,035) \u003d 429,1 / (429,1 + 40,7) \u003d 0,913.

    Secinājums: 91,3% no strādnieku izlaides svārstībām ir saistītas ar izlādes faktora ietekmi.

    · Empīriskā korelācijas sakarība - r.

    Šis rādītājs ir empīriskā determinācijas koeficienta sakne. Tas parāda savienojuma blīvumu (ne tikai lineāru!) starp grupēšanu un produktīvajām iezīmēm. Empīriskās korelācijas koeficienta pieļaujamo vērtību diapazons ir no 0 līdz +1.

    Visciešākā iespējamā saikne ir funkcionāls savienojums, kad katru rezultāta Y vērtību unikāli nosaka X faktora vērtība (t.i., grupēšanas rezultāts). Šajā gadījumā grupas vidējā dispersija (d y 2) ir vienāda ar kopējo dispersiju (s y 2), t.i. grupas iekšienē nebūs variāciju. Šajā gadījumā atlikušā dispersija (e y 2) ir vienāda ar 0, un empīriskais determinācijas koeficients ir vienāds ar 1.

    Ja starp zīmēm nav savienojuma, tad visi grupu vidējie ir vienādi viens ar otru, starpgrupu variācijas nebūs (d y 2 =0), un empīriskais determinācijas koeficients ir 0.

    Aprēķināsim mūsu piemēra empīriskās korelācijas koeficientu: r= 0,9555. Secinājums: "strādnieka ražošanas" un "atlaišanas" pazīmes ir diezgan cieši saistītas.

    Rādītājus r un r 2 nosaka ne tikai saiknes esamība starp pazīmēm X un Y, bet arī primāro datu grupēšanas fakts. Palielinoties grupu skaitam m, starpgrupu dispersija d 2 pieaug un tuvojas kopējai dispersijai. Ja grupu skaits ir mazāks par populācijas vienību skaitu N, tad r un r 2 vērtības nekad nebūs vienādas ar 1 pat ar stingru funkcionālu sakarību.

    Ņemiet vērā, ka sakarības tuvuma rādītāja vērtība pati par sevi nav pierādījums cēloņsakarības esamībai starp pētītajām pazīmēm, bet gan ir novērtējums pazīmju izmaiņu savstarpējās konsekvences pakāpei. Pirms cēloņu un seku attiecību noteikšanas noteikti ir jāveic parādību kvalitatīvā rakstura analīze.

    Empīriskā korelācijas sakarība

    Divu pazīmju attiecības ciešumu vai stiprumu var izmērīt ar indikatoru, ko sauc par empīrisko korelācijas koeficientu. Šo rādītāju sauc par empīrisku, jo to var aprēķināt, pamatojoties uz parasto grupēšanu pēc faktora un rezultējošā atribūta, tas ir, pamatojoties uz korelācijas tabulu. Empīriskā korelācijas attiecība tiek iegūta no dispersiju saskaitīšanas noteikuma, saskaņā ar kuru , kur ir kopējā dispersija; - starpgrupu dispersija; - grupas iekšējā (privātās vidējās) izkliede. Starpgrupu dispersija ir faktora atribūta izraisītas svārstības. Daļējo dispersiju vidējā vērtība ir visu citu (izņemot faktoriālo) pazīmju izraisīto svārstību mērs. Tad koeficients izsaka faktora zīmes izraisīto svārstību īpatsvaru kopējā svārstībā. Šīs attiecības kvadrātsakni sauc par empīrisko korelācijas koeficientu: .

    Tas nozīmē, ka jo lielāka ir starpgrupu dispersija, jo spēcīgāka faktora iezīme ietekmē iegūtās pazīmes variāciju. Noviržu komponentu attiecības aprēķina no korelācijas tabulas datiem, izmantojot šādas formulas:

    ; ,

    kur ir privātie vidējie rādītāji; - vispārējais vidējais; - kopsummas, pamatojoties uz ; - kopsummas, pamatojoties uz ; - novērojumu skaits. Tāda pati sakarība tiek saglabāta arī nosacītajām vērtībām, kas iegūtas ar skaitlisko transformāciju.

    Pats dispersijas koeficients (radikālā izteiksme) tiek saukts par determinācijas koeficientu (tas ir arī vienāds ar empīriskās korelācijas koeficienta kvadrātu). Empīriskā korelācijas attiecība svārstās plašā diapazonā (no 0 līdz 1). Ja tas ir vienāds ar nulli, tad faktora zīme neietekmē korelācijas zīmi. Ja =1, tad rezultējošā zīme pilnībā ir atkarīga no faktora viens. Ja empīriskā korelācijas koeficients ir daļskaitlis, kas ir tuvu vienam, tad viņi runā par ciešu saistību starp faktoriālās un efektīvās pazīmes. Ja šī daļa ir maza (tuvu nullei), tad runā par vāju savienojumu starp tiem.

    
    Tops