Vrijednost empirijskog koeficijenta determinacije jednaka 0 ukazuje. Koeficijent determinacije šta mjeri - formula

Empirijski koeficijent determinacije se široko koristi u statističkim problemima i indikator je koji predstavlja udio u ukupnoj varijansi rezultirajućeg atributa i karakterizira jačinu utjecaja atributa grupisanja na formiranje opće varijacije. Može se izračunati pomoću formule:

Ovaj koeficijent pokazuje udio varijacije efektivne karakteristike y pod uticajem faktora x. U nedostatku veze, empirijski koeficijent determinacije jednak je nuli, a u slučaju funkcionalnog jaka veza- jedinica.

predstavljen kao kvadratni korijen od empirijski koeficijent određenja. Pokazuje bliskost odnosa između statističkih podataka i određuje se formulom:

gdje je brojilac disperzija grupnih srednjih vrijednosti;
imenilac je ukupna varijansa.

korelacioni odnos je nula ako nema veze između podataka. U ovom slučaju će sva grupna sredstva biti jednaka jedna drugoj i neće biti međugrupnih varijacija.

Omjer korelacije jednak je jedan kada je veza funkcionalna. U ovom slučaju, varijansa grupnih srednjih vrijednosti će biti jednaka ukupnoj varijansi, odnosno neće biti unutargrupne varijacije.

Što su vrijednosti korelacijskog omjera bliže jedan, to je odnos između karakteristika jači, bliži funkcionalnoj ovisnosti.

Izračunato prema formuli:

gdje su fe i ft empirijske i teorijske frekvencije.

Korišćenjem Pearsonov kriterijum tabele određuju vjerovatnoću P(x^2). Ulazi u tabelu su x^2 vrijednosti i broj stupnjeva slobode k = n - p -1.

Ako je P > 0,05, onda se empirijska i teorijska raspodjela smatraju bliskim. Kada P pripada, podudarnost između njih je zadovoljavajuća, au drugim slučajevima nedovoljna.

Izračunato prema formuli:

gdje je brojilac centralni moment trećeg reda.

b^3 - kocka standardne devijacije.

Faktor zakrivljenosti je bezdimenzionalna vrijednost, što omogućava da se koristi za različite distribucije. Sa levostranom asimetrijom, Mo > Mt > xav, sa desnostranom asimetrijom, inverzni odnosi. Ovo vam omogućava da primijenite najjednostavniji indikator asimetrije:

Kurtosis u statistici

Postoji stepen strmine empirijske distribucije u odnosu na normalnu. Određuje se formulom:

gdje je brojilac centralni moment četvrtog reda

Kada je distribucija vrhunska u odnosu na normalu, eksces će biti pozitivan, ako je distribucija ravna, biće negativan. Za normalnu distribuciju, E = 0.

Šta se podrazumijeva pod varijansom unutar grupe za populaciju? Koja je formula za njegovo izračunavanje? Navedite primjer. Šta se podrazumijeva pod varijansom međugrupne populacije? Koja je formula za njegovo izračunavanje? Navedite primjer.

Unutargrupna varijansa () označava slučajnu varijaciju koja ne zavisi od osobine koja leži u osnovi grupisanja.

, gdje

Grupni prosjek

Prosječna varijansa unutar grupe izračunava se na sljedeći način: prvo se izračunavaju varijanse za pojedinačne grupe (), zatim se izračunava prosječna varijansa unutar grupe:

Karakterizira sistematsko variranje, tj. razlike u veličini osobine koja se proučava, koja je osnova grupisanja. Ova disperzija se izračunava po formuli

, gdje

Prosječna vrijednost za posebnu grupu

n i- broj jedinica u grupi

- opća aritmetička sredina cjelokupne studijske populacije.

Sve tri vrste varijanse su međusobno povezane: ukupna varijansa jednaka je zbroju prosječne unutargrupne varijanse i međugrupne varijanse:

Ovaj odnos odražava zakon, koji se zove pravilo dodavanja varijanse.

20.

Šta se podrazumijeva pod ukupnom varijansom stanovništva? Koja je formula za njegovo izračunavanje? Da li način na koji su grupe grupirane utiče na ukupnu varijansu? Navedite primjer.

Ukupna varijansa () karakterizira varijaciju osobine cijele populacije pod utjecajem svih onih faktora koji su uzrokovali ovu varijaciju. Ova vrijednost je određena formulom

, gdje

opća aritmetička sredina cjelokupne studijske populacije.

S druge strane, ukupna varijansa je jednaka zbroju prosječne unutargrupne varijanse i međugrupne varijanse:

Ovaj odnos odražava zakon, koji se zove pravilo dodavanja varijanse.. Zahvaljujući pravilu sabiranja varijansi moguće je utvrditi koji je dio ukupne varijanse pod uticajem karakterističnog faktora koji leži u osnovi grupisanja.

Što je veći udio međugrupne varijanse u ukupnoj varijansi, to je jači utjecaj faktorskog atributa (ranga) na rezultantu (proizvodnju).

Ovu proporciju karakterizira empirijski koeficijent determinacije:

Za kvalitativnu procjenu bliskosti odnosa između znakova koriste se Chaddockovi odnosi.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Jačina veze

nedostaje

vrlo slaba

slab

umjereno

upadljivo

zatvori

veoma blizu

funkcionalan-

nazalni

21.

Šta pokazuje koeficijent determinacije? Koja je formula za njegovo izračunavanje? U kojim jedinicama se mjeri ovaj pokazatelj? Koje su moguće vrijednosti za ovaj indikator? Šta znači empirijski korelacioni odnos? Koja je formula za njegovo izračunavanje? U kojim jedinicama se mjeri ovaj pokazatelj? Koje su moguće vrijednosti za ovaj indikator?

Empirijski koeficijent determinacije () karakterizira udio međugrupne varijanse u ukupnoj varijansi:

Uzima vrijednosti od -1 do 1 i pokazuje koliko je varijacija osobine u agregatu posljedica faktora grupisanja.

Međugrupna disperzija;

totalna varijansa.

Određeno formulom:

Prihvata vrijednosti od -1 do 1

Primjer

Grupa

Broj biljaka u grupi, kom.

Prosječna bruto proizvodnja u uporedivim cijenama, miliona rubalja

Odredimo sada prosječnu vrijednost, ukupnu varijansu i međugrupnu varijansu bruto proizvodnje u uporedivim cijenama tvornica:

miliona rubalja;

Milion rub.2;

Milion rub.2.

Koeficijent determinacije će biti jednak:

Kao rezultat toga, empirijski omjer korelacije bit će jednak:

Izračunata vrijednost koeficijenta empirijske korelacije ukazuje na prilično visok statistički odnos između bruto proizvodnje u uporedivim cijenama i prosječne godišnje cijene osnovnih proizvodnih sredstava fabrika.

22.

Kako se izračunava statistika testa u univarijantnoj analizi varijanse? Koji je zakon njegove distribucije pod validnošću glavne hipoteze? Koji su parametri ovog zakona? Kako se donosi odluka u jednosmjernoj analizi varijanse na osnovu izračunate vrijednosti statistike kriterija?

Zadatak analize varijanse je proučavanje uticaja jednog ili više faktora na osobinu koja se razmatra.

Jednosmjerna analiza varijanse se koristi kada su dostupna tri ili više nezavisnih uzoraka, dobijenih iz iste opće populacije promjenom nekog nezavisnog faktora za koji iz nekog razloga ne postoje kvantitativna mjerenja.

Kao kriterijum potrebno je koristiti Fišerov kriterijum:

., gdje

Q 1 je zbir kvadrata odstupanja srednje vrijednosti uzorka od ukupne srednje vrijednosti

Q 2 je zbir kvadrata odstupanja posmatranih vrijednosti od srednje vrijednosti uzorka

Ako je izračunata vrijednost Fisherovog kriterija manja od vrijednosti u tabeli, nema razloga vjerovati da nezavisni faktor utječe na širenje prosječnih vrijednosti ( one. hipoteza nije potvrđena). Inače, nezavisni faktor ima značajan uticaj na širenje prosječnih vrijednosti ( hipoteza je tačna).

23-25.

1. U jednakim intervalima koristite jednostavnu aritmetičku sredinu:

gdje su y apsolutni nivoi serije;
n- broj nivoa u seriji.
2. Za nejednake intervale koristite ponderisanu aritmetičku sredinu:

gdje si 1 ,...,un - nivoi serije dinamike;
t1,... tn - težine, trajanje vremenskih intervala.

Prosječan nivo serije trenutaka dinamika se izračunava po formuli:
1. Sa ekvidistantnim nivoima izračunava se po formuli srednjeg kronološkog momenta serije:

gdje si 1 ,...,un - nivoi perioda za koji se vrši obračun;
n- broj nivoa;
n-1 - trajanje vremenskog perioda.
2. C nejednako nivoi se izračunavaju korištenjem kronološke formule ponderiranog prosjeka:

gdje si 1 ,...,un - nivoi vremenskih serija;
t- vremenski interval između susjednih nivoa

u statistici

Prosječan apsolutni rast definira se kao prosjek apsolutnih dobitaka u jednakim vremenskim intervalima jednog perioda. Izračunava se po formulama: 1. Na osnovu lančanih podataka o apsolutnom rastu tokom više godina, prosječni apsolutni rast izračunava se kao aritmetički jednostavan prosjek:

gdje n je broj apsolutnih priraštaja po stepenu u periodu koji se proučava.
2. Izračunava se prosječno apsolutno povećanjekroz osnovni apsolutni rast u slučaju jednakih intervala

gdje m - broj nivoa serije dinamike u periodu istraživanja, uključujući i osnovni.

Prosječna stopa rasta je slobodna generalizirajuća karakteristika intenziteta promjene nivoaserije dinamike i pokazuje koliko se puta u prosjeku mijenja nivo serije dinamike po jedinici vremena.
Kao osnova i kriterij za ispravnost izračunavanja prosječne stope rasta (pada) koristi se generalizujući indikator koji se izračunava kao proizvod lančanih stopa rasta jednak stopi rasta za cijeli posmatrani period. Ako se vrijednost atributa formira kao proizvod individualne opcije, tada se koristi geometrijska sredina.
Budući da je prosječna stopa rasta prosječni koeficijent rasta, izražen kao postotak, tada se za ekvivalentnu seriju dinamike proračuni pomoću geometrijske sredine svode na izračunavanje prosječnih koeficijenata rasta od lančanih pomoću „lancane metode“:

gdje n je broj faktora rasta lanca;
kts- faktori rasta lanca;
Kb - osnovna stopa rasta za cijeli period.
Određivanje prosječnog faktora rastamože se pojednostaviti ako su nivoi vremenske serije jasni. Pošto je proizvod faktora rasta lanca jednak osnovnom, osnovni faktor rasta se zamjenjuje u izraz radikala.
Formula za određivanje prosječnog faktora rastaza ekvidistantne serije dinamike prema "osnovnoj metodi" će biti kako slijedi:

36.

Koji su vam apsolutni pokazatelji promjena u nivou serije poznati?

Svi ovi pokazatelji se mogu odrediti na osnovni način, kada je nivo dati period u poređenju sa prvim (osnovnim) periodom, ili na lančan način - kada se porede dva nivoa susjednih perioda.

Napišite formule za izračunavanje.

Osnovna apsolutna promjena je razlika između specifičnog i prvog nivoa serije, određena formulom

Pokazuje koliko je (u jedinicama indikatora serije) nivo jednog (i-tog) perioda veći ili manji od prvog (osnovnog) nivoa, te stoga može imati znak „+“ (sa povećanjem u nivoima) ili “–” (sa smanjenjem nivoa).

Lančana apsolutna promjena je razlika između specifičnog i prethodnog nivoa serije, određena je formulom

Pokazuje koliko je (u jedinicama indikatora serije) nivo jednog (i-tog) perioda veći ili manji od prethodnog nivoa, i može imati znak "+" ili "-".

Objasnite kako metoda izračuna ovisi o izboru baze za poređenje.

Koji su vam relativni pokazatelji promjene nivoa serije poznati? Napišite formule za izračunavanje.

Osnovna relativna promjena (osnovna stopa rasta ili osnovni indeks dinamike) je odnos specifičnog i prvog nivoa serije, određen formulom

Relativna promjena lanca (stopa rasta lanca ili indeks dinamike lanca) je omjer specifičnog i prethodnih nivoa serije, određen formulom

Objasnite kako metoda izračuna ovisi o izboru baze za poređenje.

Relativna promjena pokazuje koliko je puta nivo datog perioda veći od nivoa bilo kojeg prethodnog perioda (za i > 1) ili koji je njegov dio (za i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Koji su vam prosječni pokazatelji promjene nivoa serije poznati? Napišite formule za izračunavanje prosječnog apsolutnog rasta, stope rasta i stope rasta nivoa serije.

Prosječni apsolutni rast definira se kao prosjek apsolutnog rasta za jednake vremenske periode u jednom periodu. Izračunava se po formulama: 1. Na osnovu lančanih podataka o apsolutnom rastu tokom više godina, prosječni apsolutni rast izračunava se kao aritmetički jednostavan prosjek:

gdje n je broj apsolutnih priraštaja po stepenu u periodu koji se proučava.

2. Prosječno apsolutno povećanje izračunava se kroz osnovni apsolutni porast u slučaju jednakih intervala

gdje m - broj nivoa serije dinamike u periodu istraživanja, uključujući i osnovni.

Prosječna stopa rasta je slobodna generalizirajuća karakteristika intenziteta promjena nivoa niza dinamike i pokazuje koliko se puta u prosjeku mijenja nivo niza dinamike u jedinici vremena.

Kao osnova i kriterij za ispravnost izračunavanja prosječne stope rasta (pada) koristi se generalizujući indikator koji se izračunava kao proizvod lančanih stopa rasta jednak stopi rasta za cijeli posmatrani period. Ako se karakteristična vrijednost formira kao proizvod pojedinačnih opcija, tada se koristi geometrijska sredina.

Budući da je prosječna stopa rasta prosječni koeficijent rasta, izražen kao postotak, tada se za ekvivalentnu seriju dinamike proračuni pomoću geometrijske sredine svode na izračunavanje prosječnih koeficijenata rasta od lančanih pomoću „lancane metode“:

gdje n je broj faktora rasta lanca;

Kc - lančani koeficijenti rasta;

Kb - osnovna stopa rasta za cijeli period.

Stopa promjene (stopa rasta) nivoa je relativni indikator koji pokazuje koliko je posto dati nivo veći (ili manji) od drugog, uzet kao osnova za poređenje. Izračunava se oduzimanjem 100% od relativne promjene, odnosno po formuli:

ili kao postotak apsolutne promjene do nivoa u odnosu na koji se apsolutna promjena izračunava (bazna linija), odnosno prema formuli:

.

Koji su nedostaci ovih indikatora? U kojim slučajevima ih je prikladno koristiti? Kako se ovi nedostaci mogu otkloniti? Napišite formule za izračunavanje prosjeka koje osiguravaju očuvanje ukupne vrijednosti serije.

38.

Kako odrediti vrstu glavnog trenda prema vrijednostima indikatora promjena u nivoima serije? Navedite primjere.

Identifikacija opšteg trenda vremenske serije može se izvršiti izglađivanjem vremenske serije korišćenjem metode pokretnog proseka. Suština ove tehnike je da se izračunati (teorijski) nivoi određuju iz početnih nivoa serije (empirijski podaci).

Glavni uslov za primenu ove metode je izračunavanje pokretnih (pokretnih) srednjih karika iz takvog broja nivoa serije koji odgovara trajanju dinamike ciklusa posmatranog u seriji.

ODGOVOR

Kvantitativna procjena bliskosti komunikacije prema empirijskim podacima sastoji se u izračunavanju pokazatelja bliskosti komunikacije:

· Empirijski koeficijent determinacije (empirijski omjer disperzije) - r 2 .

Ovaj indikator se izračunava prema podacima analitičkog grupisanja (tabela), kao omjer međugrupne varijanse rezultatne osobine Y (d y 2) i ukupne varijanse Y (s y 2):

Prema teoremi dekompozicije varijanse, međugrupna varijansa je povezana sa ukupnom varijansom: s y 2 =d y 2 +e y 2 . Tada se empirijski koeficijent determinacije može izračunati kroz preostalu varijansu koristeći formulu:

gdje je s j 2 varijansa rezultata Y unutar j-te grupe.

Empirijski koeficijent determinacije karakterizira jačinu utjecaja atributa grupiranja (X) na formiranje ukupne varijacije rezultirajućeg atributa Y i pokazuje postotak (udio) varijacije atributa rezultata zbog faktora atributa koji je u osnovi grupisanje.

Zgodno je izračunati r 2 u tabeli:

Znak-faktor X j Nj Srednja vrijednost karakteristike-rezultata s j 2 N j
x1 N 1 s 1 2 N 1
x2 N 2 s 2 2 N 2
.... ...
Xm N m s m 2 N m
Ukupno N X es j 2

Onda .

Razmotrimo primjer. Neka je zadan skup od 20 radnika, okarakteriziranih sljedećim karakteristikama: Y - učinak radnika (komad/smjena) i X - kvalifikacija (rang). Početni podaci prikazani su u tabeli:

X
Y

Potrebno je ocijeniti bliskost odnosa između obilježja pomoću empirijskog koeficijenta determinacije (r 2).

Da bismo izračunali r 2, izvršićemo analitičko grupisanje populacije. Kao znak-faktor uzimamo X (kategorija radnika), kao znak-rezultat - Y, rezultat radnika). Analitičko grupisanje se vrši na osnovu X. U ovom slučaju će biti diskretno (jer se vrijednosti atributa X prilično često ponavljaju). Broj grupa jednak je broju vrijednosti atributa X u agregatu, tj. 6. Rezultati grupisanja i izračunavanja r 2 sumirani su u tabeli:

Znak faktor X Atribut rezultata Y Broj jedinica u grupi, N j Prosječna vrijednost predznaka-rezultata u grupi, ( - ) 2 N j Disperzija svojstva-rezultata u grupi, s 2 j s 2 j N j
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 = ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 = 1,56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 = ((11-12,5) 2 + (14-12,5) 2) / 2 = 2,25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 = ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 = ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \u003d 1.9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 = ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 = ((23-24,75) 2 + (24-24,75) 2 + (27-24,75) 2 + (25-24,75) 2) / 4 \u003d 2,19 8,75
=17,1 429,1 40,7

Empirijski koeficijent determinacije jednak je omjeru međugrupne varijanse atributa rezultata (d y 2) i ukupne varijanse atributa rezultata (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2) + e y 2).

Međugrupna disperzija Y će biti jednaka: d y 2 = å( - ) 2 N j / N = 429,1/20=21,45.

Preostala varijansa Y će biti: e y 2 = ås 2 j ·N j / N= 40,7/20= 2,035.

Zatim: r 2 = 21,45 / (21,45 + 2,035) = 429,1 / (429,1 + 40,7) = 0,913.

Zaključak: 91,3% varijacije u proizvodnji radnika je posledica uticaja faktora otpuštanja.

· Empirijska korelacija - r.

Ovaj indikator je korijen empirijskog koeficijenta determinacije. Pokazuje čvrstu vezu (ne samo linearnu!) između grupiranja i produktivnih karakteristika. Raspon dozvoljenih vrijednosti empirijske korelacije je od 0 do +1.

Najbliža moguća veza je funkcionalna veza, kada je svaka vrijednost rezultata Y jednoznačno određena vrijednošću faktora X (tj. rezultat grupiranja). U ovom slučaju, varijansa grupne sredine (d y 2) jednaka je ukupnoj varijansi (s y 2), tj. neće biti varijacija unutar grupe. U ovom slučaju, rezidualna disperzija (e y 2) je jednaka 0, a empirijski koeficijent determinacije jednak je 1.

Ako nema veze između znakova, tada su sve grupne sredine jednake jedna drugoj, neće biti međugrupnih varijacija (d y 2 =0), a empirijski koeficijent determinacije je 0.

Izračunajmo empirijski odnos korelacije za naš primjer: r= 0,9555. Zaključak: znakovi "proizvodnje radnika" i "otpust" su usko povezani.

Indikatori r i r 2 određuju se ne samo postojanjem veze između karakteristika X i Y, već i činjenicom grupisanja primarnih podataka. Kako se broj grupa m povećava, međugrupna varijansa d 2 raste i približava se ukupnoj varijansi. Ako je broj grupa manji od broja populacijskih jedinica N, tada vrijednosti r i r 2 nikada neće biti jednake 1, čak ni uz strogu funkcionalnu vezu.

Napominjemo da vrijednost indikatora bliskosti povezanosti nije sama po sebi dokaz postojanja uzročne veze između proučavanih osobina, već je procjena stepena međusobne konzistentnosti u promjenama karakteristika. Uspostavljanju uzročno-posledične veze nužno mora prethoditi analiza kvalitativne prirode pojava.

Empirijska korelacija

Bliskost ili snaga veze između dvije karakteristike može se izmjeriti indikatorom koji se naziva empirijski korelacijski omjer. Ovaj indikator se naziva empirijskim, jer se može izračunati na osnovu uobičajenog grupiranja po faktorima i rezultantnom atributu, odnosno na osnovu korelacione tabele. Empirijski korelacijski odnos se dobija iz pravila za sabiranje varijansi, prema kojem je , gdje je ukupna varijansa; - međugrupna disperzija; - unutargrupna (prosjek privatne) disperzije. Međugrupna varijansa je mjera fluktuacije zbog faktorskog atributa. Prosjek parcijalnih varijansi je mjera fluktuacije zbog svih drugih (osim faktorskih) karakteristika. Tada omjer izražava udio fluktuacije koja nastaje zbog predznaka faktora u ukupnoj fluktuaciji. Kvadratni korijen ovog omjera naziva se empirijski korelacijski omjer: .

To podrazumijeva pravilo da što je veća međugrupna varijansa, to faktorska osobina jače utječe na varijaciju rezultirajuće osobine. Omjeri komponenti varijansi izračunavaju se iz podataka korelacijske tablice korištenjem sljedećih formula:

; ,

gdje su privatni prosjeci; - opšti prosjek; - iznosi na osnovu ; - iznosi na osnovu ; - broj zapažanja. Isti odnos se održava i za uslovne vrijednosti primljene numeričkom transformacijom.

Sam koeficijent varijanse (radikalni izraz) naziva se koeficijent determinacije (također je jednak kvadratu empirijskog korelacionog odnosa). Empirijski omjer korelacije varira u širokom rasponu (od 0 do 1). Ako je jednak nuli, onda predznak faktora ne utiče na predznak korelacije. Ako je =1, onda rezultantni predznak u potpunosti zavisi od faktora jedan. Ako je empirijski odnos korelacije razlomak blizak jedan, onda govore o bliskoj vezi između faktorskih i efektivnih karakteristika. Ako je ovaj razlomak mali (blizu nuli), onda se govori o slaboj povezanosti između njih.

Empirijska korelacija

Za mjerenje bliskosti povezanosti koristi se nekoliko indikatora. Kod parne veze, čvrstoća veze je određena, prije svega, korelacijskim omjerom, koji se označava sa η. Kvadrat korelacionog omjera je omjer međugrupne varijanse rezultirajuće osobine, koja izražava učinak razlika u osobini faktora grupisanja na prosječnu vrijednost rezultirajuće osobine, prema ukupnoj varijansi rezultirajuće osobine, koja izražava uticaj svih uzroka i uslova na njega. Kvadrat korelacionog odnosa naziva se koeficijent determinacije.

ny fenomeni i njihovi znaci: ________________ ili rigidno deterministički

gdje je k broj grupa

N je broj zapažanja

y i - početne vrijednosti efektivne karakteristike

y j - prosječne vrijednosti efektivnog atributa za ovu grupu

y je prosječna vrijednost karakteristike

f j je veličina grupe

Gornja formula se koristi kada se izračunava indikator bliskosti povezanosti za analitičko grupisanje. Prilikom izračunavanja omjera korelacije prema nivou komunikacije koristi se sljedeća formula:

Zbir kvadrata u brojniku je varijansa rezultujuće karakteristike y objašnjene relacijom sa faktorom x (faktori). Izračunava se iz pojedinačnih podataka dobijenih za svaku jedinicu populacije na osnovu regresione jednačine.

Ako je jednadžba pogrešno odabrana ili se napravi greška pri izračunavanju njenih parametara, tada zbroj kvadrata u brojniku može biti veći nego u nazivniku, a omjer će izgubiti značenje koje bi trebao imati. Da biste izbjegli pogrešan rezultat, bolje je izračunati omjer korelacije koristeći sljedeću formulu:

Ova formula se zasniva na dobro poznatom pravilu za proširenje zbira kvadrata odstupanja pri grupisanju populacije:

D često= D intergr+D intragr

Prema ovom pravilu, umjesto međugrupne (faktorske) varijanse, možete koristiti razliku:

D često-D intragr

šta daje:

Prilikom izračunavanja η ne grupisanjem, već korelacionom jednadžbom (regresionom jednadžbom), koristimo formulu. U ovom slučaju, pravilo dekompozicije za zbir kvadrata odstupanja rezultujuće karakteristike zapisuje se kao

D ukupno \u003d D jezgro + D ostatak

Najvažnija stvar koju sada treba da nauči svako ko želi da pravilno primeni metodu korelaciono-regresijske analize jeste tumačenje formula (1.2) i (1.3). Ova odredba glasi:

Korelaciona jednačina mjeri odnos između varijacije rezultujuće karakteristike i varijacije faktora(a). Mjere čvrstoće veze mjere proporciju varijacije rezultujuće karakteristike, koja je povezana sa varijacijom faktorske karakteristike (obilježja).

| sljedeće predavanje ==>

Top