Empirijski koeficijent determinacije pokazuje. Za naš primjer, empirijska korelacija

Šta se podrazumijeva pod varijansom unutar grupe za populaciju? Koja je formula za njegovo izračunavanje? Navedite primjer. Šta se podrazumijeva pod varijansom međugrupne populacije? Koja je formula za njegovo izračunavanje? Navedite primjer.

Unutargrupna varijansa () označava slučajnu varijaciju koja ne zavisi od osobine koja leži u osnovi grupisanja.

, gdje

Grupni prosjek

Prosječna varijansa unutar grupe izračunava se na sljedeći način: prvo se izračunavaju varijanse za pojedinačne grupe (), zatim se izračunava prosječna varijansa unutar grupe:

Karakterizira sistematsko variranje, tj. razlike u veličini osobine koja se proučava, koja je osnova grupisanja. Ova disperzija se izračunava po formuli

, gdje

Prosječna vrijednost za posebnu grupu

n i- broj jedinica u grupi

- opća aritmetička sredina cjelokupne studijske populacije.

Sve tri vrste varijanse su međusobno povezane: ukupna varijansa jednaka je zbroju prosječne unutargrupne varijanse i međugrupne varijanse:

Ovaj odnos odražava zakon, koji se zove pravilo dodavanja varijanse.

20.

Šta se podrazumijeva pod ukupnom varijansom stanovništva? Koja je formula za njegovo izračunavanje? Da li način na koji su grupe grupirane utiče na ukupnu varijansu? Navedite primjer.

Ukupna varijansa () karakterizira varijaciju osobine cijele populacije pod utjecajem svih onih faktora koji su uzrokovali ovu varijaciju. Ova vrijednost je određena formulom

, gdje

opća aritmetička sredina cjelokupne studijske populacije.

S druge strane, ukupna varijansa je jednaka zbroju prosječne unutargrupne varijanse i međugrupne varijanse:

Ovaj odnos odražava zakon, koji se zove pravilo dodavanja varijanse.. Zahvaljujući pravilu sabiranja varijansi moguće je utvrditi koji je dio ukupne varijanse pod uticajem karakterističnog faktora koji leži u osnovi grupisanja.

Što je veći udio međugrupne varijanse u ukupnoj varijansi, to je jači utjecaj faktorskog atributa (ranga) na rezultantu (proizvodnju).

Ovu proporciju karakterizira empirijski koeficijent determinacije:

Za kvalitativnu procjenu bliskosti odnosa između znakova koriste se Chaddockovi odnosi.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Jačina veze

odsutan

vrlo slaba

slab

umjereno

upadljivo

zatvori

veoma blizu

funkcionalan-

nazalni

21.

Šta pokazuje koeficijent determinacije? Koja je formula za njegovo izračunavanje? U kojim jedinicama se mjeri ovaj pokazatelj? Koje su moguće vrijednosti za ovaj indikator? Šta pokazuje empirijska korelacija? Koja je formula za njegovo izračunavanje? U kojim jedinicama se mjeri ovaj pokazatelj? Koje su moguće vrijednosti za ovaj indikator?

Empirijski koeficijent determinacije () karakterizira udio međugrupne varijanse u ukupnoj varijansi:

Uzima vrijednosti od -1 do 1 i pokazuje koliko je varijacija osobine u agregatu posljedica faktora grupisanja.

Međugrupna disperzija;

totalna varijansa.

Određeno formulom:

Prihvata vrijednosti od -1 do 1

Primjer

Grupa

Broj biljaka u grupi, kom.

Prosječna bruto proizvodnja u uporedivim cijenama, miliona rubalja

Odredimo sada prosječnu vrijednost, ukupnu varijansu i međugrupnu varijansu bruto proizvodnje u uporedivim cijenama tvornica:

miliona rubalja;

Milion rub.2;

Milion rub.2.

Koeficijent determinacije će biti jednak:

Kao rezultat toga, empirijski omjer korelacije bit će jednak:

Izračunata vrijednost koeficijenta empirijske korelacije ukazuje na prilično visok statistički odnos između bruto proizvodnje u uporedivim cijenama i prosječne godišnje cijene osnovnih proizvodnih sredstava fabrika.

22.

Kako se izračunava statistika testa u univarijantnoj analizi varijanse? Koji je zakon njegove distribucije pod validnošću glavne hipoteze? Koji su parametri ovog zakona? Kako se donosi odluka u jednosmjernoj analizi varijanse na osnovu izračunate vrijednosti statistike kriterija?

Zadatak analize varijanse je proučavanje uticaja jednog ili više faktora na osobinu koja se razmatra.

Jednosmjerna analiza varijanse se koristi kada su dostupna tri ili više nezavisnih uzoraka, dobijenih iz iste opće populacije promjenom nekog nezavisnog faktora za koji iz nekog razloga ne postoje kvantitativna mjerenja.

Kao kriterijum potrebno je koristiti Fišerov kriterijum:

., gdje

Q 1 je zbir kvadrata odstupanja srednje vrijednosti uzorka od ukupne srednje vrijednosti

Q 2 je zbir kvadrata odstupanja posmatranih vrijednosti od srednje vrijednosti uzorka

Ako je izračunata vrijednost Fisherovog kriterija manja od vrijednosti u tabeli, nema razloga vjerovati da nezavisni faktor utječe na širenje prosječnih vrijednosti ( one. hipoteza nije potvrđena). Inače, nezavisni faktor ima značajan uticaj na širenje prosječnih vrijednosti ( hipoteza je tačna).

23-25.

1. U jednakim intervalima koristite jednostavnu aritmetičku sredinu:

gdje su y apsolutni nivoi serije;
n- broj nivoa u seriji.
2. Za nejednake intervale koristite ponderisanu aritmetičku sredinu:

gdje si 1 ,...,un - nivoi serije dinamike;
t1,... tn - težine, trajanje vremenskih intervala.

Prosječan nivo serije trenutaka dinamika se izračunava po formuli:
1. Sa ekvidistantnim nivoima izračunava se po formuli srednjeg kronološkog momenta serije:

gdje si 1 ,...,un - nivoi perioda za koji se vrši obračun;
n- broj nivoa;
n-1 - trajanje vremenskog perioda.
2. C nejednako nivoi se izračunavaju korištenjem kronološke formule ponderiranog prosjeka:

gdje si 1 ,...,un - nivoi vremenskih serija;
t- vremenski interval između susjednih nivoa

u statistici

Prosječan apsolutni rast definira se kao prosjek apsolutnih dobitaka u jednakim vremenskim intervalima jednog perioda. Izračunava se po formulama: 1. Na osnovu lančanih podataka o apsolutnom rastu tokom više godina, prosječni apsolutni rast izračunava se kao aritmetički jednostavan prosjek:

gdje n je broj apsolutnih priraštaja po stepenu u periodu koji se proučava.
2. Izračunava se prosječno apsolutno povećanjekroz osnovni apsolutni rast u slučaju jednakih intervala

gdje m - broj nivoa serije dinamike u periodu istraživanja, uključujući i osnovni.

Prosječna stopa rasta je slobodna generalizirajuća karakteristika intenziteta promjene nivoaserije dinamike i pokazuje koliko se puta u prosjeku mijenja nivo serije dinamike po jedinici vremena.
Kao osnova i kriterij za ispravnost izračunavanja prosječne stope rasta (pada) koristi se generalizujući indikator koji se izračunava kao proizvod lančanih stopa rasta jednak stopi rasta za cijeli posmatrani period. Ako se vrijednost atributa formira kao proizvod individualne opcije, tada se koristi geometrijska sredina.
Budući da je prosječna stopa rasta prosječni koeficijent rasta, izražen kao postotak, tada se za ekvivalentnu seriju dinamike proračuni pomoću geometrijske sredine svode na izračunavanje prosječnih koeficijenata rasta od lančanih pomoću „lancane metode“:

gdje n je broj faktora rasta lanca;
kts- faktori rasta lanca;
Kb - osnovna stopa rasta za cijeli period.
Određivanje prosječnog faktora rastamože se pojednostaviti ako su nivoi vremenske serije jasni. Pošto je proizvod faktora rasta lanca jednak osnovnom, osnovni faktor rasta se zamjenjuje u izraz radikala.
Formula za određivanje prosječnog faktora rastaza ekvidistantne serije dinamike prema "osnovnoj metodi" će biti kako slijedi:

36.

Koji su vam apsolutni pokazatelji promjena u nivou serije poznati?

Svi ovi pokazatelji se mogu odrediti na osnovni način, kada je nivo dati period u poređenju sa prvim (osnovnim) periodom, ili na lančan način - kada se porede dva nivoa susednih perioda.

Napišite formule za izračunavanje.

Osnovna apsolutna promjena je razlika između specifičnog i prvog nivoa serije, određena formulom

Pokazuje koliko je (u jedinicama indikatora serije) nivo jednog (i-tog) perioda veći ili manji od prvog (osnovnog) nivoa, te stoga može imati znak „+“ (sa povećanjem u nivoima) ili “–” (sa smanjenjem nivoa).

Lančana apsolutna promjena je razlika između specifičnog i prethodnog nivoa serije, određena je formulom

Pokazuje koliko je (u jedinicama indikatora serije) nivo jednog (i-tog) perioda veći ili manji od prethodnog nivoa, i može imati znak "+" ili "-".

Objasnite kako metoda izračuna ovisi o izboru baze za poređenje.

Koji su vam relativni pokazatelji promjene nivoa serije poznati? Napišite formule za izračunavanje.

Osnovna relativna promjena (osnovna stopa rasta ili osnovni indeks dinamike) je odnos specifičnog i prvog nivoa serije, određen formulom

Relativna promjena lanca (stopa rasta lanca ili indeks dinamike lanca) je omjer specifičnog i prethodnih nivoa serije, određen formulom

Objasnite kako metoda izračuna ovisi o izboru baze za poređenje.

Relativna promjena pokazuje koliko je puta nivo datog perioda veći od nivoa bilo kojeg prethodnog perioda (za i > 1) ili koji je njegov dio (za i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Koji su vam prosječni pokazatelji promjene nivoa serije poznati? Napišite formule za izračunavanje prosječnog apsolutnog rasta, stope rasta i stope rasta nivoa serije.

Prosječni apsolutni rast definira se kao prosjek apsolutnog rasta za jednake vremenske periode u jednom periodu. Izračunava se po formulama: 1. Na osnovu lančanih podataka o apsolutnom rastu tokom više godina, prosječni apsolutni rast izračunava se kao aritmetički jednostavan prosjek:

gdje n je broj apsolutnih priraštaja po stepenu u periodu koji se proučava.

2. Prosječno apsolutno povećanje izračunava se kroz osnovni apsolutni porast u slučaju jednakih intervala

gdje m - broj nivoa serije dinamike u periodu istraživanja, uključujući i osnovni.

Prosječna stopa rasta je slobodna generalizirajuća karakteristika intenziteta promjena nivoa niza dinamike i pokazuje koliko se puta u prosjeku mijenja nivo niza dinamike u jedinici vremena.

Kao osnova i kriterij za ispravnost izračunavanja prosječne stope rasta (pada) koristi se generalizujući indikator koji se izračunava kao proizvod lančanih stopa rasta jednak stopi rasta za cijeli posmatrani period. Ako se karakteristična vrijednost formira kao proizvod pojedinačnih opcija, tada se koristi geometrijska sredina.

Budući da je prosječna stopa rasta prosječni koeficijent rasta, izražen kao postotak, tada se za ekvivalentnu seriju dinamike proračuni pomoću geometrijske sredine svode na izračunavanje prosječnih koeficijenata rasta od lančanih pomoću „lancane metode“:

gdje n je broj faktora rasta lanca;

Kc - lančani koeficijenti rasta;

Kb - osnovna stopa rasta za cijeli period.

Stopa promjene (stopa rasta) nivoa je relativni indikator koji pokazuje koliko je posto dati nivo veći (ili manji) od drugog, uzet kao osnova za poređenje. Izračunava se oduzimanjem 100% od relativne promjene, odnosno po formuli:

ili kao postotak apsolutne promjene do nivoa u odnosu na koji se apsolutna promjena izračunava (bazna linija), odnosno prema formuli:

.

Koji su nedostaci ovih indikatora? U kojim slučajevima ih je prikladno koristiti? Kako se ovi nedostaci mogu otkloniti? Napišite formule za izračunavanje prosjeka koje osiguravaju očuvanje ukupne vrijednosti serije.

38.

Kako odrediti vrstu glavnog trenda prema vrijednostima indikatora promjena u nivoima serije? Navedite primjere.

Identifikacija opšteg trenda vremenske serije može se izvršiti izglađivanjem vremenske serije korišćenjem metode pokretnog proseka. Suština ove tehnike je da se izračunati (teorijski) nivoi određuju iz početnih nivoa serije (empirijski podaci).

Glavni uslov za primenu ove metode je izračunavanje pokretnih (pokretnih) srednjih karika iz takvog broja nivoa serije koji odgovara trajanju dinamike ciklusa posmatranog u seriji.

Empirijska korelacija

Bliskost ili snaga veze između dvije karakteristike može se izmjeriti indikatorom koji se naziva empirijski korelacijski omjer. Ovaj indikator se naziva empirijskim, jer se može izračunati na osnovu uobičajenog grupiranja po faktorima i rezultantnom atributu, odnosno na osnovu korelacione tabele. Empirijska korelacija se dobija iz pravila dodavanja varijanse, prema kojem je , gdje
- ukupna varijansa;
- međugrupna disperzija;
- unutargrupna (prosjek privatne) disperzije. Međugrupna varijansa je mjera fluktuacije zbog faktorske osobine. Prosjek parcijalnih varijansi je mjera fluktuacije zbog svih drugih (osim faktorskih) karakteristika. Tada omjer izražava udio fluktuacije koja nastaje zbog predznaka faktora u ukupnoj fluktuaciji. Kvadratni korijen ovog omjera naziva se empirijski korelacijski omjer:
.

To podrazumijeva pravilo da što je veća međugrupna varijansa, to faktorska osobina jače utječe na varijaciju rezultirajuće osobine. Omjeri komponenti varijansi izračunavaju se iz podataka korelacijske tablice korištenjem sljedećih formula:

;
,

gdje su privatni prosjeci; - opšti prosjek; - zbrojevi po karakteristikama ; - zbrojevi po karakteristikama ;
- broj zapažanja. Isti odnos vrijedi i za uvjetne vrijednosti
, dobiveno numeričkom transformacijom .

Sam koeficijent varijanse (radikalni izraz) naziva se koeficijent determinacije (također je jednak kvadratu empirijskog korelacionog odnosa). Empirijski omjer korelacije varira u širokom rasponu (od 0 do 1). Ako je jednak nuli, onda predznak faktora ne utiče na predznak korelacije. Ako =1, što znači da rezultantni predznak u potpunosti zavisi od faktora jedan. Ako je empirijski odnos korelacije razlomak blizak jedan, onda govore o bliskoj vezi između faktorskih i efektivnih karakteristika. Ako je ovaj razlomak mali (blizu nuli), onda se govori o slaboj povezanosti između njih.

Koeficijent linearne korelacije i indeks korelacije

Mjera bliskosti odnosa između dvije statistički povezane karakteristike je koeficijent linearne korelacije ili jednostavno koeficijent korelacije. Ima isto značenje kao empirijski odnos korelacije, ali može imati i pozitivne i negativne vrijednosti. Koeficijent korelacije ima strogi matematički izraz za linearnu vezu. Pozitivna vrijednost će ukazati na direktan odnos između karakteristika, negativna vrijednost će ukazati na suprotno.

Koeficijent parne korelacije u slučaju linearnog oblika komunikacije izračunava se po formuli

,

i njegovu vrijednost uzorka - prema formuli

Uz mali broj zapažanja, zgodno je izračunati koeficijent korelacije uzorka koristeći sljedeću formulu:

Vrijednost koeficijenta korelacije se mijenja u intervalu
.

At
postoji funkcionalni odnos između dvije varijable, kada
- direktna funkcionalna veza. Ako
, tada vrijednosti X i Y u uzorku nisu u korelaciji; ako je sistem slučajnih varijabli
ima dvodimenzionalnu normalnu distribuciju, tada će i veličine X i Y biti nezavisne.

Ako je koeficijent korelacije u intervalu
, tada postoji inverzna korelacija između X i Y. To potvrđuje i vizuelna analiza početnih informacija. U ovom slučaju, odstupanje Y od srednje vrijednosti uzima se sa suprotnim predznakom.

Ako je svaki par vrijednosti X i Y najčešće istovremeno iznad (ispod) odgovarajućih prosječnih vrijednosti, tada postoji direktna korelacija između vrijednosti i koeficijenta korelacije u intervalu
.

Ako, s druge strane, odstupanje vrijednosti X od srednje vrijednosti podjednako često uzrokuje odstupanja vrijednosti Y naniže od srednje vrijednosti, a odstupanja su cijelo vrijeme različita, onda možemo pretpostaviti da je vrijednost koeficijent korelacije teži nuli.

Treba napomenuti da vrijednost koeficijenta korelacije ne zavisi od mjernih jedinica i izbora referentne tačke. To znači da ako se varijable X i Y smanje (povećaju) za K puta ili za isti broj C, tada se koeficijent korelacije neće promijeniti.

Da bi se pojednostavilo izračunavanje mjere korelacijske čvrstoće, često se koristi indeks korelacije, koji se određuje sljedećim formulama:

,
,

gdje
- rezidualna varijansa, koja karakteriše varijaciju rezultujućeg atributa pod uticajem drugih neuračunatih faktora.

Višestruka korelacija

Višestruka korelacija - zavisnost rezultanta i dva ili više faktorskih karakteristika uključenih u studiju. Indikator bliskosti odnosa između rezultantne i dva ili više faktorskih karakteristika naziva se višestruki ili kumulativni koeficijent korelacije i označava se sa R. Kumulativni koeficijent implicira postojanje linearne veze između svakog para karakteristika, koja se može izraženo pomoću uparenih koeficijenata korelacije. Ako postoji kumulativna mjera čvrstoće odnosa između efektivne karakteristike () i dva faktorska svojstva ( i ), tada se izračunavanje kumulativnog koeficijenta korelacije vrši prema formuli:

,

Gdje indeksi označavaju između kojih karakteristika se proučava odnos parova.

U formulama za izračunavanje parnih koeficijenata korelacije mijenjaju se samo simboli koji označavaju jedan ili drugi faktor. Dakle, ako se koeficijent korelacije između i izračunava po formuli , tada se koeficijent korelacije između i izračunava: ; između i - dakle:

Naseobinski dio

Zadatak 31

    Za deset preduzeća za izvještajni period dostupni su sljedeći podaci:

tabela 2

Preduzeća

Prosječni godišnji trošak osnovnih proizvodnih sredstava, miliona rub.

Izlaz, milion rubalja

Da biste proučili odnos između veličine prosječne godišnje cijene osnovnih sredstava i proizvodnje, izračunajte linearnu jednačinu odnosa.

2. Na osnovu datih podataka: a) izračunati: linearni koeficijent korelacije; b) provjeriti ispravnost izbora oblika komunikacije izračunavanjem indeksa korelacije.

    Koristeći procesor za proračunske tablice Microsoft Excel, napravićemo radni list:

Tabela 3

Proračun suma za izračunavanje parametara jednačine prave linije

239,74 *1236 = 539,1 distribucije vjerovatnoće... ekonomski analiza, riješeno na osnovu regresija ekonomski modeli. Razmotrimo y - efektivni znak i x - faktor znakova. Metode korelativno-regresija analiza ...

  • Program discipline "Kompjuterske metode za analizu socioloških podataka" (Uvod u matematičku statistiku i analizu podataka) Za smjer 040200. 68 "Sociologija"

    disciplinski program

    Prijave. 11 3 2 6 Disperzivno analiza 9 2 2 5 Dvostruki i višestruki regresivan analiza 9 2 2 5 Svojstva koeficijenata... od SPSS korisnika 11.0 Šiškov V.I. korelacija analiza in ekonomski istraživanja. M. 1975. Eddous M., Stansfield...

  • G. L. Savitskaya analiza ekonomske aktivnosti preduzeća

    Dokument

    Izvrsnost, najnovije tehnike ekonomski istraživanja. Analiza trebalo bi da bude složeno. Složenost istraživanja ... na nivou prosječne satnice korelativno-regresivan analiza. u multifaktorski korelacija model prosječne satne proizvodnje...

  • 3. Empirijski odnos korelacije izračunava se po formuli

    Međugrupna varijansa, koja karakteriše vrednost kvadrata devijacije grupne sredine od opšteg proseka efektivnog atributa.

    Ukupna varijansa, koja pokazuje prosječnu vrijednost kvadrata odstupanja vrijednosti rezultirajuće karakteristike od njihovog prosječnog nivoa.

    Napravimo tabelu za izračunavanje ukupne varijanse (vidi tabelu 8)

    Tabela 8

    Tabela podataka za određivanje ukupne varijanse

    N, p / str Troškovi hrane
    1 21 441
    2 16 256
    3 26,1 681,21
    4 28 784
    5 26 676
    6 22,5 506,25
    7 27,6 761,76
    8 35 1225
    9 23,9 571,21
    10 22,5 506,25
    11 15 225
    12 25,2 635,04
    13 29 841
    14 21,4 457,96
    15 24,9 620,01
    16 24,8 615,04
    17 16 256
    18 23,6 556,96
    19 27,2 739,84
    20 35 1225
    21 17 289
    22 23,8 566,44
    23 22,6 510,76
    24 25 625
    25 27 729
    26 30 900
    27 35 1225
    28 25,4 645,16
    29 27,2 739,84
    30 26,3 691,69
    Ukupno 750 19502,42

    Ukupna varijansa rezultirajućeg atributa izračunava se po formuli:

    =

    Međugrupna disperzija se izračunava po formuli:

    Napravimo pomoćnu tabelu za izračunavanje podataka (vidi tabelu 9)


    Tabela 9

    Tablica podataka za izračunavanje međugrupne varijanse

    Broj grupe Broj domaćinstava, kom Izdaci za hranu, hiljada rubalja
    Ukupno Prosjek po domaćinstvu
    f
    1 28-40 3 48 16 -9 81 243
    2 40-52 5 105 21 -4 16 80
    3 52-64 12 300 25 0 0 0
    4 64-76 6 165 27,5 2,5 6,25 37,5
    5 76-88 4 132 33 8 64 256
    Ukupno 30 750 616,5

    Zaključak: odnos između faktora je veoma blizak, jer uzima vrijednosti od 0,9 do 0,99.

    Koeficijent determinacije je kvadrat empirijske korelacije. shodno tome,

    (81,9%)

    Zaključak: proizvodnja u ovim preduzećima zavisi od 81,9% kapitalne produktivnosti i 18,1% od ostalih faktora.

    Zadatak 3

    Na osnovu rezultata zadatka 1, sa vjerovatnoćom od 0,9543, odredite:

    1. Greška uzorkovanja prosječnog bruto prihoda po članu domaćinstva godišnje i granice u kojima će se on nalaziti u opštoj populaciji.

    2. Greška uzorkovanja udjela domaćinstava sa bruto prihodom manjim od 52 hiljade rubalja. i više od milion rubalja. i granice unutar kojih će se nalaziti generalni udio.

    1. Greška uzorkovanja za srednju vrijednost određena je formulom:

    , gdje

    varijansa uzorka;

    n - veličina uzorka;

    t je koeficijent pouzdanosti, koji se određuje iz tablice vrijednosti Laplaceove integralne funkcije za datu vjerovatnoću. U ovom slučaju, pri P=0,954, vrijednost t=2.

    N-broj jedinica u opštoj populaciji, N=6000 kom.

    Izračunajmo varijansu. Podaci će biti prikazani u obliku tabele (vidi tabelu 11).

    Tabela 11

    Podaci za izračunavanje disperzije nivoa prinosa na sredstva

    Broj grupe Grupiranje domaćinstava prema bruto prihodima Broj domaćinstava, kom
    f
    1 28-40 3 34 -25,1 630,01 1890,03
    2 40-52 5 46 -13,1 171,61 858,05
    3 52-64 12 58 -1,1 1,21 14,52
    4 64-76 6 70 10,9 118,81 712,86
    5 76-88 4 82 22,9 524,41 2097,64
    Ukupno 30 5573,1

    Empirijska korelacija

    Za mjerenje bliskosti povezanosti koristi se nekoliko indikatora. Kod parne veze, čvrstoća veze je određena, prije svega, korelacijskim omjerom, koji se označava sa η. Kvadrat korelacionog omjera je omjer međugrupne varijanse rezultirajuće osobine, koja izražava učinak razlika u osobini faktora grupisanja na prosječnu vrijednost rezultirajuće osobine, prema ukupnoj varijansi rezultirajuće osobine, koja izražava uticaj svih uzroka i uslova na njega. Kvadrat korelacionog odnosa naziva se koeficijent determinacije.

    ny fenomeni i njihovi znaci: ________________ ili rigidno deterministički

    gdje je k broj grupa

    N je broj zapažanja

    y i - početne vrijednosti efektivne karakteristike

    y j - prosječne vrijednosti efektivnog atributa za ovu grupu

    y je prosječna vrijednost karakteristike

    f j je veličina grupe

    Gornja formula se koristi kada se izračunava indikator bliskosti povezanosti za analitičko grupisanje. Prilikom izračunavanja omjera korelacije prema nivou komunikacije koristi se sljedeća formula:

    Zbir kvadrata u brojniku je varijansa rezultujuće karakteristike y objašnjene relacijom sa faktorom x (faktori). Izračunava se iz pojedinačnih podataka dobijenih za svaku jedinicu populacije na osnovu regresione jednačine.

    Ako je jednadžba pogrešno odabrana ili se napravi greška pri izračunavanju njenih parametara, tada zbroj kvadrata u brojniku može biti veći nego u nazivniku, a omjer će izgubiti značenje koje bi trebao imati. Da biste izbjegli pogrešan rezultat, bolje je izračunati omjer korelacije koristeći sljedeću formulu:

    Ova formula se zasniva na dobro poznatom pravilu za proširenje zbira kvadrata odstupanja pri grupisanju populacije:

    D često= D intergr+D intragr

    Prema ovom pravilu, umjesto međugrupne (faktorske) varijanse, možete koristiti razliku:

    D često-D intragr

    šta daje:

    Prilikom izračunavanja η ne grupisanjem, već korelacionom jednadžbom (regresionom jednadžbom), koristimo formulu. U ovom slučaju, pravilo dekompozicije za zbir kvadrata odstupanja rezultujuće karakteristike zapisuje se kao

    D ukupno \u003d D jezgro + D ostatak

    Najvažnija stvar koju sada treba da nauči svako ko želi da pravilno primeni metodu korelaciono-regresijske analize jeste tumačenje formula (1.2) i (1.3). Ova odredba glasi:

    Korelaciona jednačina mjeri odnos između varijacije rezultujuće karakteristike i varijacije faktora(a). Mjere čvrstoće veze mjere proporciju varijacije rezultujuće karakteristike, koja je povezana sa varijacijom faktorske karakteristike (obilježja).

    | sljedeće predavanje ==>

    Empirijski omjer korelacije mjeri koliki je dio ukupne fluktuacije rezultirajućeg atributa uzrokovan proučavanim faktorom. Srednja empirijska korelacija kreće se od 0 do 1.

    Empirijska korelacija se obično nalazi u sledeće vrste zadaci:

    • 1) kada je potrebno napraviti analitičko grupisanje za dvije serije podataka X i Y
    • 2) grupisanje je već obavljeno, potrebno je provjeriti pravilo za dodavanje varijansi
    • 3) za dvije serije podataka X i Y potrebno je pronaći regresionu jednačinu i procijeniti njen značaj

    Formula varijance alternativna karakteristika

    Na osnovu gore navedenog, možemo izvesti formulu za pronalaženje varijanse alternativnog obilježja ako znamo postotak takve karakteristike u ukupnom uzorku.

    U početku pretpostavljamo da karakteristika ima samo dvije vrijednosti.

    Dakle, zbir omjera elemenata u kojima elementi statističke serije imaju vrijednost atributa "ne" i elemenata serije koji imaju vrijednost atributa "da" jednak je jedan.

    Da bismo pronašli prosječnu vrijednost serije, zamjenjujemo vrijednosti alternativnih karakteristika (0 i 1) u formulu za pronalaženje ponderirane prosječne vrijednosti statističke serije. Odakle će, sasvim očito, biti jedinica u nazivniku, a procentualna vrijednost elemenata "1" u brojniku. To jest, tačno procentualna vrijednost elemenata sa atributom "1". (Formula 2)

    Formula varijanse je ponderisani prosjek kvadrata odstupanja svake vrijednosti u nizu podataka. (Formula 3)

    Budući da u našoj seriji podaci imaju samo dvije vrste vrijednosti - "0" i "1", onda se formula za pronalaženje varijanse za niz sa alternativnim svojstvom svodi na formulu 4. Objašnjenje. pošto smo upravo zaključili da je srednja vrijednost uzorka jednaka p (Formula 2), tada će vrijednost kvadrata razlike između vrijednosti (0/1) i srednje vrijednosti, prema formuli 1, biti (1- p)2 u prvom slučaju, a u drugom slučaju (1-q)2, sada primjenjujući zaključak iz prve formule: q = 1 - p, p = 1- q . Dobijamo p2 i q2. U skladu s tim, omjer vrijednosti "0" i "1" jednak je p i q, kao rezultat toga, u brojniku i ispada q2 p i p2 q. Zbir udjela karakteristika vrijednosti "0" i "1" prema Formuli 1 jednak je 1. Kao rezultat toga, Formula 4 uzima vrijednost pq, koja će biti jednaka vrijednosti varijanse alternativnu funkciju. Na osnovu pronađene vrijednosti varijanse alternativnog obilježja naći ćemo standardnu ​​devijaciju (Formula 5). Stavljajući vrijednost iz Formule 1 u Formulu 5, dobijamo formulu standardne devijacije za varijansu niza sa alternativnim svojstvom.

    
    Top