Il valore del coefficiente empirico di determinazione pari a 0 indica. Il coefficiente di determinazione cosa misura - la formula

Coefficiente empirico di determinazioneè ampiamente utilizzato nei problemi statistici ed è un indicatore che rappresenta la quota nella varianza totale dell'attributo risultante e caratterizza la forza dell'influenza dell'attributo di raggruppamento sulla formazione della variazione generale. Può essere calcolato utilizzando la formula:

Questo coefficiente mostra la proporzione della variazione della caratteristica effettiva y sotto l'influenza del fattore x. In assenza di una connessione, il coefficiente empirico di determinazione è uguale a zero, e nel caso di un funzionale forte connessione- unità.

rappresentato come radice quadrata di coefficiente empirico determinazioni. Mostra la vicinanza della relazione tra i dati statistici ed è determinata dalla formula:

dove il numeratore è la dispersione delle medie di gruppo;
il denominatore è la varianza totale.

relazione di correlazioneè zero se non c'è relazione tra i dati. In questo caso, tutte le medie di gruppo saranno uguali tra loro e non ci sarà alcuna variazione intergruppo.

Il rapporto di correlazione è uguale a uno quando la connessione è funzionante. In questo caso, la varianza delle medie di gruppo sarà uguale alla varianza totale, cioè non ci sarà variazione infragruppo.

Più i valori del rapporto di correlazione sono vicini a uno, più forte, più vicino alla dipendenza funzionale, è la relazione tra le caratteristiche.

Calcolato secondo la formula:

dove fe e ft sono frequenze empiriche e teoriche.

attraverso Il criterio di Pearson le tabelle determinano la probabilità P(x^2). Gli input alla tabella sono valori x^2 e il numero di gradi di libertà k = n - p -1.

Se P > 0,05, le distribuzioni empiriche e teoriche sono considerate vicine. Quando P appartiene, la coincidenza tra loro è soddisfacente, e in altri casi è insufficiente.

Calcolato secondo la formula:

dove il numeratore è il momento centrale del terzo ordine.

b^3 - il cubo della deviazione standard.

Il fattore di asimmetria è valore adimensionale, che ne consente l'utilizzo per varie distribuzioni. Con asimmetria a sinistra, Mo > Mt > xav, con asimmetria a destra, relazioni inverse. Ciò consente di applicare l'indicatore di asimmetria più semplice:

La curtosi nelle statistiche

C'è un grado di pendenza della distribuzione empirica rispetto a quella normale. È determinato dalla formula:

dove il numeratore è il momento centrale del quarto ordine

Quando la distribuzione raggiunge il picco rispetto al normale, la curtosi sarà positiva, se la distribuzione è piatta, sarà negativa. Per una distribuzione normale, E = 0.

Cosa si intende per varianza all'interno del gruppo per una popolazione? Qual è la formula per il suo calcolo? Dare un esempio. Cosa si intende per varianza della popolazione intergruppo? Qual è la formula per il suo calcolo? Dare un esempio.

Varianza infragruppo () indica una variazione casuale che non dipende dal tratto sottostante il raggruppamento.

, dove

Media di gruppo

La varianza media intragruppo viene calcolata come segue: prima vengono calcolate le varianze per i singoli gruppi (), quindi viene calcolata la varianza media intragruppo:

Caratterizza la variazione sistematica, cioè differenze nella grandezza del tratto in esame, che è la base del raggruppamento. Questa dispersione è calcolata dalla formula

, dove

Valore medio per un gruppo separato

io- numero di unità nel gruppo

- la media aritmetica generale dell'intera popolazione studiata.

Tutti e tre i tipi di varianza sono interconnessi: la varianza totale è uguale alla somma della varianza infragruppo media e della varianza intergruppo:

Questo rapporto riflette la legge, che si chiama regola dell'addizione della varianza.

20.

Cosa si intende per varianza totale della popolazione? Qual è la formula per il suo calcolo? Il modo in cui i gruppi sono raggruppati influisce sulla varianza totale? Dare un esempio.

La varianza totale () caratterizza la variazione del tratto dell'intera popolazione sotto l'influenza di tutti quei fattori che hanno causato questa variazione. Questo valore è determinato dalla formula

, dove

la media aritmetica generale dell'intera popolazione studiata.

D'altra parte, la varianza totale è uguale alla somma della varianza infragruppo media e della varianza intergruppo:

Questo rapporto riflette la legge, che si chiama regola dell'addizione della varianza.. Grazie alla regola dell'addizione delle varianze, è possibile determinare quale parte della varianza totale è sotto l'influenza del fattore caratteristico sottostante il raggruppamento.

Maggiore è la proporzione della varianza intergruppo nella varianza totale, maggiore è l'influenza dell'attributo fattoriale (grado) sulla risultante (produzione).

Questa proporzione è caratterizzata da un coefficiente di determinazione empirico:

Per una valutazione qualitativa della vicinanza della relazione tra i segni, vengono utilizzate le relazioni di Chaddock.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Forza della connessione

assente

molto debole

debole

moderare

cospicuo

chiudere

molto vicino

funzionale-

nasale

21.

Cosa indica il coefficiente di determinazione? Qual è la formula per il suo calcolo? In quali unità viene misurato questo indicatore? Quali sono i possibili valori per questo indicatore? Cosa dice l'empirico relazione di correlazione? Qual è la formula per il suo calcolo? In quali unità viene misurato questo indicatore? Quali sono i possibili valori per questo indicatore?

Coefficiente empirico di determinazione () caratterizza la quota di varianza intergruppo nella varianza totale:

Prende valori da -1 a 1 e mostra quanto la variazione del tratto nell'aggregato è dovuta al fattore di raggruppamento.

dispersione intergruppo;

varianza totale.

Determinato dalla formula:

Accetta valori da -1 a 1

Esempio

Gruppo

Numero di piante nel gruppo, pz.

Produzione lorda media a prezzi comparabili, milioni di rubli

Determiniamo ora il valore medio, la varianza totale e la varianza intergruppo della produzione lorda a prezzi comparabili delle fabbriche:

milioni di rubli;

Milioni strofinare.2;

Milioni strofinare.2.

Il coefficiente di determinazione sarà pari a:

Di conseguenza, il rapporto di correlazione empirica sarà pari a:

Il valore calcolato del rapporto di correlazione empirica indica un rapporto statistico piuttosto elevato tra la produzione lorda a prezzi comparabili e il costo medio annuo delle immobilizzazioni produttive delle fabbriche.

22.

Come viene calcolata una statistica test nell'analisi univariata della varianza? Qual è la legge della sua distribuzione sotto la validità dell'ipotesi principale? Quali sono i parametri di questa legge? Come viene presa una decisione in un'analisi della varianza unidirezionale basata sul valore calcolato della statistica del criterio?

Il compito dell'analisi della varianza è studiare l'influenza di uno o più fattori sul tratto in esame.

L'analisi della varianza unidirezionale viene utilizzata quando sono disponibili tre o più campioni indipendenti, ottenuti dalla stessa popolazione generale modificando alcuni fattori indipendenti per i quali, per qualche motivo, non esistono misurazioni quantitative.

Come criterio è necessario utilizzare il criterio di Fisher:

., dove

Q 1 è la somma dei quadrati delle deviazioni delle medie campionarie dalla media totale

Q 2 è la somma dei quadrati delle deviazioni dei valori osservati dalla media campionaria

Se il valore calcolato del criterio di Fisher è inferiore al valore tabulare, non vi è motivo di ritenere che il fattore indipendente influisca sulla diffusione dei valori medi ( quelli. ipotesi non è stata confermata). In caso contrario, il fattore indipendente ha un effetto significativo sulla diffusione dei valori medi ( l'ipotesi è corretta).

23-25.

1. A intervalli uguali, usa la semplice media aritmetica:

dove y sono i livelli assoluti della serie;
n- il numero di livelli nella serie.
2. Per intervalli disuguali, utilizzare la media aritmetica ponderata:

dove sei 1 ,...,уn - livelli della serie di dinamiche;
t1,... tn - pesi, durata degli intervalli di tempo.

Livello medio delle serie di momenti la dinamica è calcolata dalla formula:
1. Con livelli equidistanti è calcolato dalla formula della serie di momenti cronologici medi:

dove sei 1 ,...,уn - livelli del periodo per il quale viene effettuato il calcolo;
n- numero di livelli;
n-1 - durata del periodo di tempo.
2.C diseguale i livelli sono calcolati utilizzando la formula della media ponderata cronologica:

dove sei 1 ,...,уn - livelli di serie temporali;
t- intervallo di tempo tra livelli adiacenti

nelle statistiche

Crescita media assoluta è definito come la media dei guadagni assoluti su intervalli di tempo uguali di un periodo. Viene calcolato dalle formule: 1. Sulla base dei dati a catena sulla crescita assoluta per un certo numero di anni, la crescita assoluta media viene calcolata come media aritmetica semplice:

dove n è il numero di incrementi assoluti della legge di potenza nel periodo in esame.
2. Viene calcolato l'incremento assoluto medioattraverso la crescita assoluta di base nel caso di intervalli uguali

dove m - il numero di livelli di una serie di dinamiche nel periodo di studio, compreso quello di base.

Tasso di crescita medio è una caratteristica di generalizzazione libera dell'intensità del cambiamento di livelloserie dinamica e mostra quante volte il livello della serie di dinamiche cambia in media per unità di tempo.
Come base e criterio per la correttezza del calcolo del tasso medio di crescita (diminuzione), viene utilizzato un indicatore generalizzante, calcolato come prodotto di tassi di crescita a catena pari al tasso di crescita per l'intero periodo considerato. Se il valore dell'attributo è formato come un prodotto opzioni individuali, allora viene utilizzata la media geometrica.
Poiché il tasso di crescita medio è il coefficiente di crescita medio, espresso in percentuale, quindi per la serie equivalente di dinamiche, i calcoli che utilizzano la media geometrica si riducono al calcolo dei coefficienti di crescita medi da quelli a catena utilizzando il "metodo a catena":

dove n è il numero di fattori di crescita della catena;
kts- fattori di crescita della catena;
Kb - tasso di crescita di base per l'intero periodo.
Determinazione del fattore di crescita mediopuò essere semplificato se i livelli delle serie temporali sono chiari. Poiché il prodotto dei fattori di crescita della catena è uguale a quello della base, il fattore di crescita della base viene sostituito nell'espressione radicale.
Formula per la determinazione del fattore di crescita medioper serie equidistanti di dinamiche secondo il "metodo base" sarà il seguente:

36.

Quali sono gli indicatori assoluti dei cambiamenti nel livello della serie che conosci?

Tutti questi indicatori possono essere determinati in modo basilare, quando il livello determinato periodo rispetto al primo periodo (di base), o in modo concatenato - quando vengono confrontati due livelli di periodi vicini.

Scrivere formule di calcolo.

La variazione assoluta di base è la differenza tra lo specifico e il primo livello della serie, determinata dalla formula

Mostra quanto (in unità di indicatori della serie) il livello di un (i-esimo) periodo è maggiore o minore del primo livello (di base) e, quindi, può avere un segno "+" (con un aumento in livelli) o “–” (con una diminuzione dei livelli).

Il cambiamento assoluto della catena è la differenza tra i livelli specifici e precedenti della serie, è determinato dalla formula

Mostra quanto (in unità di indicatori della serie) il livello di un (i-esimo) periodo è maggiore o minore del livello precedente e può avere un segno "+" o "-".

Spiegare come il metodo di calcolo dipende dalla scelta della base di confronto.

Quali indicatori relativi di cambiamento nel livello della serie ti sono noti? Scrivere formule di calcolo.

La variazione relativa di base (tasso di crescita di base o indice di dinamica di base) è il rapporto tra uno specifico e il primo livello della serie, determinato dalla formula

La variazione relativa della catena (tasso di crescita della catena o indice di dinamica della catena) è il rapporto tra un livello specifico e uno precedente della serie, determinato dalla formula

Spiegare come il metodo di calcolo dipende dalla scelta della base di confronto.

La variazione relativa mostra quante volte il livello di un dato periodo è maggiore del livello di qualsiasi periodo precedente (per i > 1) o quale parte di esso è (per i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Quali sono gli indicatori medi del cambiamento del livello della serie che conosci? Scrivi le formule per calcolare la crescita media assoluta, il tasso di crescita e il tasso di crescita dei livelli della serie.

La crescita assoluta media è definita come la media della crescita assoluta per periodi di tempo uguali in un periodo. Viene calcolato dalle formule: 1. Sulla base dei dati a catena sulla crescita assoluta per un certo numero di anni, la crescita assoluta media viene calcolata come media aritmetica semplice:

dove n è il numero di incrementi assoluti della legge di potenza nel periodo in esame.

2. L'incremento assoluto medio è calcolato attraverso l'incremento assoluto di base nel caso di intervalli uguali

dove m - il numero di livelli di una serie di dinamiche nel periodo di studio, compreso quello di base.

Il tasso di crescita medio è una caratteristica di generalizzazione libera dell'intensità dei cambiamenti nei livelli di una serie di dinamiche e mostra quante volte il livello di una serie di dinamiche cambia in media per unità di tempo.

Come base e criterio per la correttezza del calcolo del tasso medio di crescita (diminuzione), viene utilizzato un indicatore generalizzante, calcolato come prodotto di tassi di crescita a catena pari al tasso di crescita per l'intero periodo considerato. Se il valore caratteristico è formato come prodotto di singole opzioni, viene utilizzata la media geometrica.

Poiché il tasso di crescita medio è il coefficiente di crescita medio, espresso in percentuale, quindi per la serie equivalente di dinamiche, i calcoli che utilizzano la media geometrica si riducono al calcolo dei coefficienti di crescita medi da quelli a catena utilizzando il "metodo a catena":

dove n è il numero di fattori di crescita della catena;

Кц - coefficienti di crescita a catena;

Kb - tasso di crescita di base per l'intero periodo.

Il tasso di variazione (tasso di crescita) dei livelli è un indicatore relativo che mostra di quanta percentuale un dato livello è maggiore (o minore) di un altro, preso come base di confronto. Viene calcolato sottraendo il 100% dalla variazione relativa, ovvero con la formula:

o come percentuale della variazione assoluta rispetto al livello rispetto al quale viene calcolata la variazione assoluta (linea di base), ovvero secondo la formula:

.

Quali sono gli svantaggi di questi indicatori? In quali casi è opportuno utilizzarli? Come si possono rimediare a queste carenze? Scrivi formule per il calcolo delle medie che assicurino la conservazione del valore totale della serie.

38.

Come determinare il tipo di tendenza principale in base ai valori degli indicatori dei cambiamenti nei livelli della serie? Dare esempi.

L'identificazione dell'andamento generale delle serie storiche può essere effettuata appianando le serie storiche utilizzando il metodo della media mobile. L'essenza di questa tecnica è che i livelli calcolati (teorici) sono determinati dai livelli iniziali della serie (dati empirici).

La condizione principale per applicare questo metodo è calcolare i collegamenti medi mobili (mobili) da un tale numero di livelli della serie che corrisponde alla durata della dinamica del ciclo osservata nella serie.

RISPONDERE

Una valutazione quantitativa della vicinanza della comunicazione secondo dati empirici consiste nel calcolare indicatori della vicinanza della comunicazione:

· Coefficiente di determinazione empirico (rapporto di dispersione empirico) - r 2 .

Questo indicatore è calcolato in base ai dati del raggruppamento analitico (tabella), come rapporto tra la varianza intergruppo del tratto risultante Y (d y 2) e la varianza totale Y (s y 2):

Secondo il teorema di scomposizione della varianza, la varianza intergruppo è correlata alla varianza totale: s y 2 =d y 2 +e y 2 . Quindi il coefficiente di determinazione empirico può essere calcolato attraverso la varianza residua utilizzando la formula:

dove s j 2 è la varianza del risultato Y all'interno del gruppo j-esimo.

Il coefficiente di determinazione empirico caratterizza la forza dell'influenza dell'attributo di raggruppamento (X) sulla formazione della variazione complessiva dell'attributo risultante Y e mostra la percentuale (quota) della variazione dell'attributo di risultato dovuta al fattore di attributo sottostante il raggruppamento.

È conveniente calcolare r 2 nella tabella:

Fattore di segno X j Nj Valore medio del risultato della caratteristica s j 2 N j
x1 N 1 s 1 2 N 1
x2 N 2 s 2 2 N 2
.... ...
Xm Nm s m 2 N m
Totale N X es j 2

Quindi .

Considera un esempio. Sia dato un insieme di 20 lavoratori, caratterizzato dalle seguenti caratteristiche: Y - la produzione di un lavoratore (cozzo / turno) e X - qualifica (grado). I dati iniziali sono presentati nella tabella:

X
Y

È necessario valutare la vicinanza della relazione tra le caratteristiche utilizzando il coefficiente di determinazione empirico (r 2).

Per calcolare r 2, eseguiremo un raggruppamento analitico della popolazione. Come fattore di segno, prendiamo X (la categoria di un lavoratore), come risultato di segno - Y, l'output di un lavoratore). Il raggruppamento analitico viene eseguito sulla base di X. In questo caso, sarà discreto (poiché i valori dell'attributo X si ripetono abbastanza spesso). Il numero di gruppi è uguale al numero di valori dell'attributo X nell'aggregato, ad es. 6. I risultati del raggruppamento e del calcolo di r 2 sono riassunti nella tabella:

Fattore di segno X Attributo del risultato Y Numero di unità in un gruppo, N j Il valore medio del segno-risultato nel gruppo, ( - ) 2 N j Dispersione del tratto-risultato nel gruppo, s 2 j s 2 j N j
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 \u003d ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 \u003d 1,56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 \u003d ((11-12,5) 2 + (14-12,5) 2) / 2 \u003d 2,25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 \u003d ((15-16,75) 2 + (17-16,75) 2 ++ (17-16,75) 2 + (18-16,75) 2) / 4 \u003d 1,9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 \u003d ((23-24,75) 2 + (24-24,75) 2 + (27-24,75) 2 + (25-24,75) 2) / 4 \u003d 2,19 8,75
=17,1 429,1 40,7

Il coefficiente di determinazione empirico è uguale al rapporto tra la varianza intergruppo dell'attributo risultato (d y 2) e la varianza totale dell'attributo risultato (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2 +e e 2).

La dispersione intergruppo Y sarà pari a: d y 2 = å( - ) 2 N j / N = 429.1/20=21.45.

La varianza residua Y sarà: e y 2 = ås 2 j ·N j / N= 40.7/20= 2.035.

Quindi: r 2 \u003d 21,45 / (21,45 + 2,035) \u003d 429,1 / (429,1 + 40,7) \u003d 0,913.

Conclusione: il 91,3% della variazione della produzione dei lavoratori è dovuto all'influenza del fattore di discarico.

· Relazione di correlazione empirica - r.

Questo indicatore è la radice del coefficiente empirico di determinazione. Mostra la tenuta del nesso (non solo lineare!) tra caratteristiche raggruppative e produttive. L'intervallo di valori consentiti del rapporto di correlazione empirica va da 0 a +1.

La connessione più vicina possibile è una connessione funzionale, quando ogni valore del risultato Y è determinato in modo univoco dal valore del fattore X (cioè, il risultato del raggruppamento). In questo caso, la varianza delle medie di gruppo (d y 2) è uguale alla varianza totale (s y 2), cioè non ci saranno variazioni infragruppo. In questo caso la dispersione residua (e y 2) è pari a 0 e il coefficiente di determinazione empirico è pari a 1.

Se non c'è connessione tra i segni, allora tutte le medie di gruppo sono uguali tra loro, non ci sarà variazione intergruppo (d y 2 =0) e il coefficiente di determinazione empirico è 0.

Calcoliamo il rapporto di correlazione empirica per il nostro esempio: r= 0,9555. Conclusione: i segni di "produzione di un lavoratore" e "scarico" sono strettamente correlati.

Gli indicatori r e r 2 sono determinati non solo dalla presenza di una connessione tra le caratteristiche X e Y, ma anche dal fatto di raggruppare dati primari. All'aumentare del numero di gruppi m, la varianza intergruppo d 2 cresce e si avvicina alla varianza totale. Se il numero di gruppi è inferiore al numero di unità di popolazione N, allora i valori di r e r 2 non saranno mai uguali a 1, anche con una stretta relazione funzionale.

Si noti che il valore dell'indicatore di vicinanza della connessione non è di per sé una prova della presenza di una relazione causale tra le caratteristiche studiate, ma è una valutazione del grado di coerenza reciproca nei cambiamenti delle caratteristiche. L'instaurazione di un rapporto di causa-effetto deve necessariamente essere preceduta da un'analisi della natura qualitativa dei fenomeni.

Relazione di correlazione empirica

La vicinanza o la forza di una relazione tra due caratteristiche può essere misurata da un indicatore chiamato rapporto di correlazione empirica. Questo indicatore è detto empirico, in quanto può essere calcolato sulla base del consueto raggruppamento per fattore e attributo risultante, cioè sulla base di una tavola di correlazione. Il rapporto di correlazione empirica è ottenuto dalla regola per l'addizione delle varianze, secondo la quale , dove è la varianza totale; - dispersione intergruppi; - dispersione infragruppo (media dei privati). La varianza intergruppo è una misura della fluttuazione dovuta a un attributo fattoriale. La media delle varianze parziali è una misura della fluttuazione dovuta a tutte le altre caratteristiche (tranne il fattoriale). Quindi il rapporto esprime la quota di fluttuazione derivante dal segno del fattore nella fluttuazione totale. La radice quadrata di questo rapporto è chiamata rapporto di correlazione empirica: .

Ciò implica la regola secondo cui maggiore è la varianza intergruppo, più forte è il tratto fattoriale che influenza la variazione del tratto risultante. I rapporti dei componenti delle varianze sono calcolati dai dati della tavola di correlazione utilizzando le seguenti formule:

; ,

dove sono le medie private; - media generale; - totali sulla base di ; - totali sulla base di ; - numero di osservazioni. La stessa relazione viene mantenuta anche per i valori condizionali ricevuti dalla trasformazione numerica.

Il rapporto di varianza stesso (espressione radicale) è chiamato coefficiente di determinazione (è anche uguale al quadrato del rapporto di correlazione empirico). Il rapporto di correlazione empirica varia in un ampio intervallo (da 0 a 1). Se è uguale a zero, il segno del fattore non influisce sul segno di correlazione. Se =1, allora il segno risultante dipende completamente dal fattore uno. Se il rapporto di correlazione empirico è una frazione vicina a uno, allora parlano di una stretta relazione tra le caratteristiche fattoriali ed effettive. Se questa frazione è piccola (prossima allo zero), allora si parla di una debole connessione tra di loro.

Relazione di correlazione empirica

Diversi indicatori vengono utilizzati per misurare la vicinanza dell'associazione. Con una connessione a coppia, la tenuta della connessione è determinata, prima di tutto, dal rapporto di correlazione, che è indicato con η. Il quadrato del rapporto di correlazione è il rapporto tra la varianza intergruppo del tratto risultante, che esprime l'effetto delle differenze nel tratto del fattore di raggruppamento sul valore medio del tratto risultante, e la varianza totale del tratto risultante, che esprime la l'impatto di tutte le cause e condizioni su di esso. Il quadrato del rapporto di correlazione si chiama coefficiente di determinazione.

ny fenomeni e loro segni: ________________ o rigidamente deterministici

dove k è il numero di gruppi

N è il numero di osservazioni

y i - valori iniziali della caratteristica effettiva

y j - valori medi dell'attributo effettivo per questo gruppo

y è il valore medio della caratteristica

f j è la dimensione del gruppo

La formula di cui sopra viene utilizzata per il calcolo dell'indicatore di vicinanza della connessione per un raggruppamento analitico. Quando si calcola il rapporto di correlazione in base al livello di comunicazione, viene utilizzata la seguente formula:

La somma dei quadrati al numeratore è la varianza della caratteristica risultante y spiegata dalla relazione con il fattore x (fattori). Viene calcolato dai dati individuali ottenuti per ciascuna unità della popolazione in base all'equazione di regressione.

Se l'equazione viene scelta in modo errato o viene commesso un errore durante il calcolo dei suoi parametri, la somma dei quadrati nel numeratore potrebbe essere maggiore di quella nel denominatore e il rapporto perderà il significato che dovrebbe avere. Per evitare un risultato errato, è meglio calcolare il rapporto di correlazione utilizzando la seguente formula:

Questa formula si basa sulla ben nota regola per espandere le somme dei quadrati delle deviazioni quando si raggruppa la popolazione:

D Comune= d intergr+D intragr

Secondo questa regola, invece della varianza intergruppo (fattoriale), puoi usare la differenza:

D Comune-D intragr

cosa dà:

Quando calcoliamo η non per raggruppamento, ma per l'equazione di correlazione (equazione di regressione), usiamo la formula. In questo caso, la regola di scomposizione per la somma dei quadrati delle deviazioni dell'elemento risultante è scritta come

D totale \u003d D core + D resto

Il punto più importante che dovrebbe ora essere appreso da chiunque voglia applicare correttamente il metodo dell'analisi di correlazione-regressione è l'interpretazione delle formule (1.2) e (1.3). Questa disposizione recita:

L'equazione di correlazione misura la relazione tra la variazione della caratteristica risultante e la variazione delle caratteristiche del fattore. Le misure di tenuta della connessione misurano la proporzione della variazione della caratteristica risultante, che è associata alla variazione della caratteristica del fattore (caratteristiche).

| prossima lezione ==>

Superiore