La valeur du coefficient de détermination empirique égale à 0 indique. Le coefficient de détermination ce qu'il mesure - la formule

Coefficient de détermination empirique est largement utilisé dans les problèmes statistiques et est un indicateur qui représente la part dans la variance totale de l'attribut résultant et caractérise la force de l'influence de l'attribut de regroupement sur la formation de la variation générale. Il peut être calculé à l'aide de la formule :

Ce coefficient montre la proportion de la variation de la caractéristique effective y sous l'influence du facteur x. En l'absence de lien, le coefficient de détermination empirique est égal à zéro, et dans le cas d'une fonctionnelle lien fort- unité.

représenté par la racine carrée de coefficient empirique déterminations. Il montre l'étroitesse de la relation entre les données statistiques et est déterminé par la formule :

où le numérateur est la dispersion des moyennes de groupe ;
le dénominateur est la variance totale.

relation de corrélation vaut zéro s'il n'y a pas de relation entre les données. Dans ce cas, toutes les moyennes de groupe seront égales entre elles et il n'y aura pas de variation intergroupe.

Le rapport de corrélation est égal à un lorsque la connexion est fonctionnelle. Dans ce cas, la variance des moyennes de groupe sera égale à la variance totale, c'est-à-dire qu'il n'y aura pas de variation intragroupe.

Plus les valeurs du rapport de corrélation sont proches de un, plus la relation entre les caractéristiques est forte, proche de la dépendance fonctionnelle.

Calculé selon la formule :

où fe et ft sont des fréquences empiriques et théoriques.

En utilisant Critère de Pearson les tables déterminent la probabilité P(x^2). Les entrées du tableau sont les valeurs x^2 et le nombre de degrés de liberté k = n - p -1.

Si P > 0,05, alors les distributions empirique et théorique sont considérées comme proches. Lorsque P appartient, la coïncidence entre eux est satisfaisante, et dans les autres cas elle est insuffisante.

Calculé selon la formule :

où le numérateur est le moment central du troisième ordre.

b^3 - le cube de l'écart type.

Le facteur d'asymétrie est valeur sans dimension, ce qui lui permet d'être utilisé pour diverses distributions. Avec asymétrie du côté gauche, Mo > Mt > xav, avec asymétrie du côté droit, relations inverses. Cela vous permet d'appliquer l'indicateur d'asymétrie le plus simple :

Kurtosis dans les statistiques

Il y a une certaine raideur de la distribution empirique par rapport à la normale. Il est déterminé par la formule :

où le numérateur est le moment central du quatrième ordre

Lorsque la distribution atteint un pic par rapport à la normale, l'aplatissement sera positif, si la distribution est plate, il sera négatif. Pour une distribution normale, E = 0.

Qu'entend-on par variance intra-groupe pour une population ? Quelle est la formule de son calcul ? Donne un exemple. Qu'entend-on par variance de population intergroupe? Quelle est la formule de son calcul ? Donne un exemple.

Écart intragroupe () indique une variation aléatoire qui ne dépend pas du trait sous-jacent au groupement.

, où

Moyenne du groupe

La variance intra-groupe moyenne est calculée comme suit : d'abord, les variances pour les groupes individuels sont calculées (), puis la variance intra-groupe moyenne est calculée :

Caractérise la variation systématique, c'est-à-dire différences dans l'ampleur du trait à l'étude, qui est à la base du regroupement. Cette dispersion est calculée par la formule

, où

Valeur moyenne pour un groupe distinct

n je- nombre d'unités dans le groupe

- la moyenne arithmétique générale de l'ensemble de la population étudiée.

Les trois types de variance sont interconnectés : la variance totale est égale à la somme de la variance intragroupe moyenne et de la variance intergroupe :

Ce rapport reflète la loi, qui s'appelle règle d'ajout d'écart.

20.

Qu'entend-on par variance totale de la population ? Quelle est la formule de son calcul ? La façon dont les groupes sont regroupés affecte-t-elle la variance totale ? Donne un exemple.

La variance totale () caractérise la variation du trait de l'ensemble de la population sous l'influence de tous les facteurs qui ont provoqué cette variation. Cette valeur est déterminée par la formule

, où

la moyenne arithmétique générale de l'ensemble de la population étudiée.

D'autre part, la variance totale est égale à la somme de la variance intragroupe moyenne et de la variance intergroupe :

Ce rapport reflète la loi, qui s'appelle règle d'ajout d'écart.. Grâce à la règle d'addition des variances, il est possible de déterminer quelle part de la variance totale est sous l'influence du facteur caractéristique sous-jacent au regroupement.

Plus la proportion de variance intergroupe dans la variance totale est élevée, plus l'influence de l'attribut factoriel (rang) sur la résultante (production) est forte.

Cette proportion est caractérisée par un coefficient empirique de détermination :

Pour une évaluation qualitative de la proximité de la relation entre les signes, les relations de Chaddock sont utilisées.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Force de connexion

absent

très faible

faible

modéré

visible

Fermer

très proche

fonctionnel-

nasale

21.

Que montre le coefficient de détermination ? Quelle est la formule de son calcul ? Dans quelles unités cet indicateur est-il mesuré ? Quelles sont les valeurs possibles pour cet indicateur ? Que signifie l'empirique relation de corrélation? Quelle est la formule de son calcul ? Dans quelles unités cet indicateur est-il mesuré ? Quelles sont les valeurs possibles pour cet indicateur ?

Coefficient de détermination empirique () caractérise la part de la variance intergroupe dans la variance totale :

Il prend des valeurs de -1 à 1 et montre dans quelle mesure la variation du trait dans l'agrégat est due au facteur de regroupement.

dispersion intergroupes ;

écart total.

Déterminé par la formule :

Accepte les valeurs -1 à 1

Exemple

Groupe

Nombre de plantes dans le groupe, pcs.

Production brute moyenne à prix comparables, millions de roubles

Déterminons maintenant la valeur moyenne, la variance totale et la variance intergroupe de la production brute à prix comparables des usines :

millions de roubles ;

Million frotter.2 ;

Million frotter.2.

Le coefficient de détermination sera égal à :

En conséquence, le rapport de corrélation empirique sera égal à :

La valeur calculée du rapport de corrélation empirique indique une relation statistique assez élevée entre la production brute à prix comparables et le coût annuel moyen des immobilisations de production des usines.

22.

Comment une statistique de test est-elle calculée dans une analyse de variance univariée ? Quelle est la loi de sa distribution sous la validité de l'hypothèse principale ? Quels sont les paramètres de cette loi ? Comment une décision est-elle prise dans une analyse de variance unidirectionnelle basée sur la valeur calculée de la statistique de critère ?

La tâche de l'analyse de la variance est d'étudier l'influence d'un ou plusieurs facteurs sur le trait considéré.

L'analyse unidirectionnelle de la variance est utilisée lorsque trois échantillons indépendants ou plus sont disponibles, obtenus à partir de la même population générale en modifiant un facteur indépendant pour lequel, pour une raison quelconque, il n'existe pas de mesures quantitatives.

Comme critère, il faut utiliser le critère de Fisher :

., où

Q 1 est la somme des écarts au carré des moyennes de l'échantillon par rapport à la moyenne totale

Q 2 est la somme des écarts au carré des valeurs observées par rapport à la moyenne de l'échantillon

Si la valeur calculée du critère de Fisher est inférieure à la valeur tabulaire, il n'y a aucune raison de croire que le facteur indépendant affecte la dispersion des valeurs moyennes ( celles. l'hypothèse n'a pas été confirmée). Sinon, le facteur indépendant a un effet significatif sur la dispersion des valeurs moyennes ( l'hypothèse est correcte).

23-25.

1. À intervalles égaux, utilisez la moyenne arithmétique simple :

où y sont les niveaux absolus de la série ;
n- le nombre de niveaux dans la série.
2. Pour les intervalles inégaux, utilisez la moyenne arithmétique pondérée :

où es-tu 1 ,...,уn - niveaux de la série de dynamiques ;
t1,... tn - poids, durée des intervalles de temps.

Niveau moyen des séries de moments la dynamique est calculée par la formule :
1. Avec des niveaux équidistants est calculé par la formule de la série de moments chronologiques moyens :

où es-tu 1 ,...,уn - niveaux de la période pour laquelle le calcul est effectué;
n- nombre de niveaux ;
n-1 - durée de la période de temps.
2.C inégal les niveaux sont calculés à l'aide de la formule de la moyenne pondérée chronologique :

où es-tu 1 ,...,уn - niveaux de séries chronologiques ;
t- intervalle de temps entre niveaux adjacents

dans les statistiques

Croissance absolue moyenne est défini comme la moyenne des gains absolus sur des intervalles de temps égaux d'une période. Elle est calculée par les formules suivantes : 1. Sur la base de données en chaîne sur la croissance absolue sur un certain nombre d'années, la croissance absolue moyenne est calculée comme une moyenne arithmétique simple :

n est le nombre d'incréments absolus en loi de puissance dans la période étudiée.
2. L'augmentation absolue moyenne est calculéepar la croissance absolue de base dans le cas d'intervalles égaux

m - le nombre de niveaux d'une série de dynamiques dans la période d'étude, y compris celle de base.

Taux de croissance moyen est une caractéristique de généralisation libre de l'intensité du changement de niveausérie dynamique et montre combien de fois le niveau de la série de dynamiques change en moyenne par unité de temps.
Comme base et critère de l'exactitude du calcul du taux de croissance (diminution) moyen, un indicateur de généralisation est utilisé, qui est calculé comme le produit des taux de croissance en chaîne égaux au taux de croissance pour toute la période considérée. Si la valeur d'attribut est formée comme un produit options individuelles, la moyenne géométrique est utilisée.
Puisque le taux de croissance moyen est le coefficient de croissance moyen, exprimé en pourcentage, alors pour la série équivalente de dynamique, les calculs utilisant la moyenne géométrique se réduisent à calculer les coefficients de croissance moyens à partir de ceux de la chaîne en utilisant la «méthode de la chaîne»:

n est le nombre de facteurs de croissance de la chaîne ;
kts- les facteurs de croissance de la chaîne ;
Kb - taux de croissance de base pour toute la période.
Détermination du facteur de croissance moyenpeut être simplifiée si les niveaux de la série chronologique sont clairs. Puisque le produit des facteurs de croissance de chaîne est égal à celui de base, le facteur de croissance de base est substitué dans l'expression radicale.
Formule pour déterminer le facteur de croissance moyenpour des séries de dynamiques équidistantes selon la "méthode de base" sera la suivante :

36.

Quels sont les indicateurs absolus d'évolution du niveau de la série que vous connaissez ?

Tous ces indicateurs peuvent être déterminés de manière basique, lorsque le niveau Période donnée par rapport à la première période (de base), ou en chaîne - lorsque deux niveaux de périodes adjacentes sont comparés.

Écrire des formules de calcul.

La variation absolue de base est la différence entre le niveau spécifique et le premier niveau de la série, déterminée par la formule

Il montre combien (en unités d'indicateurs de la série) le niveau d'une (i-ème) période est supérieur ou inférieur au premier niveau (de base) et, par conséquent, peut avoir un signe "+" (avec une augmentation en niveaux) ou "–" (avec une diminution des niveaux).

Le changement absolu de la chaîne est la différence entre les niveaux spécifiques et précédents de la série, est déterminé par la formule

Il montre de combien (en unités d'indicateurs de la série) le niveau d'une (i-ème) période est supérieur ou inférieur au niveau précédent, et peut avoir un signe "+" ou "-".

Expliquez comment la méthode de calcul dépend du choix de la base de comparaison.

Quels indicateurs relatifs d'évolution du niveau de la série connaissez-vous ? Écrire des formules de calcul.

Le changement relatif de base (taux de croissance de base ou indice de dynamique de base) est le rapport d'un niveau spécifique et des premiers niveaux de la série, déterminé par la formule

Le changement relatif de la chaîne (taux de croissance de la chaîne ou indice de dynamique de la chaîne) est le rapport d'un niveau spécifique et précédent de la série, déterminé par la formule

Expliquez comment la méthode de calcul dépend du choix de la base de comparaison.

Le changement relatif montre combien de fois le niveau d'une période donnée est supérieur au niveau de toute période précédente (pour i > 1) ou quelle partie de celui-ci est (pour i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

Quels sont les indicateurs moyens de l'évolution du niveau de la série que vous connaissez ? Écrivez les formules de calcul de la croissance absolue moyenne, du taux de croissance et du taux de croissance des niveaux de la série.

La croissance absolue moyenne est définie comme la moyenne de la croissance absolue pour des périodes de temps égales au cours d'une période. Elle est calculée par les formules suivantes : 1. Sur la base de données en chaîne sur la croissance absolue sur un certain nombre d'années, la croissance absolue moyenne est calculée comme une moyenne arithmétique simple :

n est le nombre d'incréments absolus en loi de puissance dans la période étudiée.

2. L'augmentation absolue moyenne est calculée par l'augmentation absolue de base dans le cas d'intervalles égaux

m - le nombre de niveaux d'une série de dynamiques dans la période d'étude, y compris celle de base.

Le taux de croissance moyen est une caractéristique de généralisation libre de l'intensité des changements dans les niveaux d'une série de dynamiques et montre combien de fois le niveau d'une série de dynamiques change en moyenne par unité de temps.

Comme base et critère de l'exactitude du calcul du taux de croissance (diminution) moyen, un indicateur de généralisation est utilisé, qui est calculé comme le produit des taux de croissance en chaîne égaux au taux de croissance pour toute la période considérée. Si la valeur caractéristique est formée comme un produit d'options individuelles, la moyenne géométrique est utilisée.

Puisque le taux de croissance moyen est le coefficient de croissance moyen, exprimé en pourcentage, alors pour la série équivalente de dynamique, les calculs utilisant la moyenne géométrique se réduisent à calculer les coefficients de croissance moyens à partir de ceux de la chaîne en utilisant la «méthode de la chaîne»:

n est le nombre de facteurs de croissance de la chaîne ;

Кц - coefficients de croissance en chaîne;

Kb - taux de croissance de base pour toute la période.

Le taux de changement (taux de croissance) des niveaux est un indicateur relatif indiquant de combien de pourcentage un niveau donné est supérieur (ou inférieur) à un autre, pris comme base de comparaison. Il est calculé en soustrayant 100 % de la variation relative, c'est-à-dire par la formule :

soit en pourcentage du changement absolu par rapport au niveau par rapport auquel le changement absolu est calculé (ligne de base), c'est-à-dire selon la formule :

.

Quels sont les inconvénients de ces indicateurs ? Dans quels cas convient-il de les utiliser ? Comment remédier à ces lacunes ? Rédiger des formules de calcul de moyennes assurant la préservation de la valeur totale de la série.

38.

Comment déterminer le type de tendance principale par les valeurs des indicateurs d'évolution des niveaux de la série ? Donne des exemples.

L'identification de la tendance générale de la série chronologique peut être effectuée en lissant la série chronologique à l'aide de la méthode de la moyenne mobile. L'essence de cette technique est que les niveaux calculés (théoriques) sont déterminés à partir des niveaux initiaux de la série (données empiriques).

La principale condition d'application de cette méthode est de calculer les liens moyens mobiles (mobiles) à partir d'un nombre de niveaux de la série qui correspond à la durée de la dynamique du cycle observée dans la série.

RÉPONSE

Une évaluation quantitative de la proximité de communication selon des données empiriques consiste à calculer des indicateurs de proximité de communication :

· Coefficient de détermination empirique (taux de dispersion empirique) - r 2 .

Cet indicateur est calculé selon les données du groupement analytique (tableau), comme le rapport de la variance intergroupe du trait de résultat Y (d y 2) à la variance totale Y (s y 2) :

Selon le théorème de décomposition de la variance, la variance intergroupe est liée à la variance totale : s y 2 =d y 2 +e y 2 . Ensuite, le coefficient de détermination empirique peut être calculé à travers la variance résiduelle à l'aide de la formule :

où s j 2 est la variance du résultat Y au sein du j-ième groupe.

Le coefficient de détermination empirique caractérise la force de l'influence de l'attribut de regroupement (X) sur la formation de la variation globale de l'attribut résultant Y et montre le pourcentage (part) de la variation de l'attribut de résultat due au facteur d'attribut sous-jacent le regroupement.

Il est commode de calculer r 2 dans le tableau :

Signe-facteur X j New Jersey Valeur moyenne du résultat de la caractéristique s j 2 N j
x1 N 1 s 1 2 N 1
x2 N 2 s 2 2 N 2
.... ...
Xm N·m s m 2 N m
Le total N X es j 2

Puis .

Prenons un exemple. Soit un ensemble de 20 travailleurs, caractérisé par les caractéristiques suivantes : Y - le rendement d'un travailleur (pièce/équipe) et X - qualification (rang). Les premières données sont présentées dans le tableau :

X
Oui

Il est nécessaire d'évaluer l'étroitesse de la relation entre les caractéristiques à l'aide du coefficient de détermination empirique (r 2).

Pour calculer r 2, nous allons effectuer un regroupement analytique de la population. Comme signe-facteur, nous prenons X (la catégorie d'un travailleur), comme signe-résultat - Y, la sortie d'un travailleur). Le regroupement analytique est effectué sur la base de X. Dans ce cas, il sera discret (car les valeurs de l'attribut X sont assez souvent répétées). Le nombre de groupes est égal au nombre de valeurs de l'attribut X dans l'agrégat, c'est-à-dire 6. Les résultats du regroupement et du calcul de r 2 sont résumés dans le tableau :

Signe-facteur X Attribut de résultat Y Nombre d'unités dans un groupe, N j La valeur moyenne du signe-résultat dans le groupe, ( - ) 2 N j Dispersion du trait-résultat dans le groupe, s 2 j s 2 j N j
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 s 2 1 \u003d ((10-11,7) 2 + (12-11,7) 2 + (13-11,7) 2) / 3 \u003d 1,56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 s 2 2 \u003d ((11-12,5) 2 + (14-12,5) 2) / 2 \u003d 2,25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 s 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2,5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 s 2 4 \u003d ((15-16,75) 2 + (17-16,75) 2 ++ (17-16,75) 2 + (18-16,75) 2) / 4 \u003d 1,9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 s 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2,7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 s 2 6 \u003d ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 \u003d 2.19 8,75
=17,1 429,1 40,7

Le coefficient de détermination empirique est égal au rapport de la variance intergroupe de l'attribut de résultat (d y 2) à la variance totale de l'attribut de résultat (s y 2) : r 2 = d y 2 /s y 2 = d y 2 /(d y 2 + e y 2).

La dispersion intergroupe Y sera égale à : d y 2 = å( - ) 2 N j / N = 429,1/20=21,45.

La variance résiduelle Y sera : e y 2 = ås 2 j ·N j / N= 40,7/20= 2,035.

Alors: r 2 \u003d 21,45 / (21,45 + 2,035) \u003d 429,1 / (429,1 + 40,7) \u003d 0,913.

Conclusion : 91,3 % de la variation du rendement des travailleurs est due à l'influence du facteur de décharge.

· Relation de corrélation empirique - r.

Cet indicateur est la racine du coefficient de détermination empirique. Il montre l'étroitesse de la connexion (pas seulement linéaire !) entre les fonctionnalités de regroupement et de production. La plage de valeurs admissibles du rapport de corrélation empirique est de 0 à +1.

La connexion la plus proche possible est une connexion fonctionnelle, lorsque chaque valeur du résultat Y est déterminée de manière unique par la valeur du facteur X (c'est-à-dire le résultat du regroupement). Dans ce cas, la variance des moyennes de groupe (d y 2) est égale à la variance totale (s y 2), c'est-à-dire il n'y aura pas de variation intragroupe. Dans ce cas, la dispersion résiduelle (e y 2) est égale à 0, et le coefficient de détermination empirique est égal à 1.

S'il n'y a pas de lien entre les signes, alors toutes les moyennes de groupe sont égales les unes aux autres, il n'y aura pas de variation intergroupe (d y 2 =0) et le coefficient de détermination empirique est 0.

Calculons le rapport de corrélation empirique pour notre exemple : r= 0,9555. Conclusion : les signes de "production d'un travailleur" et de "décharge" sont assez étroitement liés.

Les indicateurs r et r 2 sont déterminés non seulement par la présence d'un lien entre les traits X et Y, mais aussi par le fait de regrouper des données primaires. Lorsque le nombre de groupes m augmente, la variance intergroupe d 2 croît et se rapproche de la variance totale. Si le nombre de groupes est inférieur au nombre d'unités de population N, alors les valeurs de r et r 2 ne seront jamais égales à 1, même avec une relation fonctionnelle stricte.

Notez que la valeur de l'indicateur de proximité de connexion n'est pas en soi une preuve de la présence d'une relation causale entre les caractéristiques étudiées, mais est une évaluation du degré de cohérence mutuelle dans les changements de caractéristiques. L'établissement d'une relation de cause à effet doit nécessairement être précédé d'une analyse de la nature qualitative des phénomènes.

Relation de corrélation empirique

La proximité ou la force d'une relation entre deux caractéristiques peut être mesurée par un indicateur appelé le rapport de corrélation empirique. Cet indicateur est dit empirique, car il peut être calculé sur la base du regroupement habituel par facteur et attribut résultant, c'est-à-dire sur la base d'un tableau de correspondance. Le rapport de corrélation empirique est obtenu à partir de la règle d'addition des variances, selon laquelle , où est la variance totale ; - dispersion intergroupes ; - dispersion intragroupe (moyenne du privé). La variance intergroupe est une mesure de fluctuation due à un attribut de facteur. La moyenne des variances partielles est une mesure de la fluctuation due à toutes les autres caractéristiques (sauf factorielles). Ensuite, le rapport exprime la part de fluctuation due au facteur signe dans la fluctuation totale. La racine carrée de ce rapport est appelée rapport de corrélation empirique : .

Cela implique la règle selon laquelle plus la variance intergroupe est grande, plus le trait factoriel affecte fortement la variation du trait résultant. Les ratios des composantes des variances sont calculés à partir des données du tableau de correspondance à l'aide des formules suivantes :

; ,

où sont les moyennes privées ; - moyenne générale; - totaux sur la base de ; - totaux sur la base de ; - nombre d'observations. La même relation est conservée également pour les valeurs conditionnelles reçues par transformation numérique.

Le rapport de variance lui-même (expression radicale) est appelé coefficient de détermination (il est également égal au carré du rapport de corrélation empirique). Le rapport de corrélation empirique varie dans une large gamme (de 0 à 1). S'il est égal à zéro, le signe du facteur n'affecte pas le signe de corrélation. Si =1, alors le signe résultant dépend entièrement du facteur un. Si le rapport de corrélation empirique est une fraction proche de un, alors ils parlent d'une relation étroite entre les caractéristiques factorielles et effectives. Si cette fraction est petite (proche de zéro), alors on parle d'un lien faible entre eux.

Relation de corrélation empirique

Plusieurs indicateurs sont utilisés pour mesurer la proximité de l'association. Avec une connexion par paire, l'étanchéité de la connexion est déterminée, tout d'abord, par le rapport de corrélation, qui est noté η. Le carré du rapport de corrélation est le rapport de la variance intergroupe du trait résultant, qui exprime l'effet des différences dans le trait du facteur de regroupement sur la valeur moyenne du trait résultant, à la variance totale du trait résultant, qui exprime la l'impact de toutes les causes et conditions sur elle. Le carré du rapport de corrélation est appelé coefficient de détermination.

tous les phénomènes et leurs signes : ________________ ou rigidement déterministes

où k est le nombre de groupes

N est le nombre d'observations

y i - valeurs initiales de la caractéristique effective

y j - valeurs moyennes de l'attribut effectif pour ce groupe

y est la valeur moyenne de la caractéristique

f j est la taille du groupe

La formule ci-dessus est utilisée lors du calcul de l'indicateur de proximité de connexion pour un groupement analytique. Lors du calcul du rapport de corrélation par le niveau de communication, la formule suivante est utilisée :

La somme des carrés du numérateur est la variance de la caractéristique résultante y expliquée par la relation avec le facteur x (facteurs). Il est calculé à partir des données individuelles obtenues pour chaque unité de la population selon l'équation de régression.

Si l'équation est mal choisie ou si une erreur est commise lors du calcul de ses paramètres, la somme des carrés du numérateur peut être supérieure à celle du dénominateur et le rapport perdra le sens qu'il devrait avoir. Pour éviter un résultat erroné, il est préférable de calculer le rapport de corrélation à l'aide de la formule suivante :

Cette formule est basée sur la règle bien connue d'expansion des sommes des écarts au carré lors du regroupement de la population :

commun=D intégré+D intragr

Selon cette règle, au lieu de la variance intergroupe (factorielle), vous pouvez utiliser la différence :

commun-RÉ intragr

ce qui donne:

Lors du calcul de η non pas par regroupement, mais par l'équation de corrélation (équation de régression), nous utilisons la formule. Dans ce cas, la règle de décomposition de la somme des écarts au carré de la caractéristique résultante s'écrit

D total \u003d D noyau + D reste

Le point le plus important qui devrait maintenant être appris par quiconque souhaite appliquer correctement la méthode d'analyse de corrélation-régression est l'interprétation des formules (1.2) et (1.3). Cette disposition se lit comme suit :

L'équation de corrélation mesure la relation entre la variation de la caractéristique résultante et la variation de la ou des caractéristiques factorielles. Les mesures d'étanchéité de la connexion mesurent la proportion de la variation de la caractéristique résultante, qui est associée à la variation de la caractéristique (des caractéristiques) du facteur.

| prochain cours ==>

Haut