تشير قيمة معامل التحديد التجريبي التي تساوي 0. معامل تحديد ما يقيسه - الصيغة

معامل التحديد التجريبييستخدم على نطاق واسع في الإحصاء وهو مؤشر يمثل الحصة في التباين الكلي للسمة الناتجة ويميز قوة تأثير سمة التجميع على تشكيل التباين العام. يمكن حسابها باستخدام الصيغة:

يوضح هذا المعامل نسبة تباين السمة الفعالة y تحت تأثير العامل x. في حالة عدم وجود اتصال ، فإن المعامل التجريبي للتحديد يساوي الصفر ، وفي حالة وظيفية علاقة قوية- وحدة.

ممثلة بالجذر التربيعي لـ معامل تجريبيالتحديدات. يظهر قرب العلاقة بين البيانات الإحصائية ويتم تحديده بواسطة الصيغة:

حيث البسط هو تشتت وسائل المجموعة ؛
المقام هو التباين الكلي.

علاقة الارتباطتساوي صفرًا إذا لم تكن هناك علاقة بين البيانات. في هذه الحالة ، ستكون جميع وسائل المجموعة متساوية مع بعضها البعض ولن يكون هناك اختلاف بين المجموعات.

نسبة الارتباط تساوي واحدًا عندما يكون الاتصال وظيفيًا. في هذه الحالة ، سيكون التباين في وسائل المجموعة مساويًا للتباين الكلي ، أي لن يكون هناك اختلاف داخل المجموعة.

كلما كانت قيم نسبة الارتباط أقرب إلى واحد ، كانت العلاقة بين السمات أقوى وأقرب إلى الاعتماد الوظيفي.

محسوبة بالصيغة:

حيث Fe و ft هما ترددان تجريبيان ونظريان.

باستخدام معيار بيرسونتحدد الجداول الاحتمال P (x ^ 2). مدخلات الجدول هي قيم x ^ 2 وعدد درجات الحرية k = n - p -1.

إذا كانت P> 0.05 ، فإن التوزيعات التجريبية والنظرية متقاربة. عندما تنتمي P ، فإن المصادفة بينهما مرضية ، وفي حالات أخرى تكون غير كافية.

محسوبة بالصيغة:

حيث البسط هو اللحظة المركزية من الرتبة الثالثة.

ب ^ 3 - مكعب الانحراف المعياري.

عامل الانحراف هوقيمة بلا أبعاد ، مما يسمح باستخدامها في توزيعات مختلفة. مع عدم تناسق الجانب الأيسر ، Mo> Mt> xav ، مع عدم تناسق الجانب الأيمن ، علاقات عكسية. هذا يسمح لك بتطبيق أبسط مؤشر لعدم التماثل:

التفرطح في الإحصاء

هناك درجة من الانحدار في التوزيع التجريبي بالنسبة للتوزيع العادي. يتم تحديده من خلال الصيغة:

حيث البسط هو اللحظة المركزية من الرتبة الرابعة

عندما يصل التوزيع إلى ذروته بالنسبة إلى الوضع الطبيعي ، سيكون التفرطح موجبًا ، وإذا كان التوزيع مسطحًا ، فسيكون سالبًا. من أجل التوزيع الطبيعي ، E = 0.

ما المقصود بالتباين داخل المجموعة للسكان؟ ما هي معادلة حسابها؟ اعط مثالا. ما هو المقصود بالتباين السكاني بين المجموعات؟ ما هي معادلة حسابها؟ اعط مثالا.

التباين داخل المجموعة () يشير إلى تباين عشوائي لا يعتمد على السمة الكامنة وراء التجميع.

، أين

متوسط ​​المجموعة

يتم حساب متوسط ​​التباين داخل المجموعة على النحو التالي: أولاً ، يتم حساب الفروق للمجموعات الفردية () ، ثم يتم حساب متوسط ​​التباين داخل المجموعة:

يميز الاختلاف المنهجي ، أي الاختلافات في حجم السمة قيد الدراسة ، والتي هي أساس التجميع. يتم حساب هذا التشتت بواسطة الصيغة

، أين

متوسط ​​القيمة لمجموعة منفصلة

ن أنا- عدد الوحدات في المجموعة

- المتوسط ​​الحسابي العام لمجتمع الدراسة بأكمله.

جميع أنواع التباين الثلاثة مترابطة: إجمالي التباين يساوي مجموع متوسط ​​التباين داخل المجموعة والتباين بين المجموعات:

هذه النسبة تعكس القانون الذي يسمى قاعدة إضافة التباين.

20.

ما هو المقصود بالتباين الكلي للسكان؟ ما هي معادلة حسابها؟ هل طريقة تجميع المجموعات تؤثر على التباين الكلي؟ اعط مثالا.

يميز التباين الكلي () تباين سمة السكان بالكامل تحت تأثير كل تلك العوامل التي تسببت في هذا الاختلاف. يتم تحديد هذه القيمة بواسطة الصيغة

، أين

المتوسط ​​الحسابي العام لمجتمع الدراسة بأكمله.

من ناحية أخرى ، فإن التباين الإجمالي يساوي مجموع متوسط ​​التباين داخل المجموعة والتباين بين المجموعات:

هذه النسبة تعكس القانون الذي يسمى قاعدة إضافة التباين.. بفضل قاعدة إضافة الفروق ، من الممكن تحديد أي جزء من التباين الكلي يقع تحت تأثير العامل المميز الذي يقوم عليه التجميع.

كلما زادت نسبة التباين بين المجموعات في التباين الكلي ، زاد تأثير علامة العامل (المرتبة) على (الإنتاج) الفعال.

تتميز هذه النسبة بمعامل تحديد تجريبي:

لإجراء تقييم نوعي لتقارب العلاقة بين العلامات ، يتم استخدام علاقات تشادوك.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

قوة الاتصال

مفقود

ضعيف جدا

ضعيف

معتدل

واضح

أغلق

قريب جدا

وظيفي-

الأنف

21.

ماذا يظهر معامل التحديد؟ ما هي معادلة حسابها؟ في أي وحدات يقاس هذا المؤشر؟ ما هي القيم الممكنة لهذا المؤشر؟ ماذا التجريبية علاقة الارتباط؟ ما هي معادلة حسابها؟ في أي وحدات يقاس هذا المؤشر؟ ما هي القيم الممكنة لهذا المؤشر؟

معامل التحديد التجريبي () يميز حصة التباين بين المجموعات في التباين الكلي:

يأخذ قيمًا من -1 إلى 1 ويوضح مدى اختلاف السمة في الإجمالي بسبب عامل التجميع.

تشتت بين المجموعات

التباين الكلي.

تحددها الصيغة:

يقبل القيم من -1 إلى 1

مثال

مجموعة

عدد المصانع في المجموعة ، أجهزة الكمبيوتر.

متوسط ​​الناتج الإجمالي بأسعار قابلة للمقارنة مليون روبل

دعونا الآن نحدد متوسط ​​القيمة ، والتباين الإجمالي ، والتباين بين المجموعات لإجمالي الناتج في الأسعار المقارنة للمصانع:

مليون روبل

مليون فرك 2 ؛

مليون فرك 2.

سيكون معامل التحديد مساويًا لـ:

نتيجة لذلك ، ستكون نسبة الارتباط التجريبية مساوية لـ:

تشير القيمة المحسوبة لنسبة الارتباط التجريبية إلى علاقة إحصائية عالية إلى حد ما بين إجمالي الناتج بالأسعار القابلة للمقارنة ومتوسط ​​التكلفة السنوية لأصول الإنتاج الثابتة للمصانع.

22.

كيف يتم حساب إحصاء الاختبار في تحليل التباين أحادي المتغير؟ ما هو قانون توزيعها في ظل صحة الفرضية الرئيسية؟ ما هي معايير هذا القانون؟ كيف يتم اتخاذ القرار في تحليل أحادي الاتجاه للتباين بناءً على القيمة المحسوبة لإحصاء المعيار؟

تتمثل مهمة تحليل التباين في دراسة تأثير عامل واحد أو أكثر على السمة قيد الدراسة.

يتم استخدام تحليل التباين أحادي الاتجاه عند توفر ثلاث عينات مستقلة أو أكثر ، يتم الحصول عليها من نفس المجتمع العام عن طريق تغيير بعض العوامل المستقلة التي ، لسبب ما ، لا توجد قياسات كمية.

كمعيار ، من الضروري استخدام معيار فيشر:

.، أين

س 1 هو مجموع الانحرافات التربيعية لمتوسط ​​العينة عن المتوسط ​​الكلي

س 2 هو مجموع الانحرافات التربيعية للقيم المرصودة من متوسط ​​العينة

إذا كانت القيمة المحسوبة لمعيار فيشر أقل من القيمة الجدولية ، فلا يوجد سبب للاعتقاد بأن العامل المستقل يؤثر على انتشار القيم المتوسطة ( أولئك. لم يتم تأكيد الفرضية). خلاف ذلك ، فإن العامل المستقل له تأثير كبير على انتشار متوسط ​​القيم ( الفرضية صحيحة).

23-25.

1. على فترات متساوية ، استخدم الوسط الحسابي البسيط:

حيث y هي المستويات المطلقة للسلسلة ؛
ن- عدد المستويات في السلسلة.
2. بالنسبة للفترات غير المتساوية ، استخدم المتوسط ​​الحسابي المرجح:

اين انت 1 ، ... ، في - مستويات سلسلة الديناميات ؛
t1 ، ... tn - الأوزان ، ومدة الفترات الزمنية.

متوسط ​​مستوى سلسلة اللحظة يتم حساب الديناميات بالصيغة:
1. مع مستويات متساوية البعد يتم حسابها بواسطة صيغة متوسط ​​سلسلة العزم الكرونولوجية:

اين انت 1 ، ... ، уn - مستويات الفترة التي يتم فيها الحساب ؛
ن- عدد المستويات ؛
ن -1 - مدة الفترة الزمنية.
2. ج غير متكافئيتم حساب المستويات باستخدام معادلة المتوسط ​​المرجح الزمني:

اين انت 1 ، ... ، في - مستويات السلاسل الزمنية ؛
ر- الفاصل الزمني بين المستويات المتجاورة

في الإحصاء

متوسط ​​النمو المطلق يتم تعريفه على أنه متوسط ​​المكاسب المطلقة على فترات زمنية متساوية من فترة واحدة. يتم حسابه بواسطة الصيغ: 1. استنادًا إلى بيانات السلسلة الخاصة بالنمو المطلق على مدى عدد من السنوات ، يتم حساب متوسط ​​النمو المطلق كمتوسط ​​حسابي بسيط:

أين n هو عدد الزيادات المطلقة في قانون السلطة في الفترة قيد الدراسة.
2. يتم حساب متوسط ​​الزيادة المطلقةمن خلال النمو الأساسي المطلق في حالة الفواصل الزمنية المتساوية

أين م - عدد مستويات سلسلة الديناميكيات في فترة الدراسة بما في ذلك المستوى الأول.

متوسط ​​معدل النمو هي خاصية التعميم الحر لشدة تغيير المستوىسلسلة ديناميات ويوضح عدد المرات التي يتغير فيها مستوى سلسلة الديناميكيات في المتوسط ​​لكل وحدة زمنية.
كأساس ومعيار لصحة حساب متوسط ​​معدل النمو (النقصان) ، يتم استخدام مؤشر التعميم ، والذي يتم حسابه كمنتج لمعدلات نمو السلسلة التي تساوي معدل النمو طوال الفترة قيد الدراسة. إذا تم تشكيل قيمة السمة كمنتج خيارات فردية، ثم يتم استخدام الوسط الهندسي.
نظرًا لأن متوسط ​​معدل النمو هو متوسط ​​معامل النمو ، معبرًا عنه كنسبة مئوية ، فبالنسبة لسلسلة الديناميكيات المكافئة ، يتم تقليل العمليات الحسابية باستخدام المتوسط ​​الهندسي لحساب متوسط ​​معاملات النمو من تلك السلسلة باستخدام "طريقة السلسلة":

أين n هو عدد عوامل نمو السلسلة ؛
عقدة- عوامل نمو السلسلة ؛
Kb - معدل النمو الأساسي لكامل الفترة.
تحديد متوسط ​​عامل النمويمكن تبسيطها إذا كانت مستويات السلاسل الزمنية واضحة. نظرًا لأن ناتج عوامل نمو السلسلة يساوي العامل الأساسي ، يتم استبدال عامل النمو الأساسي في التعبير الجذري.
صيغة لتحديد متوسط ​​عامل النموبالنسبة لسلسلة الديناميات متساوية الأبعاد وفقًا "للطريقة الأساسية" ستكون على النحو التالي:

36.

ما هي المؤشرات المطلقة للتغيرات في مستوى المسلسل الذي تعرفه؟

يمكن تحديد كل هذه المؤشرات بالطريقة الأساسية عند المستوى فترة معينةمقارنة بالفترة (الأساسية) الأولى ، أو بطريقة متسلسلة - عند مقارنة مستويين من الفترات المتجاورة.

اكتب معادلات حسابية.

التغيير الأساسي المطلق هو الفرق بين المستوى المحدد والمستوى الأول من السلسلة ، والذي تحدده الصيغة

يوضح مقدار (بوحدات مؤشرات السلسلة) أن مستوى فترة واحدة (i-th) أكثر أو أقل من المستوى الأول (الأساسي) ، وبالتالي ، يمكن أن يكون له علامة "+" (مع زيادة في المستويات) أو "-" (مع انخفاض في المستويات).

التغيير المطلق للسلسلة هو الفرق بين المستويات المحددة والسابقة للسلسلة ، ويتم تحديده بواسطة الصيغة

وهي توضح مقدار (بوحدات مؤشرات السلسلة) مستوى فترة واحدة (i-th) أكثر أو أقل من المستوى السابق ، ويمكن أن يكون لها علامة "+" أو "-".

اشرح كيف تعتمد طريقة الحساب على اختيار قاعدة المقارنة.

ما هي المؤشرات النسبية للتغيير في مستوى السلسلة التي تعرفها؟ اكتب معادلات حسابية.

التغيير النسبي الأساسي (معدل النمو الأساسي أو مؤشر الديناميكيات الأساسية) هو نسبة مستوى معين والمستويات الأولى من السلسلة ، التي تحددها الصيغة

التغيير النسبي للسلسلة (معدل نمو السلسلة أو مؤشر سلسلة الديناميكيات) هو نسبة المستويات المحددة والسابقة للسلسلة ، التي تحددها الصيغة

اشرح كيف تعتمد طريقة الحساب على اختيار قاعدة المقارنة.

يُظهر التغيير النسبي عدد المرات التي يكون فيها مستوى فترة معينة أكبر من مستوى أي فترة سابقة (بالنسبة إلى i> 1) أو أي جزء منها (بالنسبة إلى i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

ما هي متوسط ​​مؤشرات التغيير في مستوى المسلسل الذي تعرفه؟ اكتب الصيغ لحساب متوسط ​​النمو المطلق ومعدل النمو ومعدل النمو لمستويات السلسلة.

يُعرَّف متوسط ​​النمو المطلق بأنه متوسط ​​النمو المطلق لفترات زمنية متساوية في فترة واحدة. يتم حسابه بواسطة الصيغ: 1. استنادًا إلى بيانات السلسلة الخاصة بالنمو المطلق على مدى عدد من السنوات ، يتم حساب متوسط ​​النمو المطلق كمتوسط ​​حسابي بسيط:

أين n هو عدد الزيادات المطلقة في قانون السلطة في الفترة قيد الدراسة.

2. يتم حساب متوسط ​​الزيادة المطلقة من خلال الزيادة الأساسية المطلقة في حالة الفترات المتساوية

أين م - عدد مستويات سلسلة الديناميكيات في فترة الدراسة بما في ذلك المستوى الأول.

متوسط ​​معدل النمو هو خاصية تعميم مجانية لشدة التغيرات في مستويات سلسلة من الديناميكيات ويوضح عدد المرات التي يتغير فيها مستوى سلسلة من الديناميكيات في المتوسط ​​لكل وحدة زمنية.

كأساس ومعيار لصحة حساب متوسط ​​معدل النمو (النقصان) ، يتم استخدام مؤشر التعميم ، والذي يتم حسابه كمنتج لمعدلات نمو السلسلة التي تساوي معدل النمو طوال الفترة قيد الدراسة. إذا تم تشكيل القيمة المميزة كمنتج لخيارات فردية ، فسيتم استخدام المتوسط ​​الهندسي.

نظرًا لأن متوسط ​​معدل النمو هو متوسط ​​معامل النمو ، معبرًا عنه كنسبة مئوية ، فبالنسبة لسلسلة الديناميكيات المكافئة ، يتم تقليل العمليات الحسابية باستخدام المتوسط ​​الهندسي لحساب متوسط ​​معاملات النمو من تلك السلسلة باستخدام "طريقة السلسلة":

أين n هو عدد عوامل نمو السلسلة ؛

Кц - معاملات النمو المتسلسلة ؛

Kb - معدل النمو الأساسي لكامل الفترة.

يعد معدل التغيير (معدل النمو) في المستويات مؤشرًا نسبيًا يوضح عدد النسبة المئوية لمستوى معين أكثر (أو أقل) من مستوى آخر ، باعتباره أساسًا للمقارنة. يتم حسابه بطرح 100٪ من التغيير النسبي ، أي بالصيغة:

أو كنسبة مئوية من التغيير المطلق إلى المستوى الذي يتم على أساسه حساب التغيير المطلق (الأساس) ، أي وفقًا للصيغة:

.

ما هي عيوب هذه المؤشرات؟ في أي الحالات يكون من المناسب استخدامها؟ كيف يمكن معالجة هذه النواقص؟ اكتب معادلات لحساب المتوسطات التي تضمن الحفاظ على القيمة الإجمالية للسلسلة.

38.

كيف يتم تحديد نوع الاتجاه الرئيسي من خلال قيم مؤشرات التغيرات في مستويات السلسلة؟ أعط أمثلة.

يمكن تحديد الاتجاه العام للسلسلة الزمنية من خلال تمهيد السلاسل الزمنية باستخدام طريقة المتوسط ​​المتحرك. جوهر هذه التقنية هو أن المستويات المحسوبة (النظرية) يتم تحديدها من المستويات الأولية للسلسلة (البيانات التجريبية).

الشرط الرئيسي لتطبيق هذه الطريقة هو حساب روابط المتوسط ​​المتحرك (المتحرك) من هذا العدد من مستويات السلسلة التي تتوافق مع مدة ديناميات الدورة التي لوحظت في السلسلة.

إجابه

يتكون التقييم الكمي لتقارب الاتصال وفقًا للبيانات التجريبية من حساب مؤشرات تقارب الاتصال:

· معامل التحديد التجريبي (نسبة التشتت التجريبي) - ص 2 .

يتم حساب هذا المؤشر وفقًا لبيانات التجميع التحليلي (الجدول) ، مثل نسبة التباين بين المجموعات لخاصية النتيجة Y (d y 2) إلى إجمالي التباين Y (s y 2):

وفقًا لنظرية تحلل التباين ، يرتبط التباين بين المجموعات بالتباين الكلي: s y 2 = d y 2 + e y 2. ثم يمكن حساب معامل التحديد التجريبي من خلال التباين المتبقي باستخدام الصيغة:

حيث s j 2 هو تباين النتيجة Y داخل المجموعة j.

يميز معامل التحديد التجريبي قوة تأثير سمة التجميع (X) على تكوين الاختلاف العام للسمة الناتجة Y ويوضح النسبة المئوية (الحصة) للتغير في سمة النتيجة بسبب عامل السمة الأساسي التجمع.

من الملائم حساب r 2 في الجدول:

عامل الإشارة X j نيوجيرسي يعني قيمة نتيجة الميزة s j 2 N j
x1 العدد 1 ق 1 2 شمال 1
x2 العدد 2 ق 2 2 شمال 2
.... ...
Xm N م ق م 2 ن م
المجموع ن X es j 2

ثم .

تأمل في مثال. لنترك مجموعة من 20 عاملاً ، تتميز بالخصائص التالية: ص - ناتج عامل (قطعة / وردية) و س - مؤهل (رتبة). يتم عرض البيانات الأولية في الجدول:

X
ص

مطلوب لتقييم تقارب العلاقة بين الميزات باستخدام معامل التحديد التجريبي (r 2).

لحساب r 2 ، سنجري تجميعًا تحليليًا للسكان. كعامل إشارة ، نأخذ X (فئة العامل) ، كنتيجة إشارة - Y ، ناتج العامل). يتم إجراء التجميع التحليلي على أساس X. في هذه الحالة ، سيكون منفصلاً (لأن قيم السمة X غالبًا ما تتكرر). عدد المجموعات يساوي عدد قيم السمة X في الإجمالي ، أي 6. تم تلخيص نتائج تجميع وحساب r 2 في الجدول:

عامل الإشارة X السمة الناتجة ص عدد الوحدات في مجموعة ، N j متوسط ​​قيمة علامة النتيجة في المجموعة ، (-) 2 N j تشتت نتيجة السمة في المجموعة ق 2 ي ق 2 ي ن ي
(10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 ق 2 1 \ u003d ((10-11.7) 2 + (12-11.7) 2 + (13-11.7) 2) / 3 \ u003d 1.56 4,7
(11+14)/2=12,5 (12,5-17,1) 2 2=42,3 ق 2 2 \ u003d ((11-12.5) 2 + (14-12.5) 2) / 2 \ u003d 2.25 4,5
(12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 ث 2 3 \ u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 = 2.5
(15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 ق 2 4 \ u003d ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \ u003d 1.9 4,75
(18+20+22)/3=20 (20-17,1) 2 3=25,23 ث 2 5 = ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 = 2.7
(23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 ق 2 6 = ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 = 2.19 8,75
=17,1 429,1 40,7

المعامل التجريبي للتحديد يساوي نسبة التباين بين المجموعات لسمة النتيجة (d y 2) إلى التباين الكلي لسمة النتيجة (s y 2): r 2 = d y 2 / s y 2 = d y 2 / (d y 2 + ه ص 2).

سيكون التشتت بين المجموعات Y مساويًا لـ: d y 2 = å (-) 2 N j / N = 429.1 / 20 = 21.45.

سيكون التباين المتبقي Y هو: e y 2 = ås 2 j · N j / N = 40.7 / 20 = 2.035.

ثم: r 2 \ u003d 21.45 / (21.45 + 2.035) \ u003d 429.1 / (429.1 + 40.7) \ u003d 0.913.

الخلاصة: 91.3٪ من التباين في ناتج العمال يرجع إلى تأثير عامل التفريغ.

· علاقة الارتباط التجريبية - ص.

هذا المؤشر هو أصل معامل التحديد التجريبي. إنه يظهر ضيق الاتصال (ليس فقط الخطي!) بين التجميع والميزات الإنتاجية. يتراوح نطاق القيم المسموح بها لنسبة الارتباط التجريبية من 0 إلى +1.

أقرب اتصال ممكن هو اتصال وظيفي ، عندما يتم تحديد كل قيمة لنتيجة السمة Y بشكل فريد من خلال قيمة عامل السمة X (أي نتيجة التجميع). في هذه الحالة ، فإن تباين المجموعة يعني (d y 2) يساوي التباين الكلي (s y 2) ، أي لن يكون هناك اختلاف داخل المجموعة. في هذه الحالة ، فإن التشتت المتبقي (e y 2) يساوي 0 ، ومعامل التحديد التجريبي يساوي 1.

إذا لم يكن هناك اتصال بين العلامات ، فإن جميع وسائل المجموعة متساوية مع بعضها البعض ، ولن يكون هناك اختلاف بين المجموعات (d y 2 = 0) ، ومعامل التحديد التجريبي هو 0.

دعنا نحسب نسبة الارتباط التجريبية لمثالنا: r = 0.9555. الخلاصة: إن علامات "إنتاج العامل" و "التفريغ" وثيقة الصلة ببعضها البعض.

يتم تحديد المؤشرين r و r 2 ليس فقط من خلال وجود اتصال بين السمات X و Y ، ولكن أيضًا من خلال حقيقة تجميع البيانات الأولية. مع زيادة عدد المجموعات m ، ينمو التباين بين المجموعات d 2 ويقترب من التباين الكلي. إذا كان عدد المجموعات أقل من عدد الوحدات السكانية N ، فلن تساوي قيم r و r 2 أبدًا 1 ، حتى مع وجود علاقة وظيفية صارمة.

لاحظ أن قيمة مؤشر تقارب الاتصال في حد ذاته ليست دليلاً على وجود علاقة سببية بين السمات المدروسة ، ولكنها تقييم لدرجة الاتساق المتبادل في التغييرات في الميزات. يجب بالضرورة أن يسبق إنشاء علاقة السبب والنتيجة تحليل الطبيعة النوعية للظاهرة.

علاقة الارتباط التجريبية

يمكن قياس تقارب أو قوة العلاقة بين ميزتين بمقياس يسمى نسبة الارتباط التجريبية. يُطلق على هذا المؤشر اسم تجريبي ، حيث يمكن حسابه على أساس التجميع المعتاد حسب العامل والسمة الناتجة ، أي على أساس جدول الارتباط. يتم الحصول على نسبة الارتباط التجريبية من قاعدة إضافة التباينات ، والتي وفقًا لذلك ، أين يكون التباين الكلي ؛ - التشتت بين المجموعات ؛ - التشتت داخل المجموعة (متوسط ​​الخاص). التباين بين المجموعات هو مقياس للتذبذب بسبب سمة العامل. متوسط ​​الفروق الجزئية هو مقياس للتذبذب بسبب جميع الميزات الأخرى (باستثناء العوامل). ثم تعبر النسبة عن حصة التقلبات الناشئة بسبب علامة العامل في التقلب الكلي. يسمى الجذر التربيعي لهذه النسبة بنسبة الارتباط التجريبية:.

يشير هذا إلى القاعدة القائلة بأنه كلما زاد التباين بين المجموعات ، زادت قوة تأثير سمة العامل على تباين السمة الناتجة. يتم حساب نسب مكونات الفروق من بيانات جدول الارتباط باستخدام الصيغ التالية:

; ,

أين توجد المعدلات الخاصة ؛ - العوارية العامة - المجاميع على أساس ؛ - المجاميع على أساس ؛ - عدد المشاهدات. يتم الاحتفاظ بنفس العلاقة أيضًا للقيم الشرطية المتلقاة من خلال التحويل العددي.

نسبة التباين نفسها (التعبير الجذري) تسمى معامل التحديد (وهي تساوي أيضًا مربع نسبة الارتباط التجريبية). تختلف نسبة الارتباط التجريبية على مدى واسع (من 0 إلى 1). إذا كانت تساوي الصفر ، فإن علامة العامل لا تؤثر على علامة الارتباط. إذا كانت = 1 ، فإن العلامة الناتجة تعتمد تمامًا على العامل الأول. إذا كان الارتباط التجريبي جزءًا قريبًا من واحد ، فإنهم يتحدثون عن علاقة وثيقة بين السمات الفعالة والعاملة. إذا كان هذا الكسر صغيرًا (قريبًا من الصفر) ، فحينئذٍ يتحدث المرء عن ضعف الاتصال بينهما.

علاقة الارتباط التجريبية

يتم استخدام العديد من المؤشرات لقياس مدى قرب الارتباط. مع اتصال الزوج ، يتم تحديد ضيق الاتصال ، أولاً وقبل كل شيء ، من خلال نسبة الارتباط ، والتي يُشار إليها بـ η. مربع نسبة الارتباط هو نسبة التباين بين المجموعات للسمة الناتجة ، والتي تعبر عن تأثير الاختلافات في سمة عامل التجميع على متوسط ​​قيمة السمة الناتجة ، إلى التباين الكلي للسمة الناتجة ، والتي تعبر عن تأثير جميع الأسباب والشروط عليه. يسمى مربع نسبة الارتباط بمعامل التحديد.

ظواهر وعلاماتها: ________________ أو حتمية صارمة

حيث k هو عدد المجموعات

N هو عدد الملاحظات

y i - القيم الأولية للميزة الفعالة

y j - متوسط ​​قيم السمة الفعالة لهذه المجموعة

y هو متوسط ​​قيمة الميزة

f j هو حجم المجموعة

تُستخدم الصيغة أعلاه عند حساب مؤشر قرب الاتصال لتجميع تحليلي. عند حساب نسبة الارتباط حسب مستوى الاتصال ، يتم استخدام الصيغة التالية:

مجموع المربعات في البسط هو تباين السمة الناتجة y الموضح بالعلاقة مع العامل x (العوامل). يتم حسابه من البيانات الفردية التي تم الحصول عليها لكل وحدة من السكان بناءً على معادلة الانحدار.

إذا تم اختيار المعادلة بشكل غير صحيح أو حدث خطأ عند حساب معلماتها ، فقد يكون مجموع المربعات في البسط أكبر مما هو عليه في المقام ، وستفقد النسبة المعنى الذي ينبغي أن يكون لها. لتجنب نتيجة خاطئة ، من الأفضل حساب نسبة الارتباط باستخدام الصيغة التالية:

تستند هذه الصيغة إلى القاعدة المعروفة لتوسيع مجاميع الانحرافات التربيعية عند تجميع السكان:

د مشترك= د intergr+ د إنتراغر

وفقًا لهذه القاعدة ، بدلاً من التباين بين المجموعات (العامل) ، يمكنك استخدام الفرق:

د مشتركإنتراغر

ما يعطي:

عند حساب η ليس عن طريق التجميع ، ولكن بواسطة معادلة الارتباط (معادلة الانحدار) ، نستخدم الصيغة. في هذه الحالة ، تتم كتابة قاعدة التحلل لمجموع الانحرافات التربيعية للميزة الناتجة كـ

مجموع D \ u003d D الأساسية + D بقية

النقطة الأكثر أهمية ، والتي يجب أن يتعلمها الآن أي شخص يريد تطبيق طريقة تحليل الارتباط والانحدار بشكل صحيح ، هي تفسير الصيغتين (1.2) و (1.3). يقرأ هذا الحكم:

تقيس معادلة الارتباط العلاقة بين تباين السمة الناتجة وتغير ميزة (ميزات) العامل. تقيس مقاييس ضيق الاتصال نسبة التباين في السمة الناتجة ، والتي ترتبط باختلاف ميزة العامل (الميزات).

| المحاضرة القادمة ==>

قمة