صيغة نسبة الارتباط التجريبية. معامل التحديد والارتباط التجريبي

حل. لحساب تشتت المجموعة ، نحسب المتوسطات لكل مجموعة:

الكمبيوتر.؛ الكمبيوتر.

يتم عرض الحسابات الوسيطة للفروق حسب المجموعات في الجدول. 3.2 استبدال القيم التي تم الحصول عليها في الصيغة (3.4) ، نحصل على:

متوسط ​​الفروق الجماعية

ثم نحسب التباين بين المجموعات. للقيام بذلك ، نحدد أولاً المتوسط ​​العام على أنه المتوسط ​​المرجح لمتوسطات المجموعة:

الآن نحدد التباين بين المجموعات

وعليه فإن التباين الكلي حسب قاعدة إضافة الفروق:

دعنا نتحقق من النتيجة بحساب التباين الكلي بالطريقة المعتادة:

استنادًا إلى قاعدة إضافة التباينات ، من الممكن تحديد مؤشر تقارب العلاقة بين التجميع (عاملي) والميزات الفعالة. يطلق عليه نسبة الارتباط التجريبية ، ويُشار إليها بـ ("هذا") ويتم حسابها بواسطة الصيغة

على سبيل المثال لدينا ، التجريبية علاقة الارتباط

.

تميز قيمة 0.86 علاقة ذات دلالة إحصائية بين خصائص التجميع والأداء.

تسمى القيمة معامل التحديد وتظهر حصة التباين بين المجموعات في التباين الكلي.

إلى جانب تباين السمات الكمية ، يمكن أيضًا ملاحظة تباين في السمات النوعية. يتم تحقيق مثل هذه الدراسة للتباين ، كما هو الحال بالنسبة لنسب السمات الكمية ، من خلال حساب وتحليل الأنواع التالية من الفروق.

يتم تحديد التباين داخل المجموعة للحصة من خلال الصيغة

. (3.17)

يتم حساب متوسط ​​الفروق داخل المجموعة على أنها

. (3.18)

صيغة التباين بين المجموعات هي كما يلي:

, (3.19)

أين ن أنا- عدد الوحدات في مجموعات منفصلة ؛

- نسبة السمة المدروسة في مجموع السكان ، والتي تحددها الصيغة

التباين الكلي له الشكل

. (3.21)

ترتبط أنواع التشتت الثلاثة ببعضها البعض على النحو التالي:

. (3.22)

مثال 3.4

دعنا نحدد تباينات المجموعة ومتوسط ​​المجموعة والتباينات بين المجموعات وإجمالي الفروق وفقًا للبيانات الموجودة في الجدول. 3.3

الجدول 3.3

عدد و جاذبية معينةإحدى الفئات
منطقة مزارع الماشية



حل

دعونا نحدد حصة الأبقار الحلوب بشكل عام لثلاث مزارع:

إجمالي التباين في نسبة أبقار الألبان:

الفروق داخل المجموعة:

; ; .

متوسط ​​الفروق داخل المجموعة:

التباين بين المجموعات:

باستخدام قاعدة إضافة الفروق ، نحصل على: 0.1025 + 0.0031 = 0.1056. المثال صحيح.

مثال 3.5

وفقا لمسح عينة أجورتلقى موظفو القطاع العام المؤشرات التالية (الجدول 3.4).

الجدول 3.4

يُعرِّف:

1) متوسط ​​الراتب في صناعتين ؛

2) تشتت الأجور:

أ) متوسط ​​تشتت المجموعة (الصناعة) ،

ب) بين المجموعات (بين القطاعات) ،

3) معامل التحديد.

4) الارتباط التجريبي.

حل

1. يُحسب متوسط ​​رواتب العاملين في صناعتين بالصيغة (2.10):

فرك.

2. الفروق في الأجور:

أ) متوسط ​​تشتت المجموعة حسب (3.14)

ب) التشتت بين المجموعات وفقًا لـ (3.12)

ج) مجموع الفرق الذي تم الحصول عليه على أساس قاعدة إضافة الفروق (3.15):

3. معامل التحديد يساوي القيمة

أولئك. ، أو 44.24٪.

ويظهر أن المكافأة بنسبة 44.24٪ تعتمد على الانتماء القطاعي للموظفين وبنسبة 55.76٪ - لأسباب داخل الصناعة.

حسب المعادلة (3.16) نسبة الارتباط التجريبية ,

مما يشير إلى تأثير كبير على تمايز الأجور من الخصائص القطاعية.

3.2 مهام الحل المستقل

المهمة 3.1

وفقاً لتوزيع 60 عاملاً حسب فئة التعريفة ، تتوافر البيانات التالية (الجدول 3.5).

الجدول 3.5

يُعرِّف:

1) متوسط ​​فئة أجور العمال.

2) متوسط ​​الانحراف الخطي.

3) التشتت.

4) الانحراف المعياري.

5) معامل الاختلاف.

المهمة 3.2

وفقًا لنتائج جلسة الامتحان للدورتين الأولى والثانية لإحدى الجامعات ، تتوفر البيانات التالية: في السنة الأولى ، اجتاز 85٪ من الطلاب الدورة دون اثنتين ، في السنة الثانية - 90٪.

حدد لكل مقرر تباين نسبة الطلاب الذين اجتازوا الجلسة بنجاح.

المهمة 3.3

تم توزيع الشركات المساهمة في المنطقة حسب متوسط ​​عدد العاملين في 1 يناير 2004 على النحو التالي (الجدول 3.6).

الجدول 3.6

احسب:

1) متوسط ​​الانحراف الخطي ؛

2) التشتت.

3) الانحراف المعياري.

4) معامل الاختلاف.

المهمة 3.4

توجد بيانات عن توزيع عائلات العاملين في المؤسسة حسب عدد الأطفال (الجدول 3.7).

الجدول 3.7

احسب:

1) التشتت داخل المجموعة ؛

2) متوسط ​​التشتت داخل المجموعة ؛

3) التشتت بين المجموعات ؛

4) التباين الكلي.

تحقق من صحة الحسابات باستخدام قاعدة إضافة الفروق.

المهمة 3.5

يتم تمثيل توزيع تكلفة المنتجات المعدة للتصدير من قبل متاجر المؤسسة بالبيانات التالية (الجدول 3.8).

الجدول 3.8

احسب:

1) متوسط ​​حصص المجموعة البينية وبين المجموعة وإجمالي حصص الصادرات ؛

2) معامل التحديد والارتباط التجريبي.

المهمة 3.6

وفقًا لمسح للبنوك التجارية في المدينة ، كان 70 ٪ من إجمالي عدد العملاء كيانات قانونية بمتوسط ​​قرض يبلغ 120 ألف روبل. ومعامل الاختلاف 25٪ ، و 20٪ - فرادىبمتوسط ​​حجم قرض يبلغ 20 ألف روبل. بمتوسط ​​انحراف مربع يبلغ 6 آلاف روبل.

باستخدام قواعد إضافة الفروق ، حدد مدى قرب العلاقة بين حجم القرض ونوع العميل من خلال حساب نسبة الارتباط التجريبية.

القسم 4. الملاحظة الانتقائية

4.1 تعليمات منهجية
وحل المهام النموذجية

الغرض من ملاحظة العينة هو تحديد خصائص عامة السكان - العوارية العامة (س) والحصة العامة ( ص). خصائص مجتمع العينة - يختلف متوسط ​​العينة () وحصة العينة () عن الخصائص العامة بمقدار خطأ أخذ العينات (). لذلك ، لتحديد خصائص عامة السكان ، من الضروري حساب خطأ أخذ العينات ، أو خطأ التمثيل ، والذي يتم تحديده بواسطة الصيغ المطورة في نظرية الاحتمالات لكل نوع من أنواع العينة وطريقة الاختيار.

أخذ العينات العشوائية والميكانيكية المناسبة.في حالة إعادة أخذ العينات العشوائية ، يتم حساب الخطأ الهامشي لأخذ العينات للمتوسط ​​() وللنسبة () بواسطة الصيغ

; (4.1)

(4.2)

أين تباين عينة السكان ؛

ن- حجم العينة؛

رهو معامل الثقة ، والذي يتم تحديده من جدول قيم دالة لابلاس المتكاملة لاحتمال معين ( ف دوس.) (الجدول A1).

مع الاختيار العشوائي والميكانيكي غير المتكرر ، يتم حساب الخطأ الهامشي لأخذ العينات بواسطة الصيغ

; (4.3)

, (4.4)

أين ن- حجم عامة السكان.

مثال 4.1

لتحديد محتوى رماد الفحم في الرواسب ، تم فحص 100 عينة من الفحم بشكل عشوائي. نتيجة للمسح وجد أن متوسط ​​محتوى الرماد للفحم في العينة هو 16٪ والانحراف المعياري 5٪. في عشر عينات ، كان محتوى الرماد في الفحم أكثر من 20٪. مع احتمال 0.954 ، حدد الحدود التي سيكون ضمنها متوسط ​​محتوى الرماد للفحم في الرواسب ونسبة الفحم المحتوي على رماد أكثر من 20٪.

حل

سيكون متوسط ​​محتوى الرماد للفحم في الداخل

لتحديد حدود المتوسط ​​العام ، نحسب الخطأ الهامشي لأخذ العينات للمتوسط ​​باستخدام الصيغة (4.1):

. (4.5)

مع احتمال 0.954 ، يمكن القول أن متوسط ​​محتوى الرماد للفحم في الرواسب سيكون في حدود 16٪ 1٪ ، أو 15٪ 17٪.

ستكون حصة الفحم التي تحتوي على نسبة رماد تزيد عن 20 ٪ في الداخل

يتم تحديد حصة العينة من خلال الصيغة

أين مهي نسبة الوحدات مع الميزة

يتم حساب خطأ أخذ العينات للسهم () بالصيغة (4.2):

أو ± 6٪.

مع احتمال 0.954 ، يمكن القول بأن نسبة الفحم المحتوي على نسبة رماد تزيد عن 20٪ في الإيداع ستكون ضمن ، أو .

مثال 4.2

لتحديد متوسط ​​مدة استخدام قرض قصير الأجل في البنك ، تم عمل عينة ميكانيكية بنسبة 5٪ ، تضمنت 100 حساب. نتيجة للمسح ، وجد أن متوسط ​​مدة استخدام قرض قصير الأجل هو 30 يومًا بانحراف معياري يبلغ 9 أيام. في خمسة حسابات ، تجاوزت مدة استخدام القرض 60 يومًا. مع احتمال 0.954 ، حدد الحدود التي ستكون ضمنها مدة استخدام قرض قصير الأجل في عموم السكان ونسبة الحسابات ذات الأجل باستخدام قرض قصير الأجل لأكثر من 60 يومًا.

حل

متوسط ​​المدىاستخدام قرض مصرفي في حدود

.

نظرًا لأن أخذ العينات ميكانيكي ، يتم تحديد خطأ أخذ العينات بالصيغة (2.3):

يوم.

مع احتمال 0.954 ، يمكن القول أن مدة استخدام قرض قصير الأجل في أحد البنوك في غضون = 30 يومًا ويومين ، أو

28 يومًا في اليوم.

تكون حصة القروض التي تبلغ أجل استحقاقها أكثر من 60 يومًا في غضون

ستكون حصة العينة

يتم تحديد خطأ أخذ العينات للحصة من خلال الصيغة (4.4):

أو 4.2٪.

مع احتمال 0.954 ، يمكن القول بأن حصة القروض المصرفية التي يزيد أجل استحقاقها عن 60 يومًا ستكون في غضون أو

عينة نموذجية.في الاختيار النموذجي (حسب المناطق) ، يتم تقسيم عامة السكان إلى مجموعات نموذجية متجانسة ، مناطق. يتم اختيار وحدات المراقبة في مجموعة العينات أساليب مختلفة. النظر في عينة نموذجية مع الاختيار النسبي ضمن المجموعات النموذجية.

يتم تحديد حجم العينة من مجموعة نموذجية في الاختيار المتناسب مع عدد المجموعات النموذجية بواسطة الصيغة

أين ن أناهو حجم العينة من مجموعة نموذجية ؛

لاهو حجم مجموعة نموذجية.

الخطأ الهامشي لمتوسط ​​العينة ونسبة الخطأ العشوائي غير المتكرر و طريقة ميكانيكيةيتم حساب الاختيار ضمن المجموعات النموذجية بواسطة الصيغ

; (4.8)

, (4.9)

أين هو تباين عينة السكان.

مثال 4.3

لتحديد متوسط ​​عمر الرجال الذين يتزوجون ، تم إجراء عينة نموذجية بنسبة 5 ٪ في المنطقة مع اختيار الوحدات بما يتناسب مع حجم المجموعات النموذجية. ضمن المجموعات ، تم استخدام الاختيار الميكانيكي. يتم تلخيص البيانات في الجدول. 4.1

الجدول 4.1

مع احتمال 0.954 ، أوجد الحدود التي يكون فيها متوسط ​​العمرونسبة الرجال الذين يتزوجون للمرة الثانية.

حل

متوسط ​​سن الزواج للرجال في حدود

.

يتم تحديد متوسط ​​سن زواج الرجال في عينة السكان من خلال صيغة المتوسط ​​المرجح

= من السنة.

يتم تحديد متوسط ​​تباين العينة بواسطة الصيغة
وسط

=

نحسب الخطأ الهامشي في أخذ العينات باستخدام الصيغة (4.8):

من السنة.

مع احتمال 0.954 ، يمكن القول أن متوسط ​​عمر الرجال الذين يدخلون في الزواج سيكون في غضون عام من العام ، أو

24 سنة.

ستكون نسبة الرجال الذين يتزوجون من جديد في الداخل

يتم تحديد حصة العينة من خلال صيغة المتوسط

أو 14٪.

يتم حساب متوسط ​​تباين العينة لميزة بديلة بواسطة الصيغة

(4.12)

يتم تحديد خطأ أخذ العينات للحصة من خلال الصيغة (4.9):

أو 6٪.

مع احتمال 0.954 ، يمكن القول أن نسبة الرجال الذين يتزوجون للمرة الثانية ستكون في حدود ، أو .

أخذ العينات التسلسلي.باستخدام طريقة التحديد التسلسلية ، يتم تقسيم عامة السكان إلى مجموعات من نفس الحجم - سلسلة. يتم تحديد السلسلة في مجموعة العينات. ضمن السلسلة ، يتم إجراء مراقبة مستمرة للوحدات التي تندرج في السلسلة.

في حالة الاختيار غير المتكرر للسلسلة ، يتم تحديد الأخطاء الهامشية لمتوسط ​​العينة والنسبة بواسطة الصيغة

, (4.13)

أين هو التباين بين السلاسل ؛

صهو عدد السلاسل في عموم السكان ؛

ص- عدد السلاسل المختارة.

مثال 4.4

هناك 10 فرق من العمال في متجر المؤسسة. من أجل دراسة إنتاجية عملهم ، تم إجراء عينة متسلسلة بنسبة 20٪ ، تضمنت لوائين. نتيجة للمسح وجد أن متوسط ​​إنتاج العمال في الفرق كان 4.6 و 3 أطنان مع احتمال 0.997 حدد الحدود التي سيكون ضمنها متوسط ​​إنتاج عمال الورشة. ر ، أو ت.

مثال 4.5

في الأوراق المالية المنتجات النهائيةتحتوي الورشة على 200 صندوق من الأجزاء ، 40 قطعة في كل صندوق. للتحقق من جودة المنتج النهائي ، تم عمل عينة تسلسلية بنسبة 10٪. نتيجة لأخذ العينات ، وجد أن نسبة الأجزاء المعيبة هي 15٪. تباين العينة التسلسلية هو 0.0049.

مع احتمال 0.997 ، حدد الحدود التي تقع ضمنها نسبة المنتجات المعيبة في مجموعة من الصناديق.

حل

ستكون نسبة الأجزاء المعيبة في الداخل

دعونا نحدد خطأ أخذ العينات الهامشي للحصة بالصيغة (4.13):

أو 4.4٪.

مع احتمال 0.997 ، يمكن القول أن نسبة الأجزاء المعيبة في الدُفعة تتراوح بين 10.6٪ و 19.6٪.

مثال 4.6

في إقليم يتكون من 20 مقاطعة ، تم إجراء مسح عائد العينة بناءً على اختيار السلاسل (المقاطعات). وبلغت متوسطات العينة للمديريات 14.5 ج / هكتار على التوالي. 16 ؛ 15.5 ؛ 15 و 14 ف / هكتار. مع احتمال 0.954 ، أوجد حدود الإنتاجية في المنطقة بأكملها.

حل

احسب المتوسط ​​العام:

تشا.

التباين بين المجموعات (بين المجموعات)

دعونا الآن نحدد الخطأ الهامشي لعينة تسلسلية غير متكررة (t = 2 ، P dov = 0.954) باستخدام الصيغة (4.13):

.

لذلك ، سيكون العائد في المنطقة (مع احتمال 0.954) ضمن

15-1,7≤ ≤15+1,7,

13.3 ج / هكتار ≤ -16.7 ج / هكتار.

في ممارسة تصميم ملاحظة العينة ، هناك حاجة لإيجاد حجم العينة ، وهو أمر ضروري لضمان دقة معينة في حساب الخصائص العامة - المتوسط ​​والنسبة. في هذه الحالة ، يُعرف خطأ أخذ العينات الهامشي واحتمال حدوثه وتغير السمة مسبقًا.

مع إعادة أخذ العينات العشوائية ، يتم تحديد حجم العينة من التعبير

مع الاختيار العشوائي غير المتكرر والميكانيكي ، يتم حساب حجم العينة بواسطة الصيغة

. (4.16)

لعينة نموذجية

. (4.17)

لأخذ العينات التسلسلية

. (4.18)

مثال 4.7

هناك 2000 عائلة تعيش في المنطقة. ومن المخطط إجراء مسح بالعينة لهم بطريقة الانتقاء العشوائي غير المتكرر لمعرفة متوسط ​​حجم الأسرة. تحديد حجم العينة المطلوب ، بشرط ألا يتجاوز خطأ العينة مع احتمال 0.954 شخصًا واحدًا بانحراف معياري لثلاثة أشخاص (= 3).

حل

مع الاختيار العشوائي غير المتكرر ، سيكون حجم العينة وفقًا للمعادلة (4.16) العائلات.

حجم العينة: 36 عائلة على الأقل.

مثال 4.8

المدينة أ بها 10000 أسرة. بمساعدة أخذ العينات الميكانيكية ، من المفترض تحديد نسبة العائلات التي لديها ثلاثة أطفال أو أكثر. ماذا يجب أن يكون حجم العينة بحيث يكون هناك احتمال 0.954 ألا يتجاوز خطأ العينة 0.02 إذا كان من المعروف أن التباين هو 0.2 من الاستطلاعات السابقة؟

حل

لنحدد حجم العينة المطلوب وفق المعادلة (4.16):

.

حجم العينة: لا يقل عن 1667.

في الإحصاء ، غالبًا ما يكون من الضروري مقارنة نتائج عينتين (أو أكثر). بناءً على مقارنة بين وسيلتين من الوسائل (أو الأسهم) ، يتم التوصل إلى استنتاج حول عشوائية أو أهمية التناقض بينهما.

لهذا ، تتم مقارنة الفرق المطلق بين مؤشرات متوسط ​​العينة بمتوسط ​​خطأ الاختلاف:

. (4.19)

وجد راحسب. مقارنة ب رفاتورة غير مدفوعة. بواسطة ر- توزيع الطالب (جدول A2) لعدد درجات الحرية الخامس=ن 1 +ن 2 -2 ومستوى أهمية معين أ. (هنا ن 1 و ن 2 - حجوم العينات المقارنة).

علاقة الارتباط التجريبية

يمكن قياس تقارب أو قوة العلاقة بين ميزتين بمؤشر يسمى نسبة الارتباط التجريبية. يُطلق على هذا المؤشر اسم تجريبي ، حيث يمكن حسابه على أساس التجميع المعتاد حسب العامل والسمة الناتجة ، أي على أساس جدول الارتباط. يتم الحصول على الارتباط التجريبي من قاعدة إضافة التباين ، وفقًا لذلك ، أين
- التباين الكلي.
- التشتت بين المجموعات ؛
- التشتت داخل المجموعة (متوسط ​​الخاص). التباين بين المجموعات هو مقياس للتذبذب بسبب سمة العامل. متوسط ​​الفروق الجزئية هو مقياس للتذبذب بسبب جميع الميزات الأخرى (باستثناء العوامل). ثم العلاقة
يعبر عن حصة التقلبات الناشئة بسبب علامة العامل في التقلب الكلي. يسمى الجذر التربيعي لهذه النسبة بنسبة الارتباط التجريبية:
.

يشير هذا إلى القاعدة القائلة بأنه كلما زاد التباين بين المجموعات ، كلما زادت قوة سمة العامل التي تؤثر على تباين السمة الناتجة. يتم حساب نسب مكونات الفروق من بيانات جدول الارتباط باستخدام الصيغ التالية:

;
,

أين توجد المعدلات الخاصة ؛ - العوارية العامة - المجاميع حسب الميزة ; - المجاميع حسب الميزة ;
- عدد المشاهدات. يتم الاحتفاظ بنفس العلاقة أيضًا للقيم الشرطية المتلقاة من خلال التحويل العددي.

تسمى نسبة التباين نفسها (التعبير الجذري) بمعامل التحديد (وهي تساوي أيضًا مربع نسبة الارتباط التجريبية). تختلف نسبة الارتباط التجريبية على مدى واسع (من 0 إلى 1). إذا كانت تساوي الصفر ، فإن علامة العامل لا تؤثر على علامة الارتباط. لو = 1 ، مما يعني أن العلامة الناتجة تعتمد كليًا على العامل الأول. إذا كانت العلاقة التجريبية جزءًا قريبًا من الوحدة ، فعندئذٍ يتحدث المرء عنها اغلق الاتصالبين السمات العاملية والنتيجة. إذا كان هذا الكسر صغيرًا (قريبًا من الصفر) ، فحينئذٍ يتحدث المرء عن ضعف الاتصال بينهما.

معامل الارتباط الخطي ودليل الارتباط

مقياس تقارب العلاقة بين سمتين متصلتين إحصائياً هو معامل الارتباط الخطي أو ببساطة معامل الارتباط. لها نفس المعنى مثل نسبة الارتباط التجريبية ، ولكن يمكن أن تأخذ كلا من القيم الإيجابية والسلبية. معامل الارتباط له تعبير رياضي صارم لعلاقة خطية. تشير القيمة الموجبة إلى وجود علاقة مباشرة بين السمات ، بينما تشير القيمة السالبة إلى العكس.

يتم حساب معامل الارتباط الزوجي في حالة الشكل الخطي للاتصال بواسطة الصيغة

وقيمة العينة الخاصة به - وفقًا للصيغة

من خلال عدد قليل من الملاحظات ، من الملائم حساب معامل ارتباط العينة باستخدام الصيغة التالية:

تتغير قيمة معامل الارتباط في الفترة الزمنية
.

في
هناك علاقة وظيفية بين المتغيرين ، متى
- اتصال وظيفي مباشر. لو
، ثم قيم X و Y في العينة غير مرتبطة ؛ إذا كان نظام المتغيرات العشوائية
له توزيع طبيعي ثنائي الأبعاد ، ثم تكون الكميات X و Y مستقلة أيضًا.

إذا كان معامل الارتباط في الفاصل الزمني
، ثم هناك علاقة عكسية بين X و Y. يتم تأكيد ذلك أيضًا من خلال التحليل المرئي للمعلومات الأولية. في هذه الحالة ، يتم أخذ انحراف Y عن متوسط ​​القيمة بالإشارة المعاكسة.

إذا كان كل زوج من قيم X و Y غالبًا ما يكون أعلى (أسفل) القيم المتوسطة المقابلة في نفس الوقت ، فهناك ارتباط مباشر بين القيم ويكون معامل الارتباط في الفاصل الزمني
.

من ناحية أخرى ، إذا تسبب انحراف قيمة X عن القيمة المتوسطة في كثير من الأحيان في انحرافات قيمة Y إلى أسفل عن القيمة المتوسطة ، وكانت الانحرافات مختلفة طوال الوقت ، فيمكننا افتراض أن قيمة معامل الارتباط يميل إلى الصفر.

وتجدر الإشارة إلى أن قيمة معامل الارتباط لا تعتمد على وحدات القياس واختيار النقطة المرجعية. هذا يعني أنه إذا تم تقليل (زيادة) المتغيرين X و Y بمقدار K مرة أو بنفس الرقم C ، فلن يتغير معامل الارتباط.

لتبسيط حساب مقياس ضيق الارتباط ، غالبًا ما يتم استخدام مؤشر الارتباط ، والذي يتم تحديده بواسطة الصيغ التالية:

,
,

أين
- التباين المتبقي ، الذي يميز تباين السمة الناتجة تحت تأثير العوامل الأخرى غير المعتبرة.

الارتباط المتعدد

الارتباط المتعدد - اعتماد النتيجة وخصائص عامل أو أكثر مدرجة في الدراسة. يُطلق على مؤشر تقارب العلاقة بين النتيجة وميزات عامل أو أكثر اسم معامل الارتباط المتعدد أو التراكمي ويتم الإشارة إليه بواسطة R. يشير المعامل التراكمي إلى وجود علاقة خطية بين كل زوج من الميزات ، والتي يمكن أن تكون معبراً عنها باستخدام معاملات الارتباط المزدوجة. إذا كان هناك مقياس تراكمي لضيق العلاقة بين السمة الفعالة () وميزات العامل (و ) ، ثم يتم حساب معامل الارتباط التراكمي وفقًا للصيغة:

,

حيث تشير الرموز الفرعية إلى السمات التي تتم دراسة علاقة الزوج بينها.

في الصيغ الخاصة بحساب معاملات الارتباط المزدوجة ، فقط الرموز التي تشير إلى عامل أو آخر يتغير. لذلك ، إذا تم حساب معامل الارتباط بين الصيغة وحسابها ، فسيتم حساب معامل الارتباط بين و: ؛ بين و - لذا:

جزء التسوية

المهمة 31

    البيانات التالية متاحة لعشر شركات للفترة المشمولة بالتقرير:

الجدول 2

الشركات

متوسط ​​التكلفة السنوية لأصول الإنتاج الثابتة ، مليون روبل.

الناتج مليون روبل

لدراسة العلاقة بين حجم متوسط ​​التكلفة السنوية للأصول الثابتة والمخرجات ، احسب معادلة العلاقة الخطية.

2. على أساس البيانات المعطاة: أ) احسب: معامل الارتباط الخطي. ب) التحقق من صحة اختيار شكل الاتصال عن طريق حساب مؤشر الارتباط.

    باستخدام معالج جداول البيانات Microsoft Excel ، سنقوم ببناء ورقة عمل:

الجدول 3

حساب المبالغ لحساب معاملات معادلة الخط المستقيم

239.74 * 1236 = 539.1 توزيعات احتمالية ... اقتصادي تحليل، تم حلها على أساس تراجع اقتصاديعارضات ازياء. لنفكر في y - علامة فعالة ، وعلامات عامل x. طُرق مترابط-تراجع تحليل ...

  • برنامج تخصص "طرق الحاسب الآلي لتحليل البيانات الاجتماعية" (مقدمة في الإحصاء الرياضي وتحليل البيانات) للتوجيه 040200. 68 "علم الاجتماع"

    برنامج الانضباط

    التطبيقات. 11 3 2 6 مشتت تحليل 9 2 2 5 مزدوج ومتعدد رجعي تحليل 9 2 2 5 خصائص المعاملات ... بواسطة مستخدم SPSS 11.0 Siskov V.I. علاقة تحليلالخامس اقتصادي بحث. م 1975. إدوس م ، ستانسفيلد ...

  • تحليل G. L. Savitskaya للنشاط الاقتصادي للمؤسسة

    وثيقة

    تفوق، أحدث الطرق اقتصادي بحث. تحليليجب أن تكون معقدة. تعقيد البحث ... على مستوى متوسط ​​الإنتاج بالساعة مترابط-رجعي تحليل. إلى عامل متعدد العوامل علاقةنموذج متوسط ​​الإنتاج بالساعة ...

  • يتضمن تحليل الارتباط قياس تقارب الاتصال باستخدام معامل الارتباط ونسبة الارتباط. مع شكل خطي من الاعتماد ، يتم تقدير قوة الاتصال بواسطة معامل ارتباط بيرسون :

    يختلف معامل الارتباط من (- 1) إلى (+ 1) ، (– 1 ص 1).

    تشير العلامة السلبية للمؤشر إلى وجود رد فعل ، وتشير العلامة الإيجابية إلى وجود اتصال مباشر. كلما اقتربت قيمة المؤشر من واحد ، بالقيمة المطلقة ، كلما كان الاتصال أقوى ، وكلما اقترب من الصفر ، كان الاتصال أضعف.

    لقياس قوة الاتصال بأي شكل من أشكال الاعتماد ، الخطي وغير الخطي ، وكذلك لتقييم الاتصال المتعدد ، قم بتطبيق الارتباط النظري (مؤشر الارتباط). يعتمد حسابها على قاعدة إضافة التباين:

    أين التباين الكلي - يعكس تباين السمة الفعالة بسبب جميع العوامل المؤثرة عليها ؛

    أو

    عامل التباين ، يعكس تباين السمة الفعالة بسبب العامل (X).

    التشتت المتبقي ، يعكس تباين السمة الفعالة بسبب كل العوامل ما عدا العامل (X);

    نسبة الارتباط النظري هو الجذر التربيعي لنسبة التباين العامل إلى التباين الكلي:

    تعبير الجذر - معامل التحديد :

    يوضح نسبة تباين السمة الناتجة ، بسبب تأثير سمة العامل ، في التباين الكلي. كلما زادت هذه النسبة ، زادت قوة العلاقة بين الميزات.

    نسبة الارتباط النظري يتغير من 0 إلى 1 (0 ص 1) قيمة المؤشر أقرب إلى واحد ، أقوى العلاقة.

    لتقييم قوة العلاقة ، يمكنك استخدام حجمح إدوكا:

    اتجاه التطور الرئيسي وطرق الكشف عنه

    كل صف من الديناميكيات له اتجاه تطوير خاص به ، أي الاتجاه العام نحو زيادة أو نقصان أو استقرار مستوى الظاهرة بمرور الوقت. تعتمد شدة هذا الاتجاه على تأثير العوامل الثابتة والدورية (الموسمية) والعشوائية على مستويات سلسلة الديناميكيات. لذلك ، لا ينبغي أن يتحدث المرء فقط عن اتجاه التنمية ، ولكن عن الاتجاه الرئيسي.

    اتجاه التنمية الرئيسي (الاتجاه) يسمى التغيير السلس والمستقر في مستوى الظاهرة بمرور الوقت ، خالٍ من التقلبات الدورية والعشوائية.

    لتحديد الاتجاه ، تتم معالجة سلسلة الديناميكيات من خلال طرق تكبير الفترات ، والمتوسط ​​المتحرك ، والمحاذاة التحليلية.

    طريقة التخشين الفاصل يعتمد على توحيد الفترات الزمنية ، والتي تشمل مستويات سلسلة من الديناميكيات. للقيام بذلك ، يتم دمج البيانات الأصلية ، أي تلخيصها أو متوسطها على فترات زمنية أطول حتى الاتجاه العامالتنمية لن تصبح واضحة بما فيه الكفاية. على سبيل المثال ، يتم دمج البيانات اليومية عن الإنتاج في بيانات مدتها عشرة أيام ، والبيانات الشهرية في بيانات ربع سنوية ، والبيانات السنوية في بيانات متعددة السنوات. ميزة الطريقة هي بساطتها. العيب هو أن السلسلة المصقولة أقصر بكثير من السلسلة الأصلية.

    طريقة المتوسط ​​المتحرك يتكون من حقيقة أنه ، على أساس البيانات الأولية ، يتم حساب المتوسطات المتحركة من عدد معين من المستويات الأولى من السلسلة ، أولاً على التوالي ، ثم من نفس عدد المستويات ، بدءًا من المستوى الثاني ، من المستوى الثالث ، إلخ. القيمة المتوسطة ، كما كانت ، تنزلق على طول السلسلة الديناميكية ، تتحرك بفاصل زمني واحد. تعمل المتوسطات المتحركة على تخفيف التقلبات العشوائية.

    مخطط لحساب المتوسط ​​المتحرك من 3 مستويات

    الفاصل الزمني

    (رقم بالترتيب)

    مستويات السلسلة الديناميكية الفعلية

    في أنا

    المتوسطات المتحركة

    في كورونا

    في 1

    في 2

    في 3

    في 4

    في sc3

    في 5

    في sc4

    في 6

    سلسلة الديناميكيات المتجانسة أقصر من السلسلة الأصلية من حيث القيمة (ل - 1)، إذا تم إجراء التوسيع على عدد فردي من المستويات ، حيث ل هي طول فترة التوسيع. على سبيل المثال ، إذا ل = 3 ، ثم الصف المحاذي أقصر بمستويين. وبالتالي ، فإن السلسلة المصقولة ليست أقصر بكثير من السلسلة الأصلية.

    طريقة المحاذاة التحليلية يتمثل في استبدال المستويات الفعلية للسلسلة الزمنية بقيمها النظرية المحسوبة على أساس معادلة الاتجاه:

    يتم حساب معلمات المعادلة طريقة المربعات الصغرى:

    أين في- المستويات الفعلية في تيهي المستويات المحسوبة (المحسوبة) المقابلة لها في الوقت المناسب.

    إذا تم تنفيذ التطور في تقدم حسابي (بزيادات مطلقة متساوية في السلسلة) ، إذن دالة خطية:

    إذا كانت هناك ديناميكية في التقدم الهندسي (بمعدلات نمو متساوية للسلسلة) ، فمن الضروري استخدامها دالة أسية:

    في ر = أ 0 أ 1 ر .

    إذا حدث التطور بمعدلات نمو متساوية ، يتم استخدامه مع وظيفة الطاقة، على سبيل المثال الرتبة الثانية (القطع المكافئ):

    في ر = أ 0 + أ 1 ر+ أ 2 ر 2 .

    معيار الاختيار الصحيح لمعادلة الاتجاه هو خطأ تقريبي . يمثل الانحراف المعياري للمستويات الفعلية لسلسلة الديناميكيات عن المستويات النظرية:

    تعتبر المعادلة ذات الخطأ التقريبي الأصغر هي الأمثل.

    ضع في اعتبارك "التقنية" لتسوية السلاسل الزمنية وفقًا لـ دالة خطية:


    أين أ 0 , أ 1 هي معلمات معادلة الخط المستقيم ؛ ر- مؤشرات الوقت (كقاعدة عامة ، الرقم التسلسلي للفترة أو النقطة الزمنية).

    معلمات الخط أ 0 و أ 1 ، التي تلبي طريقة المربعات الصغرى ، تم العثور عليها من خلال حل نظام المعادلات العادية التالي:

    أين نهو عدد مستويات سلسلة الديناميكيات ؛ معامل أ 1 يتوافق مع متوسط ​​الزيادة المطلقة.

    لتبسيط حساب مؤشرات الوقت
    يمكن إعطاء قيم من هذا القبيل
    ، ثم

    للقيام بذلك ، في الصفوف التي تحتوي على عدد فردي من المستويات ، يتم أخذ الفاصل الزمني المركزي كبداية لمرجع الوقت ، حيث ر يساوي الصفر. يوجد على جانبي الصفر صفوف من الأعداد الطبيعية السالبة والموجبة على التوالي ، على سبيل المثال:

    الفاصل الزمني

    (رقم بالترتيب)

    ر أنا

    لعدد زوجي من المستويات ، يتم العد من فترتين مركزيتين ، حيث ر تعادل (-1) و (+1) على التوالي ، وعلى كلا الجانبين توجد صفوف من الأرقام الفردية السالبة والموجبة ، على سبيل المثال:

    الفاصل الزمني

    (رقم بالترتيب)

    ر أنا

    مخطط لحساب معلمات المعادلة الخطية

    فترات زمنية

    مستويات السلسلة الديناميكية

    في أنا

    ر أنا

    أنا ر 2

    في أنا ر أنا

    في تي

    بناءً على معادلة الاتجاه المحسوبة ، من الممكن إنتاجها استقراء - إيجاد المستويات الاحتمالية (المتوقعة) خارج السلسلة الأولية للديناميكيات.

    إجابة

    يتكون التقييم الكمي لتقارب الاتصال وفقًا للبيانات التجريبية من حساب مؤشرات تقارب الاتصال:

    · معامل التحديد التجريبي (نسبة التشتت التجريبي) - ص 2 .

    يتم حساب هذا المؤشر وفقًا لبيانات التجميع التحليلي (الجدول) ، مثل نسبة التباين بين المجموعات لخاصية النتيجة Y (d y 2) إلى إجمالي التباين Y (s y 2):

    وفقًا لنظرية تحلل التباين ، يرتبط التباين بين المجموعات بالتباين الكلي: s y 2 = d y 2 + e y 2. ثم يمكن حساب معامل التحديد التجريبي من خلال التباين المتبقي باستخدام الصيغة:

    حيث s j 2 هو تباين النتيجة Y داخل المجموعة j.

    يميز معامل التحديد التجريبي قوة تأثير سمة التجميع (X) على تكوين الاختلاف العام للسمة الناتجة Y ويوضح النسبة المئوية (الحصة) للتغير في سمة النتيجة بسبب عامل السمة الأساسي التجمع.

    من الملائم حساب r 2 في الجدول:

    عامل الإشارة X j نيوجيرسي يعني قيمة نتيجة الميزة s j 2 N j
    x1 العدد 1 ق 1 2 شمال 1
    x2 العدد 2 ق 2 2 شمال 2
    .... ...
    Xm N م ق م 2 ن م
    المجموع ن X es j 2

    ثم .

    تأمل في مثال. لنترك مجموعة مكونة من 20 عاملاً ، تتميز بالخصائص التالية: ص - ناتج العامل (قطعة / وردية) و س - مؤهل (رتبة). يتم عرض البيانات الأولية في الجدول:

    X
    ص

    مطلوب لتقييم تقارب العلاقة بين الميزات باستخدام معامل التحديد التجريبي (r 2).

    لحساب r 2 ، سنجري تجميعًا تحليليًا للسكان. كعامل إشارة ، نأخذ X (فئة العامل) ، كنتيجة إشارة - Y ، ناتج العامل). يتم التجميع التحليلي على أساس X.B هذه القضيةستكون منفصلة (لأن قيم السمة X تتكرر في كثير من الأحيان). عدد المجموعات يساوي عدد قيم السمة X في الإجمالي ، أي 6. تم تلخيص نتائج تجميع وحساب r 2 في الجدول:

    عامل الإشارة X السمة الناتجة ص عدد الوحدات في مجموعة ، N j متوسط ​​قيمة علامة النتيجة في المجموعة ، (-) 2 N j تشتت نتيجة السمة في المجموعة ق 2 ي ق 2 ي ن ي
    (10+12+13)/3=11,7 (11,7-17,1) 2 3=88,56 ث 2 1 \ u003d ((10-11.7) 2 + (12-11.7) 2 + (13-11.7) 2) / 3 \ u003d 1.56 4,7
    (11+14)/2=12,5 (12,5-17,1) 2 2=42,3 ق 2 2 \ u003d ((11-12.5) 2 + (14-12.5) 2) / 2 \ u003d 2.25 4,5
    (12+13+15+16)/4= 14 (14-17,1) 2 4=38,4 ث 2 3 \ u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 = 2.5
    (15+17+17+18)/4= 16,75 (16,75-17,1) 2 4=0,49 ق 2 4 \ u003d ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \ u003d 1.9 4,75
    (18+20+22)/3=20 (20-17,1) 2 3=25,23 ث 2 5 = ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 = 2.7
    (23+24+27+25)/4= 24,75 (24,75-17,1) 2 4=234,1 ق 2 6 = ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 = 2.19 8,75
    =17,1 429,1 40,7

    المعامل التجريبي للتحديد يساوي نسبة التباين بين المجموعات لسمة النتيجة (d y 2) إلى التباين الكلي لسمة النتيجة (s y 2): r 2 = d y 2 / s y 2 = d y 2 / (d y 2 + ه ص 2).

    سيكون التشتت بين المجموعات Y مساويًا لـ: d y 2 = å (-) 2 N j / N = 429.1 / 20 = 21.45.

    سيكون التباين المتبقي Y هو: e y 2 = ås 2 j · N j / N = 40.7 / 20 = 2.035.

    ثم: r 2 \ u003d 21.45 / (21.45 + 2.035) \ u003d 429.1 / (429.1 + 40.7) \ u003d 0.913.

    الخلاصة: 91.3٪ من التباين في ناتج العمال يرجع إلى تأثير عامل التفريغ.

    · علاقة الارتباط التجريبية - ص.

    هذا المؤشر هو أصل معامل التحديد التجريبي. إنه يظهر ضيق الاتصال (ليس فقط الخطي!) بين التجميع والميزات الإنتاجية. يتراوح نطاق القيم المسموح بها لنسبة الارتباط التجريبية من 0 إلى +1.

    أقرب اتصال ممكن هو اتصال وظيفي ، عندما يتم تحديد كل قيمة للنتيجة Y بشكل فريد من خلال قيمة العامل X (أي نتيجة التجميع). في هذه الحالة ، يعني تباين المجموعة (d y 2) يساوي التباين الكلي (s y 2) ، أي لن يكون هناك اختلاف داخل المجموعة. في هذه الحالة ، فإن التشتت المتبقي (e y 2) يساوي 0 ، ومعامل التحديد التجريبي يساوي 1.

    إذا لم يكن هناك اتصال بين العلامات ، فإن جميع وسائل المجموعة متساوية مع بعضها البعض ، ولن يكون هناك اختلاف بين المجموعات (d y 2 = 0) ، ومعامل التحديد التجريبي هو 0.

    دعنا نحسب نسبة الارتباط التجريبية لمثالنا: r = 0.9555. الخلاصة: إن علامات "إنتاج العامل" و "التفريغ" وثيقة الصلة ببعضها البعض.

    يتم تحديد المؤشرين r و r 2 ليس فقط من خلال وجود اتصال بين السمات X و Y ، ولكن أيضًا من خلال حقيقة تجميع البيانات الأولية. مع زيادة عدد المجموعات m ، ينمو التباين بين المجموعات d 2 ويقترب من التباين الكلي. إذا كان عدد المجموعات أقل من عدد الوحدات السكانية N ، فلن تساوي قيم r و r 2 أبدًا 1 ، حتى مع وجود علاقة وظيفية صارمة.

    لاحظ أن قيمة مؤشر تقارب الاتصال ليست في حد ذاتها دليلًا على وجود علاقة سببية بين السمات المدروسة ، ولكنها تقييم لدرجة الاتساق المتبادل في التغييرات في الميزات. يجب بالضرورة أن يسبق إنشاء علاقة السبب والنتيجة تحليل الطبيعة النوعية للظواهر.

    علاقة الارتباط التجريبية

    يمكن قياس تقارب أو قوة العلاقة بين ميزتين بمؤشر يسمى نسبة الارتباط التجريبية. يُطلق على هذا المؤشر اسم تجريبي ، حيث يمكن حسابه على أساس التجميع المعتاد حسب العامل والسمة الناتجة ، أي على أساس جدول الارتباط. يتم الحصول على نسبة الارتباط التجريبية من قاعدة إضافة التباينات ، والتي وفقًا لذلك ، أين يكون التباين الكلي ؛ - التشتت بين المجموعات ؛ - التشتت داخل المجموعة (متوسط ​​الخاص). التباين بين المجموعات هو مقياس للتذبذب بسبب سمة العامل. متوسط ​​الفروق الجزئية هو مقياس للتذبذب بسبب جميع الميزات الأخرى (باستثناء العوامل). ثم تعبر النسبة عن حصة التقلبات الناشئة بسبب علامة العامل في التقلب الكلي. يسمى الجذر التربيعي لهذه النسبة بنسبة الارتباط التجريبية:.

    يشير هذا إلى القاعدة القائلة بأنه كلما زاد التباين بين المجموعات ، كلما زادت قوة سمة العامل التي تؤثر على تباين السمة الناتجة. يتم حساب نسب مكونات الفروق من بيانات جدول الارتباط باستخدام الصيغ التالية:

    ; ,

    أين توجد المعدلات الخاصة ؛ - العوارية العامة - المجاميع على أساس ؛ - المجاميع على أساس ؛ - عدد المشاهدات. يتم الاحتفاظ بنفس العلاقة أيضًا للقيم الشرطية المتلقاة من خلال التحويل العددي.

    تسمى نسبة التباين نفسها (التعبير الجذري) بمعامل التحديد (وهي تساوي أيضًا مربع نسبة الارتباط التجريبية). تختلف نسبة الارتباط التجريبية على مدى واسع (من 0 إلى 1). إذا كانت تساوي الصفر ، فإن علامة العامل لا تؤثر على علامة الارتباط. إذا كانت = 1 ، فإن العلامة الناتجة تعتمد تمامًا على العامل الأول. إذا كانت نسبة الارتباط التجريبية جزءًا قريبًا من واحد ، فإنهم يتحدثون عن علاقة وثيقة بين السمات الفعالة والعاملية. إذا كان هذا الكسر صغيرًا (قريبًا من الصفر) ، فحينئذٍ يتحدث المرء عن ضعف الاتصال بينهما.

    
    قمة