يظهر معامل التحديد التجريبي. على سبيل المثال لدينا ، العلاقة التجريبية

ما المقصود بالتباين داخل المجموعة للسكان؟ ما هي معادلة حسابها؟ اعط مثالا. ما هو المقصود بالتباين السكاني بين المجموعات؟ ما هي معادلة حسابها؟ اعط مثالا.

التباين داخل المجموعة () يشير إلى تباين عشوائي لا يعتمد على السمة الكامنة وراء التجميع.

، أين

متوسط ​​المجموعة

يتم حساب متوسط ​​التباين داخل المجموعة على النحو التالي: أولاً ، يتم حساب الفروق للمجموعات الفردية () ، ثم يتم حساب متوسط ​​التباين داخل المجموعة:

يميز الاختلاف المنهجي ، أي الاختلافات في حجم السمة قيد الدراسة ، والتي هي أساس التجميع. يتم حساب هذا التشتت بواسطة الصيغة

، أين

متوسط ​​القيمة لمجموعة منفصلة

ن أنا- عدد الوحدات في المجموعة

- المتوسط ​​الحسابي العام لمجتمع الدراسة بأكمله.

جميع أنواع التباين الثلاثة مترابطة: إجمالي التباين يساوي مجموع متوسط ​​التباين داخل المجموعة والتباين بين المجموعات:

هذه النسبة تعكس القانون الذي يسمى قاعدة إضافة التباين.

20.

ما هو المقصود بالتباين الكلي للسكان؟ ما هي معادلة حسابها؟ هل طريقة تجميع المجموعات تؤثر على التباين الكلي؟ اعط مثالا.

يميز التباين الكلي () تباين سمة السكان بالكامل تحت تأثير كل تلك العوامل التي تسببت في هذا الاختلاف. يتم تحديد هذه القيمة بواسطة الصيغة

، أين

المتوسط ​​الحسابي العام لمجتمع الدراسة بأكمله.

من ناحية أخرى ، فإن التباين الكلي يساوي مجموع متوسط ​​التباين داخل المجموعة والتباين بين المجموعات:

هذه النسبة تعكس القانون الذي يسمى قاعدة إضافة التباين.. بفضل قاعدة إضافة الفروق ، من الممكن تحديد أي جزء من التباين الكلي يقع تحت تأثير العامل المميز الذي يقوم عليه التجميع.

كلما زادت نسبة التباين بين المجموعات في التباين الكلي ، زاد تأثير سمة العامل (المرتبة) على الناتج (الإنتاج).

تتميز هذه النسبة بمعامل تحديد تجريبي:

لإجراء تقييم نوعي لتقارب العلاقة بين العلامات ، يتم استخدام علاقات تشادوك.

0-0,2

0,2-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

قوة الاتصال

مفقود

ضعيف جدا

ضعيف

معتدل

واضح

أغلق

قريب جدا

وظيفي-

الأنف

21.

ماذا يظهر معامل التحديد؟ ما هي معادلة حسابها؟ في أي وحدات يقاس هذا المؤشر؟ ما هي القيم الممكنة لهذا المؤشر؟ ماذا تظهر العلاقة التجريبية؟ ما هي معادلة حسابها؟ في أي وحدات يقاس هذا المؤشر؟ ما هي القيم الممكنة لهذا المؤشر؟

معامل التحديد التجريبي () يميز حصة التباين بين المجموعات في التباين الكلي:

يأخذ قيمًا من -1 إلى 1 ويوضح مدى اختلاف السمة في الإجمالي بسبب عامل التجميع.

تشتت بين المجموعات

التباين الكلي.

تحددها الصيغة:

يقبل القيم من -1 إلى 1

مثال

مجموعة

عدد النباتات في المجموعة ، أجهزة الكمبيوتر.

متوسط ​​الناتج الإجمالي بأسعار قابلة للمقارنة مليون روبل

دعونا الآن نحدد متوسط ​​القيمة ، والتباين الإجمالي ، والتباين بين المجموعات لإجمالي الناتج في الأسعار المقارنة للمصانع:

مليون روبل

مليون فرك 2 ؛

مليون فرك 2.

سيكون معامل التحديد مساويًا لـ:

نتيجة لذلك ، ستكون نسبة الارتباط التجريبية مساوية لـ:

تشير القيمة المحسوبة لنسبة الارتباط التجريبية إلى علاقة إحصائية عالية إلى حد ما بين إجمالي الناتج بالأسعار القابلة للمقارنة ومتوسط ​​التكلفة السنوية لأصول الإنتاج الثابتة للمصانع.

22.

كيف يتم حساب إحصاء الاختبار في تحليل التباين أحادي المتغير؟ ما هو قانون توزيعها في ظل صحة الفرضية الرئيسية؟ ما هي معايير هذا القانون؟ كيف يتم اتخاذ القرار في تحليل أحادي الاتجاه للتباين بناءً على القيمة المحسوبة لإحصاء المعيار؟

تتمثل مهمة تحليل التباين في دراسة تأثير عامل واحد أو أكثر على السمة قيد الدراسة.

يتم استخدام تحليل التباين أحادي الاتجاه عندما تتوفر ثلاث عينات مستقلة أو أكثر ، يتم الحصول عليها من نفس المجتمع العام عن طريق تغيير بعض العوامل المستقلة التي ، لسبب ما ، لا توجد قياسات كمية.

كمعيار ، من الضروري استخدام معيار فيشر:

.، أين

س 1 هو مجموع الانحرافات التربيعية لمتوسط ​​العينة عن المتوسط ​​الكلي

س 2 هو مجموع الانحرافات التربيعية للقيم المرصودة من متوسط ​​العينة

إذا كانت القيمة المحسوبة لمعيار فيشر أقل من القيمة المجدولة ، فلا يوجد سبب للاعتقاد بأن العامل المستقل يؤثر على انتشار القيم المتوسطة ( أولئك. لم يتم تأكيد الفرضية). خلاف ذلك ، فإن العامل المستقل له تأثير كبير على انتشار متوسط ​​القيم ( الفرضية صحيحة).

23-25.

1. على فترات متساوية ، استخدم الوسط الحسابي البسيط:

حيث y هي المستويات المطلقة للسلسلة ؛
ن- عدد المستويات في السلسلة.
2. بالنسبة للفترات غير المتساوية ، استخدم المتوسط ​​الحسابي المرجح:

اين انت 1 ، ... ، في - مستويات سلسلة الديناميات ؛
t1 ، ... tn - الأوزان ، ومدة الفترات الزمنية.

متوسط ​​مستوى سلسلة اللحظة يتم حساب الديناميات بالصيغة:
1. مع مستويات متساوية البعد يتم حسابها بواسطة معادلة متوسط ​​سلسلة العزم الكرونولوجية:

اين انت 1 ، ... ، уn - مستويات الفترة التي يتم فيها الحساب ؛
ن- عدد المستويات ؛
ن -1 - مدة الفترة الزمنية.
2. ج غير متكافئيتم حساب المستويات باستخدام معادلة المتوسط ​​المرجح الزمني:

اين انت 1 ، ... ، في - مستويات السلاسل الزمنية ؛
ر- الفاصل الزمني بين المستويات المتجاورة

في الإحصاء

متوسط ​​النمو المطلق يتم تعريفه على أنه متوسط ​​المكاسب المطلقة على فترات زمنية متساوية من فترة واحدة. يتم حسابه بواسطة الصيغ: 1. استنادًا إلى بيانات السلسلة الخاصة بالنمو المطلق على مدى عدد من السنوات ، يتم حساب متوسط ​​النمو المطلق كمتوسط ​​حسابي بسيط:

أين n هو عدد الزيادات المطلقة في قانون السلطة في الفترة قيد الدراسة.
2. يتم حساب متوسط ​​الزيادة المطلقةمن خلال النمو الأساسي المطلق في حالة الفواصل الزمنية المتساوية

أين م - عدد مستويات سلسلة الديناميكيات في فترة الدراسة بما في ذلك المستوى الأول.

متوسط ​​معدل النمو هي خاصية التعميم الحر لشدة تغيير المستوىسلسلة ديناميات ويوضح عدد المرات التي يتغير فيها مستوى سلسلة الديناميكيات في المتوسط ​​لكل وحدة زمنية.
كأساس ومعيار لصحة حساب متوسط ​​معدل النمو (النقصان) ، يتم استخدام مؤشر التعميم ، والذي يتم حسابه كمنتج لمعدلات نمو السلسلة التي تساوي معدل النمو طوال الفترة قيد الدراسة. إذا تم تشكيل قيمة السمة كمنتج خيارات فردية، ثم يتم استخدام الوسط الهندسي.
نظرًا لأن متوسط ​​معدل النمو هو متوسط ​​معامل النمو ، معبرًا عنه كنسبة مئوية ، فبالنسبة لسلسلة الديناميكيات المكافئة ، يتم تقليل العمليات الحسابية باستخدام المتوسط ​​الهندسي لحساب متوسط ​​معاملات النمو من تلك السلسلة باستخدام "طريقة السلسلة":

أين n هو عدد عوامل نمو السلسلة ؛
عقدة- عوامل نمو السلسلة ؛
Kb - معدل النمو الأساسي لكامل الفترة.
تحديد متوسط ​​عامل النمويمكن تبسيطها إذا كانت مستويات السلاسل الزمنية واضحة. نظرًا لأن ناتج عوامل نمو السلسلة يساوي العامل الأساسي ، يتم استبدال عامل النمو الأساسي في التعبير الجذري.
صيغة لتحديد متوسط ​​عامل النموبالنسبة لسلسلة الديناميات متساوية الأبعاد وفقًا "للطريقة الأساسية" ستكون على النحو التالي:

36.

ما هي المؤشرات المطلقة للتغيرات في مستوى المسلسل الذي تعرفه؟

يمكن تحديد كل هذه المؤشرات بالطريقة الأساسية عند المستوى فترة معينةمقارنة بالفترة (الأساسية) الأولى ، أو بطريقة متسلسلة - عند مقارنة مستويين من الفترات المتجاورة.

اكتب معادلات حسابية.

التغيير الأساسي المطلق هو الفرق بين المستوى المحدد والمستوى الأول من السلسلة ، والذي تحدده الصيغة

يوضح مقدار (بوحدات مؤشرات السلسلة) أن مستوى فترة واحدة (من الدرجة الأولى) أكثر أو أقل من المستوى الأول (الأساسي) ، وبالتالي يمكن أن يكون له علامة "+" (مع زيادة في المستويات) أو "-" (مع انخفاض في المستويات).

التغيير المطلق للسلسلة هو الفرق بين المستويات المحددة والسابقة للسلسلة ، ويتم تحديده بواسطة الصيغة

وهي توضح مقدار (بوحدات مؤشرات السلسلة) مستوى فترة واحدة (i-th) أكثر أو أقل من المستوى السابق ، ويمكن أن يكون لها علامة "+" أو "-".

اشرح كيف تعتمد طريقة الحساب على اختيار قاعدة المقارنة.

ما هي المؤشرات النسبية للتغيير في مستوى السلسلة التي تعرفها؟ اكتب معادلات حسابية.

التغيير النسبي الأساسي (معدل النمو الأساسي أو مؤشر الديناميكيات الأساسية) هو نسبة المستويات المحددة والمستويات الأولى من السلسلة ، التي تحددها الصيغة

التغيير النسبي للسلسلة (معدل نمو السلسلة أو مؤشر ديناميكيات السلسلة) هو نسبة المستويات المحددة والسابقة للسلسلة ، التي تحددها الصيغة

اشرح كيف تعتمد طريقة الحساب على اختيار قاعدة المقارنة.

يُظهر التغيير النسبي عدد المرات التي يكون فيها مستوى فترة معينة أكبر من مستوى أي فترة سابقة (بالنسبة إلى i> 1) أو أي جزء منها (بالنسبة إلى i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.

37.

ما هي متوسط ​​مؤشرات التغيير في مستوى المسلسل الذي تعرفه؟ اكتب الصيغ لحساب متوسط ​​النمو المطلق ومعدل النمو ومعدل النمو لمستويات السلسلة.

يُعرَّف متوسط ​​النمو المطلق بأنه متوسط ​​النمو المطلق لفترات زمنية متساوية في فترة واحدة. يتم حسابه بواسطة الصيغ: 1. استنادًا إلى بيانات السلسلة الخاصة بالنمو المطلق على مدى عدد من السنوات ، يتم حساب متوسط ​​النمو المطلق كمتوسط ​​حسابي بسيط:

أين n هو عدد الزيادات المطلقة في قانون السلطة في الفترة قيد الدراسة.

2. يتم حساب متوسط ​​الزيادة المطلقة من خلال الزيادة الأساسية المطلقة في حالة الفترات المتساوية

أين م - عدد مستويات سلسلة الديناميكيات في فترة الدراسة بما في ذلك المستوى الأول.

متوسط ​​معدل النمو هو خاصية تعميم مجانية لشدة التغيرات في مستويات سلسلة من الديناميكيات ويوضح عدد المرات التي يتغير فيها مستوى سلسلة من الديناميكيات في المتوسط ​​لكل وحدة زمنية.

كأساس ومعيار لصحة حساب متوسط ​​معدل النمو (النقصان) ، يتم استخدام مؤشر التعميم ، والذي يتم حسابه كمنتج لمعدلات نمو السلسلة التي تساوي معدل النمو طوال الفترة قيد الدراسة. إذا تم تشكيل القيمة المميزة كمنتج لخيارات فردية ، فسيتم استخدام المتوسط ​​الهندسي.

نظرًا لأن متوسط ​​معدل النمو هو متوسط ​​معامل النمو ، معبرًا عنه كنسبة مئوية ، فبالنسبة لسلسلة الديناميكيات المكافئة ، يتم تقليل العمليات الحسابية باستخدام المتوسط ​​الهندسي لحساب متوسط ​​معاملات النمو من تلك السلسلة باستخدام "طريقة السلسلة":

أين n هو عدد عوامل نمو السلسلة ؛

Кц - معاملات النمو المتسلسلة ؛

Kb - معدل النمو الأساسي لكامل الفترة.

يعد معدل التغيير (معدل النمو) في المستويات مؤشرًا نسبيًا يوضح عدد النسبة المئوية لمستوى معين أكثر (أو أقل) من مستوى آخر ، باعتباره أساسًا للمقارنة. يتم حسابه بطرح 100٪ من التغيير النسبي ، أي بالصيغة:

أو كنسبة مئوية من التغيير المطلق إلى المستوى الذي يتم على أساسه حساب التغيير المطلق (الأساس) ، أي وفقًا للصيغة:

.

ما هي عيوب هذه المؤشرات؟ في أي الحالات يكون من المناسب استخدامها؟ كيف يمكن معالجة هذه النواقص؟ اكتب معادلات لحساب المتوسطات التي تضمن الحفاظ على القيمة الإجمالية للسلسلة.

38.

كيف يتم تحديد نوع الاتجاه الرئيسي من خلال قيم مؤشرات التغيرات في مستويات السلسلة؟ أعط أمثلة.

يمكن تحديد الاتجاه العام للسلسلة الزمنية من خلال تمهيد السلاسل الزمنية باستخدام طريقة المتوسط ​​المتحرك. جوهر هذه التقنية هو أن المستويات المحسوبة (النظرية) يتم تحديدها من المستويات الأولية للسلسلة (البيانات التجريبية).

الشرط الرئيسي لتطبيق هذه الطريقة هو حساب روابط المتوسط ​​المتحرك (المتحرك) من هذا العدد من مستويات السلسلة التي تتوافق مع مدة ديناميكيات الدورة التي لوحظت في السلسلة.

علاقة الارتباط التجريبية

يمكن قياس تقارب أو قوة العلاقة بين ميزتين بمؤشر يسمى نسبة الارتباط التجريبية. يُطلق على هذا المؤشر اسم تجريبي ، حيث يمكن حسابه على أساس التجميع المعتاد حسب العامل والسمة الناتجة ، أي على أساس جدول الارتباط. يتم الحصول على الارتباط التجريبي من قاعدة إضافة التباين ، وفقًا لذلك ، أين
- التباين الكلي.
- التشتت بين المجموعات ؛
- إنتراغروب (متوسط ​​الخاص) التشتت. التباين بين المجموعات هو مقياس للتذبذب بسبب سمة العامل. متوسط ​​الفروق الجزئية هو مقياس للتذبذب بسبب جميع الميزات الأخرى (باستثناء العوامل). ثم تعبر النسبة عن حصة التقلبات الناشئة بسبب علامة العامل في التقلب الكلي. يسمى الجذر التربيعي لهذه النسبة بنسبة الارتباط التجريبية:
.

يشير هذا إلى القاعدة القائلة بأنه كلما زاد التباين بين المجموعات ، كلما زادت قوة سمة العامل التي تؤثر على تباين السمة الناتجة. يتم حساب نسب مكونات الفروق من بيانات جدول الارتباط باستخدام الصيغ التالية:

;
,

أين توجد المعدلات الخاصة ؛ - العوارية العامة - المجاميع حسب الميزة ; - المجاميع حسب الميزة ;
- عدد المشاهدات. نفس العلاقة تنطبق على القيم الشرطية
، التي تم الحصول عليها عن طريق التحويل العددي.

تسمى نسبة التباين نفسها (التعبير الجذري) بمعامل التحديد (وهي تساوي أيضًا مربع نسبة الارتباط التجريبية). تختلف نسبة الارتباط التجريبية على مدى واسع (من 0 إلى 1). إذا كانت تساوي الصفر ، فإن علامة العامل لا تؤثر على علامة الارتباط. اذا كان = 1 ، مما يعني أن العلامة الناتجة تعتمد كليًا على العامل الأول. إذا كانت نسبة الارتباط التجريبية جزءًا قريبًا من واحد ، فإنهم يتحدثون عن علاقة وثيقة بين السمات الفعالة والعاملية. إذا كان هذا الكسر صغيرًا (قريبًا من الصفر) ، فحينئذٍ يتحدث المرء عن ضعف الاتصال بينهما.

معامل الارتباط الخطي ودليل الارتباط

مقياس تقارب العلاقة بين سمتين متصلتين إحصائياً هو معامل الارتباط الخطي أو ببساطة معامل الارتباط. لها نفس المعنى مثل نسبة الارتباط التجريبية ، ولكن يمكن أن تأخذ كلا من القيم الإيجابية والسلبية. معامل الارتباط له تعبير رياضي صارم لعلاقة خطية. تشير القيمة الموجبة إلى وجود علاقة مباشرة بين السمات ، بينما تشير القيمة السالبة إلى العكس.

يتم حساب معامل الارتباط الزوجي في حالة الشكل الخطي للاتصال بواسطة الصيغة

,

وقيمة العينة الخاصة به - وفقًا للصيغة

من خلال عدد قليل من الملاحظات ، من الملائم حساب معامل ارتباط العينة باستخدام الصيغة التالية:

تتغير قيمة معامل الارتباط في الفترة الزمنية
.

في
هناك علاقة وظيفية بين المتغيرين ، متى
- اتصال وظيفي مباشر. اذا كان
، ثم قيم X و Y في العينة غير مرتبطة ؛ إذا كان نظام المتغيرات العشوائية
له توزيع طبيعي ثنائي الأبعاد ، ثم تكون الكميات X و Y مستقلة أيضًا.

إذا كان معامل الارتباط في الفاصل الزمني
، ثم هناك علاقة عكسية بين X و Y. يتم تأكيد ذلك أيضًا من خلال التحليل المرئي للمعلومات الأولية. في هذه الحالة ، يتم أخذ انحراف Y عن متوسط ​​القيمة بالإشارة المعاكسة.

إذا كان كل زوج من قيم X و Y غالبًا ما يكون أعلى (أسفل) القيم المتوسطة المقابلة في نفس الوقت ، فهناك ارتباط مباشر بين القيم ويكون معامل الارتباط في الفاصل الزمني
.

من ناحية أخرى ، إذا تسبب انحراف قيمة X عن القيمة المتوسطة في كثير من الأحيان في انحرافات قيمة Y إلى أسفل عن القيمة المتوسطة ، وكانت الانحرافات مختلفة طوال الوقت ، فيمكننا افتراض أن قيمة معامل الارتباط يميل إلى الصفر.

وتجدر الإشارة إلى أن قيمة معامل الارتباط لا تعتمد على وحدات القياس واختيار النقطة المرجعية. هذا يعني أنه إذا تم تقليل (زيادة) المتغيرين X و Y بمقدار K مرة أو بنفس الرقم C ، فلن يتغير معامل الارتباط.

لتبسيط حساب مقياس ضيق الارتباط ، غالبًا ما يتم استخدام مؤشر الارتباط ، والذي يتم تحديده بواسطة الصيغ التالية:

,
,

أين
- التباين المتبقي ، الذي يميز تباين السمة الناتجة تحت تأثير العوامل الأخرى غير المعتبرة.

الارتباط المتعدد

الارتباط المتعدد - اعتماد النتيجة وخصائص عامل أو أكثر مدرجة في الدراسة. يُطلق على مؤشر تقارب العلاقة بين النتيجة وميزات عامل أو أكثر اسم معامل الارتباط المتعدد أو التراكمي ويتم الإشارة إليه بواسطة R. يشير المعامل التراكمي إلى وجود علاقة خطية بين كل زوج من الميزات ، والتي يمكن أن تكون معبراً عنها باستخدام معاملات الارتباط المزدوجة. إذا كان هناك مقياس تراكمي لضيق العلاقة بين السمة الفعالة () وميزات العامل (و ) ، ثم يتم حساب معامل الارتباط التراكمي وفقًا للصيغة:

,

حيث تشير الرموز الفرعية إلى السمات التي تتم دراسة علاقة الزوج بينها.

في الصيغ الخاصة بحساب معاملات الارتباط المزدوجة ، فقط الرموز التي تشير إلى عامل أو آخر يتغير. لذلك ، إذا تم حساب معامل الارتباط بين الصيغة وحسابها ، فسيتم حساب معامل الارتباط بين و: ؛ بين و - لذا:

جزء التسوية

المهمة 31

    البيانات التالية متاحة لعشر شركات للفترة المشمولة بالتقرير:

الجدول 2

الشركات

متوسط ​​التكلفة السنوية لأصول الإنتاج الثابتة ، مليون روبل.

الناتج مليون روبل

لدراسة العلاقة بين حجم متوسط ​​التكلفة السنوية للأصول الثابتة والمخرجات ، احسب معادلة العلاقة الخطية.

2. على أساس البيانات المعطاة: أ) احسب: معامل الارتباط الخطي. ب) التحقق من صحة اختيار شكل الاتصال عن طريق حساب مؤشر الارتباط.

    باستخدام معالج جداول البيانات Microsoft Excel ، سنقوم ببناء ورقة عمل:

الجدول 3

حساب المبالغ لحساب معاملات معادلة الخط المستقيم

239.74 * 1236 = 539.1 توزيعات احتمالية ... اقتصادي التحليلات، تم حلها على أساس تراجع اقتصاديعارضات ازياء. لنفكر في y - علامة فعالة ، وعلامات عامل x. طُرق مترابط-تراجع التحليلات ...

  • برنامج تخصص "طرق الحاسب الآلي لتحليل البيانات الاجتماعية" (مقدمة في الإحصاء الرياضي وتحليل البيانات) للتوجيه 040200. 68 "علم الاجتماع"

    برنامج الانضباط

    التطبيقات. 11 3 2 6 مشتت التحليلات 9 2 2 5 مزدوج ومتعدد رجعي التحليلات 9 2 2 5 خصائص المعاملات ... بواسطة مستخدم SPSS 11.0 Siskov V.I. علاقه مترابطه التحليلاتفي اقتصادي ابحاث. م 1975. إدوس م ، ستانسفيلد ...

  • تحليل G. L. Savitskaya للنشاط الاقتصادي للمؤسسة

    وثيقة

    التميز بأحدث التقنيات اقتصادي ابحاث. التحليلاتيجب أن تكون معقدة. تعقيد البحث ... على مستوى متوسط ​​الإنتاج بالساعة مترابط-رجعي التحليلات. إلى عامل متعدد العوامل علاقه مترابطهنموذج متوسط ​​الإنتاج بالساعة ...

  • 3. يتم حساب نسبة الارتباط التجريبية بالصيغة

    التباين بين المجموعات ، والذي يميز قيمة مربع انحراف المجموعة يعني عن المعدل العام للسمة الفعالة.

    التباين الكلي ، ويظهر متوسط ​​قيمة الانحرافات التربيعية لقيمة الميزة الناتجة عن مستواها المتوسط.

    لنقم ببناء جدول لحساب التباين الكلي (انظر الجدول 8)

    الجدول 8

    جدول بيانات لتحديد التباين الكلي

    ن ، ص / ص مصاريف الطعام
    1 21 441
    2 16 256
    3 26,1 681,21
    4 28 784
    5 26 676
    6 22,5 506,25
    7 27,6 761,76
    8 35 1225
    9 23,9 571,21
    10 22,5 506,25
    11 15 225
    12 25,2 635,04
    13 29 841
    14 21,4 457,96
    15 24,9 620,01
    16 24,8 615,04
    17 16 256
    18 23,6 556,96
    19 27,2 739,84
    20 35 1225
    21 17 289
    22 23,8 566,44
    23 22,6 510,76
    24 25 625
    25 27 729
    26 30 900
    27 35 1225
    28 25,4 645,16
    29 27,2 739,84
    30 26,3 691,69
    المجموع 750 19502,42

    يتم حساب التباين الإجمالي للسمة الناتجة بواسطة الصيغة:

    =

    يتم حساب التشتت بين المجموعات بالصيغة:

    لنقم ببناء جدول إضافي لحساب البيانات (انظر الجدول 9)


    الجدول 9

    جدول البيانات لحساب التباين بين المجموعات

    رقم المجموعة عدد الأسر ، أجهزة الكمبيوتر الإنفاق على الغذاء ، ألف روبل
    المجموع المتوسط ​​لكل أسرة
    F
    1 28-40 3 48 16 -9 81 243
    2 40-52 5 105 21 -4 16 80
    3 52-64 12 300 25 0 0 0
    4 64-76 6 165 27,5 2,5 6,25 37,5
    5 76-88 4 132 33 8 64 256
    المجموع 30 750 616,5

    الخلاصة: العلاقة بين العوامل متقاربة جدا لأن يأخذ القيم من 0.9 إلى 0.99.

    معامل التحديد هو مربع الارتباط التجريبي. بالتالي،

    (81,9%)

    الخلاصة: الإنتاج في هذه المؤسسات يعتمد على 81.9٪ من إنتاجية رأس المال و 18.1٪ على عوامل أخرى.

    المهمة 3

    بناءً على نتائج المهمة 1 ، مع احتمال 0.9543 ، حدد:

    1. خطأ أخذ العينات لمتوسط ​​الدخل الإجمالي لكل فرد من أفراد الأسرة في السنة والحدود التي سيكون فيها في عموم السكان.

    2. خطأ في أخذ العينات من نصيب الأسر التي يقل دخلها الإجمالي عن 52 ألف روبل. وأكثر من مليون روبل. والحدود التي سيتم وضع الحصة العامة ضمنها.

    1. يتم تحديد خطأ أخذ العينات للمتوسط ​​بواسطة الصيغة:

    ، أين

    تباين العينة

    ن - حجم العينة ؛

    t هو معامل الثقة ، والذي يتم تحديده من جدول قيم دالة لابلاس المتكاملة لاحتمالية معينة. في هذه الحالة ، عند P = 0.954 ، تكون القيمة t = 2.

    N- عدد الوحدات في عموم السكان ، N = 6000 قطعة.

    دعنا نحسب التباين. سيتم تقديم البيانات في شكل جدول (انظر الجدول 11).

    الجدول 11

    بيانات لحساب تشتت مستوى العائد على الأصول

    رقم المجموعة تجميع الأسرة حسب الدخل الإجمالي عدد الأسر ، أجهزة الكمبيوتر
    F
    1 28-40 3 34 -25,1 630,01 1890,03
    2 40-52 5 46 -13,1 171,61 858,05
    3 52-64 12 58 -1,1 1,21 14,52
    4 64-76 6 70 10,9 118,81 712,86
    5 76-88 4 82 22,9 524,41 2097,64
    المجموع 30 5573,1

    علاقة الارتباط التجريبية

    يتم استخدام العديد من المؤشرات لقياس مدى قرب الارتباط. مع اتصال الزوج ، يتم تحديد ضيق الاتصال ، أولاً وقبل كل شيء ، من خلال نسبة الارتباط ، والتي يُشار إليها بـ η. مربع نسبة الارتباط هو نسبة التباين بين المجموعات للسمة الناتجة ، والتي تعبر عن تأثير الاختلافات في سمة عامل التجميع على متوسط ​​قيمة السمة الناتجة ، إلى التباين الكلي للسمة الناتجة ، والتي تعبر عن تأثير الاختلافات في سمة عامل التجميع على متوسط ​​قيمة السمة الناتجة ، تأثير جميع الأسباب والشروط عليه. يسمى مربع نسبة الارتباط بمعامل التحديد.

    ظواهر وعلاماتها: ________________ أو حتمية صارمة

    حيث k هو عدد المجموعات

    N هو عدد الملاحظات

    y i - القيم الأولية للميزة الفعالة

    y j - متوسط ​​قيم السمة الفعالة لهذه المجموعة

    y هو متوسط ​​قيمة الميزة

    f j هو حجم المجموعة

    تُستخدم الصيغة أعلاه عند حساب مؤشر قرب الاتصال لتجميع تحليلي. عند حساب نسبة الارتباط حسب مستوى الاتصال ، يتم استخدام الصيغة التالية:

    مجموع المربعات في البسط هو تباين السمة الناتجة y الموضح بالعلاقة مع العامل x (العوامل). يتم حسابه من البيانات الفردية التي تم الحصول عليها لكل وحدة من السكان بناءً على معادلة الانحدار.

    إذا تم اختيار المعادلة بشكل غير صحيح أو حدث خطأ عند حساب معلماتها ، فقد يكون مجموع المربعات في البسط أكبر مما هو عليه في المقام ، وستفقد النسبة المعنى الذي ينبغي أن تحمله. لتجنب نتيجة خاطئة ، من الأفضل حساب نسبة الارتباط باستخدام الصيغة التالية:

    تستند هذه الصيغة إلى القاعدة المعروفة لتوسيع مجاميع الانحرافات التربيعية عند تجميع السكان:

    د مشترك= د intergr+ د إنتراغر

    وفقًا لهذه القاعدة ، بدلاً من التباين بين المجموعات (العامل) ، يمكنك استخدام الفرق:

    د مشتركإنتراغر

    ما يعطي:

    عند حساب η ليس عن طريق التجميع ، ولكن بواسطة معادلة الارتباط (معادلة الانحدار) ، نستخدم الصيغة. في هذه الحالة ، تتم كتابة قاعدة التحلل لمجموع الانحرافات التربيعية للميزة الناتجة كـ

    مجموع D \ u003d D الأساسية + D بقية

    النقطة الأكثر أهمية التي يجب أن يتعلمها الآن أي شخص يريد تطبيق طريقة تحليل الارتباط والانحدار بشكل صحيح هي تفسير الصيغتين (1.2) و (1.3). يقرأ هذا الحكم:

    تقيس معادلة الارتباط العلاقة بين تباين الميزة الناتجة وتغير ميزة (ميزات) العامل. تقيس مقاييس ضيق الاتصال نسبة التباين في السمة الناتجة ، والتي ترتبط باختلاف ميزة العامل (الميزات).

    | المحاضرة القادمة ==>

    تقيس نسبة الارتباط التجريبية مقدار التقلب الكلي للسمة الناتجة بسبب العامل المدروس. يتراوح متوسط ​​الارتباط التجريبي من 0 إلى 1.

    عادة ما يوجد ارتباط تجريبي في الأنواع التاليةمهام:

    • 1) عندما يكون من الضروري إنتاج تجميع تحليلي لسلسلتي بيانات X و Y
    • 2) تم بالفعل التجميع ، من الضروري التحقق من قاعدة إضافة التباينات
    • 3) لسلسلتي بيانات X و Y ، من الضروري إيجاد معادلة الانحدار وتقييم أهميتها

    صيغة التباين ميزة بديلة

    بناءً على ما سبق ، يمكننا اشتقاق صيغة لإيجاد تباين ميزة بديلة إذا عرفنا النسبة المئوية لمثل هذه الميزة في العينة الإجمالية.

    في البداية ، نفترض أن الميزة تأخذ قيمتين فقط.

    وبالتالي ، فإن مجموع نسبة العناصر التي تحتوي فيها عناصر السلسلة الإحصائية على قيمة السمة "لا" وعناصر السلسلة التي لها قيمة السمة "نعم" تساوي واحدًا.

    للعثور على متوسط ​​قيمة السلسلة ، نقوم باستبدال قيم الميزات البديلة (0 و 1) في الصيغة لإيجاد قيمة المتوسط ​​المرجح للسلسلة الإحصائية. من حيث ، من الواضح تمامًا ، أنه سيكون هناك وحدة في المقام ، وقيمة النسبة المئوية للعناصر "1" في البسط. أي بالضبط النسبة المئوية لقيمة العناصر ذات السمة "1". (الصيغة 2)

    معادلة التباين هي المتوسط ​​المرجح للانحرافات التربيعية لكل قيمة في سلسلة البيانات. (الصيغة 3)

    نظرًا لأن البيانات في سلسلتنا تحتوي على نوعين فقط من القيم - "0" و "1" ، فإن صيغة إيجاد التباين لسلسلة ذات ميزة بديلة يتم تقليلها إلى الصيغة 4. الشرح. نظرًا لأننا استنتجنا للتو أن متوسط ​​العينة يساوي p (الصيغة 2) ، فإن قيمة مربع الفرق بين القيمة (0/1) والقيمة المتوسطة ، وفقًا للصيغة 1 ، ستكون (1- p) 2 في الحالة الأولى ، وفي الحالة الثانية (1-q) 2 ، طبق الآن النتيجة الطبيعية من الصيغة الأولى: q = 1 - p ، p = 1- q. نحصل على p2 و q2. وفقًا لذلك ، فإن نسبة القيمتين "0" و "1" تساوي p و q ، نتيجة لذلك ، في البسط ويتضح q2 p و p2 q. مجموع مشاركات ميزات القيمتين "0" و "1" وفقًا للصيغة 1 يساوي 1. نتيجة لذلك ، تأخذ الصيغة 4 القيمة pq ، والتي ستكون مساوية لقيمة التباين لـ الميزة البديلة. بناءً على القيمة التي تم العثور عليها لتباين الميزة البديلة ، سنجد الانحراف المعياري (الصيغة 5). بوضع القيمة من الصيغة 1 في الصيغة 5 ، نحصل على صيغة الانحراف المعياري لتباين سلسلة ذات ميزة بديلة.

    
    قمة