ค่าสัมประสิทธิ์การตัดสินใจเชิงประจักษ์แสดงให้เห็น สำหรับตัวอย่างของเรา ความสัมพันธ์สหสัมพันธ์เชิงประจักษ์
ความแปรปรวนภายในกลุ่มสำหรับประชากรหมายถึงอะไร สูตรคำนวณมันคืออะไร? ยกตัวอย่าง. ความแปรปรวนของประชากรระหว่างกลุ่มหมายถึงอะไร สูตรคำนวณมันคืออะไร? ยกตัวอย่าง.
ความแปรปรวนภายในกลุ่ม () บ่งบอกถึงความแปรผันแบบสุ่มที่ไม่ขึ้นอยู่กับลักษณะเฉพาะที่เป็นพื้นฐานของการจัดกลุ่ม
, ที่ไหน
ค่าเฉลี่ยกลุ่ม
ความแปรปรวนภายในกลุ่มโดยเฉลี่ยได้รับการคำนวณดังนี้ ขั้นแรก ความแปรปรวนสำหรับแต่ละกลุ่มจะถูกคำนวณ () จากนั้นจึงคำนวณค่าเฉลี่ยความแปรปรวนภายในกลุ่ม:
ระบุลักษณะการเปลี่ยนแปลงที่เป็นระบบเช่น ความแตกต่างในคุณค่าของคุณลักษณะที่ศึกษาซึ่งเป็นพื้นฐานของการจัดกลุ่ม ความแปรปรวนนี้คำนวณโดยใช้สูตร
, ที่ไหน
ค่าเฉลี่ยสำหรับกลุ่มแยกต่างหาก
ฉัน- จำนวนยูนิตในกลุ่ม
- ค่าเฉลี่ยเลขคณิตโดยรวมของประชากรทั้งหมดที่อยู่ระหว่างการศึกษา
ความแปรปรวนทั้งสามประเภทมีความสัมพันธ์กัน: ความแปรปรวนรวมเท่ากับผลรวมของค่าเฉลี่ยความแปรปรวนภายในกลุ่มและความแปรปรวนระหว่างกลุ่ม:
อัตราส่วนนี้สะท้อนถึงกฎหมายที่เรียกว่า กฎสำหรับการบวกผลต่าง.
20.
ความแปรปรวนของประชากรทั้งหมดหมายถึงอะไร? สูตรคำนวณมันคืออะไร? วิธีการแบ่งกลุ่มส่งผลต่อค่าความแปรปรวนทั้งหมดหรือไม่? ยกตัวอย่าง.
ความแปรปรวนรวม () แสดงถึงความแปรผันของคุณลักษณะของประชากรทั้งหมดภายใต้อิทธิพลของปัจจัยทั้งหมดที่ทำให้เกิดการเปลี่ยนแปลงนี้ ค่านี้ถูกกำหนดโดยสูตร
, ที่ไหน
ค่าเฉลี่ยเลขคณิตโดยรวมของประชากรทั้งหมดที่ศึกษา
ในทางกลับกัน ความแปรปรวนรวมจะเท่ากับผลรวมของค่าเฉลี่ยความแปรปรวนภายในกลุ่มและความแปรปรวนระหว่างกลุ่ม:
อัตราส่วนนี้สะท้อนถึงกฎหมายที่เรียกว่า กฎสำหรับการบวกผลต่าง.. ตามกฎการเพิ่มความแปรปรวน จึงเป็นไปได้ที่จะระบุได้ว่าส่วนใดของความแปรปรวนทั้งหมดที่ได้รับอิทธิพลจากคุณลักษณะตัวประกอบที่เป็นพื้นฐานของการจัดกลุ่ม
ยิ่งส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนรวมสูงเท่าใด อิทธิพลของคุณลักษณะตัวประกอบ (หมวดหมู่) ที่มีต่อผลลัพธ์ (เอาต์พุต) ก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น
การแบ่งส่วนนี้มีลักษณะเฉพาะด้วยสัมประสิทธิ์การตัดสินใจเชิงประจักษ์:
เพื่อประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะในเชิงคุณภาพ จะใช้ความสัมพันธ์ของ Chaddock
0-0,2 |
0,2-0,3 |
0,3-0,5 |
0,5-0,7 |
0,7-0,9 |
0,9-0,99 |
|||
พลังแห่งการเชื่อมต่อ |
ไม่มา |
อ่อนแอมาก |
อ่อนแอ |
ปานกลาง |
เห็นได้ชัดเจน |
แน่น |
แน่นมาก |
การทำงาน- เงินสด |
21.
ค่าสัมประสิทธิ์การตัดสินใจแสดงอะไร? สูตรคำนวณมันคืออะไร? ตัวบ่งชี้นี้วัดในหน่วยใด? ค่าที่เป็นไปได้ของตัวบ่งชี้นี้คืออะไร? ความสัมพันธ์เชิงประจักษ์แสดงให้เห็นอะไร? สูตรคำนวณมันคืออะไร? ตัวบ่งชี้นี้วัดในหน่วยใด? ค่าที่เป็นไปได้ของตัวบ่งชี้นี้คืออะไร?
สัมประสิทธิ์เชิงประจักษ์ของการตัดสินใจ () แสดงลักษณะส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด:
รับค่า -1 ถึง 1 และแสดงให้เห็นว่าลักษณะเฉพาะในการรวมมีความแปรผันมากน้อยเพียงใดเนื่องจากปัจจัยการจัดกลุ่ม
ความแปรปรวนระหว่างกลุ่ม
ผลต่างรวม
กำหนดโดยสูตร:
ยอมรับค่า -1 ถึง 1
ตัวอย่าง
กลุ่ม |
จำนวนต้นในกลุ่ม ชิ้น |
ผลผลิตรวมเฉลี่ยในราคาที่เทียบเคียงได้ล้านรูเบิล |
ตอนนี้ให้เราหาค่าเฉลี่ย การกระจายตัวทั้งหมด และการกระจายตัวระหว่างกลุ่มของผลผลิตรวมในราคาพืชที่เทียบเคียงได้:
ล้านรูเบิล;
ล้าน 2 บาท;
ล้าน ถู.2.
ค่าสัมประสิทธิ์การตัดสินใจจะเท่ากับ:
เป็นผลให้อัตราส่วนสหสัมพันธ์เชิงประจักษ์จะเท่ากับ:
ค่าที่คำนวณได้ของอัตราส่วนสหสัมพันธ์เชิงประจักษ์บ่งชี้ถึงความเชื่อมโยงทางสถิติที่ค่อนข้างสูงระหว่างผลผลิตรวมในราคาที่เทียบเคียงได้กับต้นทุนเฉลี่ยต่อปีของสินทรัพย์การผลิตคงที่ของโรงงาน
22.
สถิติการทดสอบคำนวณอย่างไรในการวิเคราะห์ความแปรปรวนทางเดียว กฎการกระจายตัวของมันคืออะไรหากสมมติฐานหลักเป็นจริง? อะไรเป็นตัวกำหนดพารามิเตอร์ของกฎหมายนี้? การตัดสินใจในการวิเคราะห์ความแปรปรวนทางเดียวโดยพิจารณาจากค่าที่คำนวณได้ของสถิติการทดสอบเป็นอย่างไร
วัตถุประสงค์ของการวิเคราะห์ความแปรปรวนคือเพื่อศึกษาอิทธิพลของปัจจัยตั้งแต่หนึ่งปัจจัยขึ้นไปต่อคุณลักษณะที่กำลังพิจารณา
การวิเคราะห์ความแปรปรวนทางเดียวจะใช้ในกรณีที่มีตัวอย่างอิสระตั้งแต่สามตัวอย่างขึ้นไป ซึ่งได้มาจากประชากรกลุ่มเดียวกันโดยการเปลี่ยนปัจจัยอิสระบางตัว ซึ่งไม่มีการวัดเชิงปริมาณด้วยเหตุผลบางประการ
ตามเกณฑ์ คุณต้องใช้เกณฑ์ของฟิชเชอร์:
., ที่ไหน
ถาม 1 – ผลรวมของการเบี่ยงเบนกำลังสองของค่าเฉลี่ยตัวอย่างจากค่าเฉลี่ยโดยรวม
ถาม 2 – ผลรวมของการเบี่ยงเบนกำลังสองของค่าที่สังเกตได้จากค่าเฉลี่ยตัวอย่าง
หากค่าที่คำนวณได้ของเกณฑ์ฟิชเชอร์น้อยกว่าค่าตารางก็ไม่มีเหตุผลที่จะเชื่อได้ว่าปัจจัยอิสระมีอิทธิพลต่อการแพร่กระจายของค่าเฉลี่ย ( เหล่านั้น. สมมติฐานไม่ได้รับการยืนยัน- มิฉะนั้น ปัจจัยอิสระจะมีผลกระทบอย่างมีนัยสำคัญต่อการแพร่กระจายของค่าเฉลี่ย ( สมมติฐานเป็นจริง).
23-25.
1. สำหรับช่วงเวลาที่เท่ากัน ให้ใช้ค่าเฉลี่ยเลขคณิตอย่างง่าย:
โดยที่ y คือระดับสัมบูรณ์ของซีรีส์
n- จำนวนระดับของซีรีส์
2. สำหรับช่วงเวลาที่ไม่เท่ากัน ให้ใช้ค่าเฉลี่ยเลขคณิตถ่วงน้ำหนัก:
คุณอยู่ที่ไหน 1,...,уn - ระดับของซีรีย์ไดนามิก;
ที1,... tn - น้ำหนัก, ระยะเวลาของช่วงเวลา
ระดับโมเมนต์เฉลี่ย
พลศาสตร์คำนวณโดยสูตร:
1. ด้วยระดับที่เท่ากัน คำนวณโดยใช้สูตรของอนุกรมโมเมนต์ตามลำดับเวลาเฉลี่ย:
คุณอยู่ที่ไหน 1,...,уn - ระดับของช่วงเวลาที่ทำการคำนวณ
n- จำนวนระดับ;
n-1 - ระยะเวลาของช่วงเวลา
2. ซี ไม่เท่ากันระดับคำนวณโดยใช้สูตรถัวเฉลี่ยถ่วงน้ำหนักตามลำดับเวลา:
คุณอยู่ที่ไหน 1,...,уn - ระดับของซีรีย์ไดนามิก;
ที- ช่วงเวลาระหว่างระดับที่อยู่ติดกัน
ในปัญหาทางสถิติ
การเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ย หมายถึงค่าเฉลี่ยของการเพิ่มขึ้นสัมบูรณ์ในช่วงเวลาที่เท่ากันในช่วงเวลาหนึ่ง คำนวณโดยใช้สูตร: 1. การใช้ข้อมูลลูกโซ่เกี่ยวกับการเติบโตแบบสัมบูรณ์ในช่วงหลายปีที่ผ่านมา การเติบโตแบบสัมบูรณ์โดยเฉลี่ยจะคำนวณเป็นค่าเฉลี่ยเลขคณิตอย่างง่าย:
ที่ไหน n คือจำนวนการเพิ่มสัมบูรณ์ของกฎกำลังในช่วงเวลาที่ศึกษา
2.
มีการคำนวณการเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยผ่านการเพิ่มขึ้นสัมบูรณ์ขั้นพื้นฐานในกรณีที่มีช่วงเวลาเท่ากัน
ที่ไหน m คือจำนวนระดับของอนุกรมไดนามิกในช่วงระยะเวลาการศึกษา รวมถึงระดับฐานด้วย
อัตราการเติบโตเฉลี่ย
เป็นลักษณะทั่วไปที่เป็นอิสระของความรุนแรงของการเปลี่ยนแปลงในระดับชุดของไดนามิก
และแสดงจำนวนครั้งที่ระดับของอนุกรมไดนามิกเปลี่ยนแปลงโดยเฉลี่ยต่อหน่วยเวลา
เป็นพื้นฐานและเกณฑ์สำหรับความถูกต้องในการคำนวณอัตราการเติบโตเฉลี่ย (ลดลง) มีการใช้ตัวบ่งชี้ทั่วไปซึ่งคำนวณเป็นผลคูณของอัตราการเติบโตของลูกโซ่เท่ากับอัตราการเติบโตตลอดระยะเวลาที่อยู่ระหว่างการพิจารณา หากค่าแอตทริบิวต์ถูกสร้างขึ้นเป็นผลิตภัณฑ์ ตัวเลือกส่วนบุคคลแล้วใช้ค่าเฉลี่ยเรขาคณิต
เนื่องจากอัตราการเติบโตเฉลี่ยคือค่าสัมประสิทธิ์การเติบโตเฉลี่ยซึ่งแสดงเป็นเปอร์เซ็นต์ ดังนั้นสำหรับอนุกรมไดนามิกที่เท่ากัน การคำนวณโดยใช้ค่าเฉลี่ยทางเรขาคณิตจึงลงมาเพื่อคำนวณค่าสัมประสิทธิ์การเติบโตเฉลี่ยจากลูกโซ่โดยใช้ "วิธีลูกโซ่":
ที่ไหน n คือจำนวนสัมประสิทธิ์การเติบโตของลูกโซ่
เคทีเอส- ค่าสัมประสิทธิ์การเติบโตของลูกโซ่
Kb คืออัตราการเติบโตพื้นฐานตลอดระยะเวลา
การกำหนดอัตราการเติบโตเฉลี่ยสามารถทำให้ง่ายขึ้นได้หากระดับอนุกรมเวลาชัดเจน เนื่องจากผลคูณของค่าสัมประสิทธิ์การเติบโตของลูกโซ่เท่ากับค่าฐาน ปัจจัยการเจริญเติบโตฐานจึงถูกแทนที่เป็นนิพจน์ราก
สูตรกำหนดอัตราการเติบโตเฉลี่ยสำหรับชุดไดนามิกที่เท่ากันตาม "วิธีการพื้นฐาน" จะเป็นดังนี้:
36.
คุณรู้ตัวบ่งชี้ที่ชัดเจนของการเปลี่ยนแปลงในระดับของซีรีส์อะไรบ้าง?
ตัวชี้วัดทั้งหมดนี้สามารถกำหนดได้ด้วยวิธีพื้นฐานเมื่อถึงระดับ ของช่วงเวลานี้ถูกเปรียบเทียบกับคาบแรก (พื้นฐาน) หรือในลักษณะลูกโซ่ - เมื่อมีการเปรียบเทียบคาบที่อยู่ติดกันสองระดับ
เขียนสูตรการคำนวณ
การเปลี่ยนแปลงแบบสัมบูรณ์ขั้นพื้นฐานคือความแตกต่างระหว่างระดับเฉพาะและระดับแรกของชุดข้อมูล ซึ่งกำหนดโดยสูตร
มันแสดงให้เห็นว่า (ในหน่วยของตัวบ่งชี้แบบอนุกรม) ระดับของช่วงหนึ่ง (i-th) มากกว่าหรือน้อยกว่าระดับแรก (พื้นฐาน) มากเพียงใด และดังนั้นจึงสามารถมีเครื่องหมาย "+" ได้ (โดยมีระดับเพิ่มขึ้น ) หรือ “–” (โดยมีระดับลดลง)
การเปลี่ยนแปลงแบบสัมบูรณ์ของลูกโซ่คือความแตกต่างระหว่างระดับเฉพาะและระดับก่อนหน้าของอนุกรม ซึ่งกำหนดโดยสูตร
โดยจะแสดงจำนวน (ในหน่วยของตัวบ่งชี้แบบอนุกรม) ระดับของช่วงหนึ่ง (i-th) มากกว่าหรือน้อยกว่าระดับก่อนหน้า และอาจมีเครื่องหมาย “+” หรือ “–” ได้
อธิบายว่าวิธีการคำนวณขึ้นอยู่กับการเลือกฐานการเปรียบเทียบอย่างไร
คุณรู้ตัวบ่งชี้ที่เกี่ยวข้องของการเปลี่ยนแปลงในระดับของซีรีส์อะไรบ้าง เขียนสูตรการคำนวณ
การเปลี่ยนแปลงสัมพัทธ์พื้นฐาน (อัตราการเติบโตพื้นฐานหรือดัชนีไดนามิกพื้นฐาน) คืออัตราส่วนของระดับเฉพาะและระดับแรกของอนุกรมที่กำหนดโดยสูตร
การเปลี่ยนแปลงสัมพัทธ์ของโซ่ (อัตราการเติบโตของโซ่หรือดัชนีไดนามิกของโซ่) คืออัตราส่วนของระดับเฉพาะและระดับก่อนหน้าของอนุกรม ซึ่งกำหนดโดยสูตร
อธิบายว่าวิธีคำนวณขึ้นอยู่กับการเลือกฐานการเปรียบเทียบอย่างไร
การเปลี่ยนแปลงสัมพัทธ์แสดงจำนวนครั้งที่ระดับของช่วงเวลาที่กำหนดมากกว่าระดับของช่วงเวลาก่อนหน้าใดๆ (สำหรับ i >1) หรือส่วนใดของช่วงเวลานั้น (สำหรับ i<1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения(если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.
37.
คุณรู้ตัวบ่งชี้การเปลี่ยนแปลงในระดับของซีรีส์โดยเฉลี่ยเท่าใด เขียนสูตรคำนวณการเติบโตสัมบูรณ์เฉลี่ย อัตราการเติบโต และอัตราการเติบโตของระดับอนุกรม
การเติบโตสัมบูรณ์โดยเฉลี่ยหมายถึงค่าเฉลี่ยของการเติบโตสัมบูรณ์ในช่วงเวลาเท่ากันในช่วงเวลาหนึ่ง คำนวณโดยใช้สูตร: 1. การใช้ข้อมูลลูกโซ่เกี่ยวกับการเติบโตแบบสัมบูรณ์ในช่วงหลายปีที่ผ่านมา การเติบโตแบบสัมบูรณ์โดยเฉลี่ยจะคำนวณเป็นค่าเฉลี่ยเลขคณิตอย่างง่าย:
ที่ไหน n คือจำนวนการเพิ่มสัมบูรณ์ของกฎกำลังในช่วงเวลาที่ศึกษา
2. การเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยจะคำนวณผ่านการเพิ่มขึ้นสัมบูรณ์ฐานในกรณีที่มีช่วงเวลาเท่ากัน
ที่ไหน m คือจำนวนระดับของอนุกรมไดนามิกในช่วงระยะเวลาการศึกษา รวมถึงระดับฐานด้วย
อัตราการเติบโตเฉลี่ยเป็นลักษณะทั่วไปที่เป็นอิสระของความรุนแรงของการเปลี่ยนแปลงในระดับของชุดของไดนามิก และแสดงจำนวนครั้งที่ระดับของชุดของการเปลี่ยนแปลงโดยเฉลี่ยต่อหน่วยเวลา
เป็นพื้นฐานและเกณฑ์สำหรับความถูกต้องในการคำนวณอัตราการเติบโตเฉลี่ย (ลดลง) มีการใช้ตัวบ่งชี้ทั่วไปซึ่งคำนวณเป็นผลคูณของอัตราการเติบโตของลูกโซ่เท่ากับอัตราการเติบโตตลอดระยะเวลาที่อยู่ระหว่างการพิจารณา หากค่าของลักษณะเฉพาะเกิดขึ้นเป็นผลคูณของตัวเลือกแต่ละตัว ระบบจะใช้ค่าเฉลี่ยเรขาคณิต
เนื่องจากอัตราการเติบโตเฉลี่ยคือค่าสัมประสิทธิ์การเติบโตเฉลี่ยซึ่งแสดงเป็นเปอร์เซ็นต์ ดังนั้นสำหรับอนุกรมไดนามิกที่เท่ากัน การคำนวณโดยใช้ค่าเฉลี่ยทางเรขาคณิตจึงลงมาเพื่อคำนวณค่าสัมประสิทธิ์การเติบโตเฉลี่ยจากลูกโซ่โดยใช้ "วิธีลูกโซ่":
ที่ไหน n คือจำนวนสัมประสิทธิ์การเติบโตของลูกโซ่
Kc - สัมประสิทธิ์การเติบโตของโซ่
Kb คืออัตราการเติบโตพื้นฐานตลอดระยะเวลา
อัตราการเปลี่ยนแปลง (อัตราการเติบโต) ของระดับเป็นตัวบ่งชี้สัมพัทธ์ที่แสดงว่าระดับที่กำหนดนั้นมากกว่า (หรือน้อยกว่า) กว่าระดับอื่นกี่เปอร์เซ็นต์ โดยถือเป็นพื้นฐานของการเปรียบเทียบ คำนวณโดยการลบ 100% จากการเปลี่ยนแปลงสัมพัทธ์ นั่นคือโดยใช้สูตร:
หรือเป็นเปอร์เซ็นต์ของการเปลี่ยนแปลงสัมบูรณ์ในระดับที่คำนวณการเปลี่ยนแปลงสัมบูรณ์ (ระดับพื้นฐาน) นั่นคือตามสูตร:
.
ตัวชี้วัดเหล่านี้มีข้อเสียอะไรบ้าง? แนะนำให้ใช้ในกรณีใดบ้าง? ข้อบกพร่องเหล่านี้จะถูกกำจัดได้อย่างไร? เขียนสูตรคำนวณตัวบ่งชี้ค่าเฉลี่ยเพื่อรักษามูลค่ารวมของอนุกรม
38.
จะกำหนดประเภทของแนวโน้มหลักตามค่าของตัวบ่งชี้การเปลี่ยนแปลงในระดับซีรีส์ได้อย่างไร? ยกตัวอย่าง.
การระบุแนวโน้มทั่วไปของอนุกรมเวลาสามารถทำได้โดยการปรับอนุกรมเวลาให้เรียบโดยใช้วิธีค่าเฉลี่ยเคลื่อนที่ สาระสำคัญของเทคนิคนี้คือระดับที่คำนวณได้ (ทางทฤษฎี) จะถูกกำหนดจากระดับเริ่มต้นของอนุกรม (ข้อมูลเชิงประจักษ์)
เงื่อนไขหลักในการใช้วิธีนี้คือการคำนวณการเชื่อมโยงของค่าเฉลี่ยเคลื่อนที่ (เคลื่อนที่) จากระดับต่างๆ ของอนุกรมที่สอดคล้องกับระยะเวลาของรอบที่สังเกตได้ในอนุกรมไดนามิก
ความสัมพันธ์เชิงประจักษ์
ความใกล้ชิดหรือความแข็งแกร่งของความสัมพันธ์ระหว่างสองลักษณะสามารถวัดได้ด้วยดัชนีที่เรียกว่าอัตราส่วนสหสัมพันธ์เชิงประจักษ์ ตัวบ่งชี้นี้เรียกว่าเชิงประจักษ์เนื่องจากสามารถคำนวณได้บนพื้นฐานของการจัดกลุ่มปกติตามปัจจัยและคุณลักษณะผลลัพธ์ กล่าวคือ บนพื้นฐานของตารางความสัมพันธ์ ความสัมพันธ์สหสัมพันธ์เชิงประจักษ์ได้มาจากกฎสำหรับการบวกความแปรปรวน ตามที่ , ที่ไหน - การกระจายตัวทั้งหมด
- การกระจายตัวระหว่างกลุ่ม
- การกระจายตัวภายในกลุ่ม (ค่าเฉลี่ยของส่วนตัว) ความแปรปรวนระหว่างกลุ่มคือการวัดความแปรปรวนเนื่องจากคุณลักษณะของปัจจัย ค่าเฉลี่ยของความแปรปรวนบางส่วนเป็นการวัดความแปรปรวนเนื่องจากคุณลักษณะอื่นๆ ทั้งหมด (ยกเว้นแฟคทอเรียล) จากนั้นอัตราส่วนจะแสดงส่วนแบ่งของความแปรปรวนที่เกิดขึ้นเนื่องจากลักษณะของปัจจัยในความแปรปรวนทั้งหมด รากที่สองของอัตราส่วนนี้เรียกว่าอัตราส่วนสหสัมพันธ์เชิงประจักษ์:
.
ดังนั้นกฎจึงเป็นไปตามที่ว่ายิ่งการกระจายตัวระหว่างกลุ่มมากเท่าใด คุณลักษณะของตัวประกอบก็จะยิ่งมีอิทธิพลต่อความแปรผันของคุณลักษณะที่เป็นผลลัพธ์มากขึ้นเท่านั้น ส่วนประกอบของอัตราส่วนความแปรปรวนคำนวณจากข้อมูลในตารางความสัมพันธ์โดยใช้สูตรต่อไปนี้:
;
,
ค่าเฉลี่ยบางส่วนอยู่ที่ไหน - ค่าเฉลี่ยโดยรวม
- ผลลัพธ์ตามคุณลักษณะ
;
- ผลลัพธ์ตามคุณลักษณะ
;
- จำนวนการสังเกต ความสัมพันธ์เดียวกันนี้ถือเป็นค่าที่มีเงื่อนไข
ได้จากการแปลงตัวเลข
อัตราส่วนของความแปรปรวนนั้นเอง (การแสดงออกที่รุนแรง) เรียกว่าสัมประสิทธิ์การกำหนด (ซึ่งเท่ากับกำลังสองของอัตราส่วนสหสัมพันธ์เชิงประจักษ์) อัตราส่วนสหสัมพันธ์เชิงประจักษ์แตกต่างกันไปอย่างมาก (ตั้งแต่ 0 ถึง 1) ถ้ามันเท่ากับศูนย์ เครื่องหมายตัวประกอบจะไม่ส่งผลต่อเครื่องหมายความสัมพันธ์ ถ้า =1 ซึ่งหมายความว่าคุณลักษณะผลลัพธ์นั้นขึ้นอยู่กับแฟกทอเรียลโดยสมบูรณ์ หากความสัมพันธ์สหสัมพันธ์เชิงประจักษ์แสดงถึงเศษส่วนที่ใกล้เคียงกับเอกภาพ แสดงว่ามีความสัมพันธ์ใกล้ชิดระหว่างปัจจัยและคุณลักษณะผลลัพธ์ หากเศษส่วนนี้น้อย (ใกล้ศูนย์) แสดงว่ามีความสัมพันธ์ที่อ่อนแอระหว่างเศษส่วน
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นและดัชนีสหสัมพันธ์
การวัดความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะที่เกี่ยวข้องกันทางสถิติสองลักษณะคือค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นหรือเพียงค่าสัมประสิทธิ์สหสัมพันธ์ มีความหมายเหมือนกับอัตราส่วนสหสัมพันธ์เชิงประจักษ์ แต่สามารถใช้ได้ทั้งความหมายเชิงบวกและเชิงลบ ค่าสัมประสิทธิ์สหสัมพันธ์มีนิพจน์ทางคณิตศาสตร์ที่เข้มงวดสำหรับความสัมพันธ์เชิงเส้น ค่าบวกจะบ่งบอกถึงความสัมพันธ์โดยตรงระหว่างคุณลักษณะ ค่าลบจะบ่งบอกถึงความสัมพันธ์แบบผกผัน
ค่าสัมประสิทธิ์สหสัมพันธ์คู่ในกรณีของรูปแบบการสื่อสารเชิงเส้นคำนวณโดยใช้สูตร
,
และค่าตัวอย่าง - ตามสูตร
ด้วยการสังเกตเพียงเล็กน้อย สะดวกในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างโดยใช้สูตรต่อไปนี้:
ค่าของสัมประสิทธิ์สหสัมพันธ์จะแตกต่างกันไปตามช่วงเวลา .
ที่ มีความสัมพันธ์เชิงฟังก์ชันระหว่างสองตัวแปรเมื่อใด
- การเชื่อมต่อการทำงานโดยตรง ถ้า
จากนั้นค่าของ X และ Y ในกลุ่มตัวอย่างจะไม่สัมพันธ์กัน ในกรณีระบบตัวแปรสุ่ม
มีการแจกแจงแบบปกติสองมิติ จากนั้นค่าของ X และ Y จะเป็นอิสระจากกัน
หากค่าสัมประสิทธิ์สหสัมพันธ์อยู่ในช่วง จากนั้นมีความสัมพันธ์แบบผกผันระหว่างค่าของ X และ Y สิ่งนี้ได้รับการยืนยันโดยการวิเคราะห์ข้อมูลเบื้องต้นด้วยภาพ ในกรณีนี้ค่าเบี่ยงเบนของค่า Y จากค่าเฉลี่ยจะถูกนำมาด้วยเครื่องหมายตรงกันข้าม
หากค่าแต่ละคู่ของปริมาณ X และ Y มักจะกลายเป็นสูงกว่า (ต่ำกว่า) ค่าเฉลี่ยที่สอดคล้องกันพร้อมกันแสดงว่ามีความสัมพันธ์โดยตรงระหว่างปริมาณและค่าสัมประสิทธิ์สหสัมพันธ์อยู่ในช่วง .
หากความเบี่ยงเบนของค่า X จากค่าเฉลี่ยเท่ากันมักทำให้เกิดการเบี่ยงเบนของค่า Y ลดลงจากค่าเฉลี่ยและในขณะเดียวกันค่าเบี่ยงเบนก็แตกต่างกันตลอดเวลา เราก็สามารถสรุปได้ว่าค่าของความสัมพันธ์กัน ค่าสัมประสิทธิ์มีแนวโน้มเป็นศูนย์
ควรสังเกตว่าค่าของสัมประสิทธิ์สหสัมพันธ์ไม่ได้ขึ้นอยู่กับหน่วยการวัดและการเลือกจุดอ้างอิง ซึ่งหมายความว่าหากตัวแปร X และ Y ลดลง (เพิ่มขึ้น) ด้วย K เท่าหรือด้วยจำนวน C ที่เท่ากัน ค่าสัมประสิทธิ์สหสัมพันธ์จะไม่เปลี่ยนแปลง
เพื่อให้การคำนวณการวัดความใกล้ชิดของการเชื่อมต่อสหสัมพันธ์ง่ายขึ้นมักใช้ดัชนีการเชื่อมต่อสหสัมพันธ์ซึ่งกำหนดโดยสูตรต่อไปนี้:
,
,
ที่ไหน - ความแปรปรวนที่เหลือซึ่งระบุลักษณะการเปลี่ยนแปลงของลักษณะผลลัพธ์ภายใต้อิทธิพลของปัจจัยอื่น ๆ ที่ไม่สามารถนับได้
ความสัมพันธ์หลายประการ
ความสัมพันธ์พหุคูณคือการขึ้นอยู่กับผลลัพธ์และคุณลักษณะของปัจจัยตั้งแต่ 2 รายการขึ้นไปที่รวมอยู่ในการศึกษา ตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างผลลัพธ์และคุณลักษณะของปัจจัยสองรายการขึ้นไปเรียกว่าค่าสัมประสิทธิ์สหสัมพันธ์แบบพหุคูณหรือสะสมและเขียนแทนด้วย R ค่าสัมประสิทธิ์สะสมจะถือว่ามีความสัมพันธ์เชิงเส้นระหว่างคุณลักษณะแต่ละคู่ซึ่งสามารถเป็นได้ แสดงโดยใช้สัมประสิทธิ์สหสัมพันธ์แบบคู่ หากเราพบการวัดสะสมของความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะผลลัพธ์ () และคุณลักษณะสองปัจจัย ( และ ) จากนั้นการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ทั้งหมดจะดำเนินการโดยใช้สูตร:
,
โดยที่ตัวห้อยระบุว่าคุณลักษณะใดกำลังศึกษาความสัมพันธ์แบบคู่
ในสูตรการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่ มีเพียงสัญลักษณ์ที่บ่งชี้การเปลี่ยนแปลงปัจจัยอย่างใดอย่างหนึ่งเท่านั้น ดังนั้น หากค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง และ คำนวณโดยสูตร ค่าสัมประสิทธิ์สหสัมพันธ์ระหว่าง และ จะถูกคำนวณ: ; ระหว่าง และ - เช่นนี้:
ส่วนการคำนวณ
ภารกิจที่ 31
ข้อมูลต่อไปนี้มีให้สำหรับสิบองค์กรสำหรับรอบระยะเวลารายงาน:
ตารางที่ 2
รัฐวิสาหกิจ |
ต้นทุนเฉลี่ยต่อปีของสินทรัพย์การผลิตคงที่ล้านรูเบิล |
ผลผลิตผลิตภัณฑ์ล้านรูเบิล |
เพื่อศึกษาความสัมพันธ์ระหว่างขนาดของต้นทุนเฉลี่ยต่อปีของสินทรัพย์ถาวรและผลผลิต ให้คำนวณสมการความสัมพันธ์เชิงเส้น
2. จากข้อมูลที่ให้มา: ก) คำนวณ: สัมประสิทธิ์สหสัมพันธ์เชิงเส้น; b) ตรวจสอบความถูกต้องของการเลือกรูปแบบการสื่อสารโดยการคำนวณดัชนีสหสัมพันธ์
เราจะสร้างตารางงานโดยใช้โปรเซสเซอร์ตาราง Microsoft Excel:
ตารางที่ 3
การคำนวณผลรวมในการคำนวณพารามิเตอร์ของสมการเส้นตรง
|
|
|
|
|
|
|||
239.74 * 1236 = 539.1 การแจกแจงความน่าจะเป็น... ทางเศรษฐกิจ การวิเคราะห์, แก้บนพื้นฐาน การถดถอย ทางเศรษฐกิจโมเดล ลองพิจารณา y - คุณลักษณะที่มีประสิทธิผล และ x - คุณลักษณะแฟคทอเรียล วิธีการ สัมพันธ์กัน-การถดถอย การวิเคราะห์ ... โปรแกรมวินัย “วิธีคอมพิวเตอร์เพื่อการวิเคราะห์ข้อมูลทางสังคมวิทยา” (สถิติทางคณิตศาสตร์เบื้องต้นและการวิเคราะห์ข้อมูล) สำหรับทิศทาง 040200 68 “สังคมวิทยา”โปรแกรมวินัยการใช้งาน 11 3 2 6 กระจายตัว การวิเคราะห์ 9 2 2 5 จับคู่และหลายรายการ การถดถอย การวิเคราะห์ 9 2 2 5 คุณสมบัติของสัมประสิทธิ์... ผู้ใช้ SPSS 11.0 Siskov V.I. ความสัมพันธ์ การวิเคราะห์วี ทางเศรษฐกิจ วิจัย- ม. 1975. Eddowes M., Stansfield... การวิเคราะห์ G. L. Savitskaya เกี่ยวกับกิจกรรมทางเศรษฐกิจขององค์กรเอกสารแนวทางปฏิบัติที่ดีที่สุด เทคนิคล่าสุด ทางเศรษฐกิจ วิจัย. การวิเคราะห์จะต้องครอบคลุม ความซับซ้อนของการศึกษา...ในระดับผลผลิตเฉลี่ยรายชั่วโมง สัมพันธ์กัน-การถดถอย การวิเคราะห์- ในรูปแบบหลายปัจจัย ความสัมพันธ์โมเดลเอาท์พุตเฉลี่ยรายชั่วโมง... |
3. อัตราส่วนสหสัมพันธ์เชิงประจักษ์คำนวณโดยใช้สูตร
การกระจายตัวระหว่างกลุ่มซึ่งแสดงลักษณะค่าของการเบี่ยงเบนกำลังสองของกลุ่มหมายถึงจากค่าเฉลี่ยโดยรวมของลักษณะการทำงาน
ความแปรปรวนรวม ซึ่งแสดงค่าเฉลี่ยของการเบี่ยงเบนกำลังสองของค่าของคุณลักษณะผลลัพธ์จากระดับเฉลี่ย
มาสร้างตารางเพื่อคำนวณผลต่างรวมกัน (ดูตารางที่ 8)
ตารางที่ 8
ตารางข้อมูลสำหรับการพิจารณาความแปรปรวนรวม
เอ็นพี/พี | ค่าอาหาร | |
1 | 21 | 441 |
2 | 16 | 256 |
3 | 26,1 | 681,21 |
4 | 28 | 784 |
5 | 26 | 676 |
6 | 22,5 | 506,25 |
7 | 27,6 | 761,76 |
8 | 35 | 1225 |
9 | 23,9 | 571,21 |
10 | 22,5 | 506,25 |
11 | 15 | 225 |
12 | 25,2 | 635,04 |
13 | 29 | 841 |
14 | 21,4 | 457,96 |
15 | 24,9 | 620,01 |
16 | 24,8 | 615,04 |
17 | 16 | 256 |
18 | 23,6 | 556,96 |
19 | 27,2 | 739,84 |
20 | 35 | 1225 |
21 | 17 | 289 |
22 | 23,8 | 566,44 |
23 | 22,6 | 510,76 |
24 | 25 | 625 |
25 | 27 | 729 |
26 | 30 | 900 |
27 | 35 | 1225 |
28 | 25,4 | 645,16 |
29 | 27,2 | 739,84 |
30 | 26,3 | 691,69 |
ทั้งหมด | 750 | 19502,42 |
ความแปรปรวนรวมของคุณลักษณะผลลัพธ์คำนวณโดยใช้สูตร:
=
ความแปรปรวนระหว่างกลุ่มคำนวณโดยใช้สูตร:
มาสร้างตารางเสริมสำหรับการคำนวณข้อมูลกัน (ดูตารางที่ 9)
ตารางที่ 9
ตารางข้อมูลสำหรับการคำนวณความแปรปรวนระหว่างกลุ่ม
หมายเลขกลุ่ม | จำนวนครัวเรือน ชิ้น | ค่าอาหารพันรูเบิล | ||||||
ทั้งหมด | โดยเฉลี่ยต่อครัวเรือน | |||||||
ฉ | ||||||||
1 | 28-40 | 3 | 48 | 16 | -9 | 81 | 243 | |
2 | 40-52 | 5 | 105 | 21 | -4 | 16 | 80 | |
3 | 52-64 | 12 | 300 | 25 | 0 | 0 | 0 | |
4 | 64-76 | 6 | 165 | 27,5 | 2,5 | 6,25 | 37,5 | |
5 | 76-88 | 4 | 132 | 33 | 8 | 64 | 256 | |
ทั้งหมด | 30 | 750 | 616,5 |
สรุป: ความเชื่อมโยงระหว่างปัจจัยต่างๆ มีความใกล้ชิดกันมากเพราะว่า รับค่าตั้งแต่ 0.9 ถึง 0.99
ค่าสัมประสิทธิ์การกำหนดคือกำลังสองของอัตราส่วนสหสัมพันธ์เชิงประจักษ์ เพราะฉะนั้น,
(81,9%)
สรุป: ผลผลิตในองค์กรเหล่านี้ขึ้นอยู่กับผลผลิตทุน 81.9% และปัจจัยอื่น ๆ 18.1%
ภารกิจที่ 3
จากผลลัพธ์ของภารกิจที่ 1 พิจารณาด้วยความน่าจะเป็น 0.9543:
1. ข้อผิดพลาดในการสุ่มตัวอย่างรายได้รวมเฉลี่ยต่อสมาชิกในครัวเรือนต่อปี และขอบเขตที่จะอยู่ในประชากรทั่วไป
2. ข้อผิดพลาดในการสุ่มตัวอย่างส่วนแบ่งของครัวเรือนที่มีระดับรายได้รวมน้อยกว่า 52,000 รูเบิล และมากกว่าล้านรูเบิล และขอบเขตที่หุ้นทั่วไปจะตั้งอยู่
1. ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับค่าเฉลี่ยถูกกำหนดโดยสูตร:
, ที่ไหน
ความแปรปรวนของประชากรตัวอย่าง
n - ขนาดตัวอย่าง;
t คือสัมประสิทธิ์ความเชื่อมั่นซึ่งกำหนดจากตารางค่าของฟังก์ชันอินทิกรัลลาปลาสตามความน่าจะเป็นที่กำหนด ในกรณีนี้ ที่ P = 0.954 ค่าจะเป็น t = 2
N คือจำนวนหน่วยในประชากร N=6,000 หน่วย
ลองคำนวณความแปรปรวนกัน เรานำเสนอข้อมูลในรูปแบบตาราง (ดูตารางที่ 11)
ตารางที่ 11
ข้อมูลสำหรับการคำนวณการกระจายตัวของระดับการผลิตเงินทุน
หมายเลขกลุ่ม | การจัดกลุ่มครัวเรือนตามรายได้รวม | จำนวนครัวเรือน ชิ้น | |||||
ฉ | |||||||
1 | 28-40 | 3 | 34 | -25,1 | 630,01 | 1890,03 | |
2 | 40-52 | 5 | 46 | -13,1 | 171,61 | 858,05 | |
3 | 52-64 | 12 | 58 | -1,1 | 1,21 | 14,52 | |
4 | 64-76 | 6 | 70 | 10,9 | 118,81 | 712,86 | |
5 | 76-88 | 4 | 82 | 22,9 | 524,41 | 2097,64 | |
ทั้งหมด | 30 | 5573,1 |
ความสัมพันธ์เชิงประจักษ์
มีการใช้ตัวบ่งชี้หลายตัวเพื่อวัดความหนาแน่นของการเชื่อมต่อ ในการเชื่อมต่อแบบคู่ ความแน่นของการเชื่อมต่อถูกกำหนดโดยอัตราส่วนสหสัมพันธ์เป็นหลัก ซึ่งแสดงโดย η อัตราส่วนสหสัมพันธ์กำลังสองคืออัตราส่วนของความแปรปรวนระหว่างกลุ่มของคุณลักษณะที่มีประสิทธิผล ซึ่งแสดงถึงอิทธิพลของความแตกต่างในลักษณะปัจจัยการจัดกลุ่มต่อค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิผล ต่อความแปรปรวนรวมของคุณลักษณะที่มีประสิทธิผล ซึ่งแสดงถึงอิทธิพลของทั้งหมด สาเหตุและเงื่อนไขของมัน กำลังสองของความสัมพันธ์สหสัมพันธ์เรียกว่าสัมประสิทธิ์การกำหนด
อ้อม ปรากฏการณ์และสัญญาณ: ________________ หรือกำหนดอย่างเคร่งครัด
โดยที่ k คือจำนวนกลุ่ม
N – จำนวนการสังเกต
ฉัน – ค่าเริ่มต้นของลักษณะผลลัพธ์
y j – ค่าเฉลี่ยของคุณลักษณะที่มีประสิทธิผลสำหรับกลุ่มนี้
y – ค่าเฉลี่ยของคุณลักษณะ
fj – ขนาดกลุ่ม
สูตรข้างต้นใช้ในการคำนวณความหนาแน่นของตัวบ่งชี้การเชื่อมต่อสำหรับการจัดกลุ่มเชิงวิเคราะห์ เมื่อคำนวณอัตราส่วนสหสัมพันธ์ตามระดับการเชื่อมต่อจะใช้สูตร:
ผลรวมของกำลังสองในตัวเศษคือความแปรปรวนของคุณลักษณะผลลัพธ์ y อธิบายโดยความสัมพันธ์กับตัวประกอบ x (ตัวประกอบ) คำนวณจากข้อมูลแต่ละรายการที่ได้รับสำหรับแต่ละหน่วยของประชากรตามสมการการถดถอย
หากเลือกสมการไม่ถูกต้องหรือมีข้อผิดพลาดเมื่อคำนวณพารามิเตอร์ผลรวมของกำลังสองในตัวเศษอาจมากกว่าในตัวส่วนและอัตราส่วนจะสูญเสียความหมายที่ควรมี เพื่อหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด ควรคำนวณอัตราส่วนสหสัมพันธ์โดยใช้สูตรต่อไปนี้:
สูตรนี้ใช้กฎที่รู้จักกันดีในการแยกผลรวมของการเบี่ยงเบนกำลังสองเมื่อจัดกลุ่มประชากร:
ดี โดยทั่วไป=ง อินเตอร์เกร+ดี อินทราเกร
ตามกฎนี้ คุณสามารถใช้ผลต่างแทนความแปรปรวนระหว่างกลุ่ม (แฟกทอเรียล) ได้:
ดี โดยทั่วไป–D อินทราเกร
สิ่งที่ช่วยให้:
เมื่อคำนวณ η ไม่ใช่โดยการจัดกลุ่ม แต่โดยสมการสหสัมพันธ์ (สมการถดถอย) เราจะใช้สูตร ในกรณีนี้กฎสำหรับการแยกผลรวมของการเบี่ยงเบนกำลังสองของคุณลักษณะผลลัพธ์จะถูกเขียนเป็น
D รวม = D core + D ที่เหลือ
จุดสำคัญที่สุดที่ใครก็ตามที่ต้องการใช้วิธีการวิเคราะห์สหสัมพันธ์-การถดถอยอย่างถูกต้องควรเข้าใจในตอนนี้คือการตีความสูตร (1.2) และ (1.3) บทบัญญัตินี้อ่านว่า:
สมการสหสัมพันธ์วัดความสัมพันธ์ระหว่างความแปรผันของคุณลักษณะผลลัพธ์และความแปรผันของคุณลักษณะปัจจัย การวัดความใกล้ชิดของความสัมพันธ์จะวัดสัดส่วนของการแปรผันในลักษณะผลลัพธ์ที่เกี่ยวข้องกับการแปรผันในลักษณะปัจจัย
| | บรรยายครั้งต่อไป ==> | |
อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความแปรปรวนทั้งหมดในคุณลักษณะผลลัพธ์ที่เกิดจากปัจจัยที่กำลังศึกษา ค่าเฉลี่ยสหสัมพันธ์เชิงประจักษ์แตกต่างกันไปตั้งแต่ 0 ถึง 1
![](https://i2.wp.com/vuzlit.ru/imag_/29/1666/image029.png)
ความสัมพันธ์เชิงประจักษ์มักพบใน ประเภทต่อไปนี้งาน:
- 1) เมื่อจำเป็นต้องดำเนินการจัดกลุ่มการวิเคราะห์ตามชุดข้อมูล X และ Y สองชุด
- 2) การจัดกลุ่มเสร็จสิ้นแล้ว จำเป็นต้องตรวจสอบกฎสำหรับการบวกผลต่าง
- 3) การใช้ข้อมูล X และ Y สองชุดจำเป็นต้องค้นหาสมการถดถอยและประเมินความสำคัญของมัน
สูตรการกระจายตัว เครื่องหมายทางเลือก
![](https://i1.wp.com/vuzlit.ru/imag_/29/1666/image030.png)
จากที่กล่าวมาข้างต้น เราสามารถหาสูตรสำหรับค้นหาความแปรปรวนของคุณลักษณะทางเลือกได้หากเราทราบเปอร์เซ็นต์ของคุณลักษณะดังกล่าวในกลุ่มตัวอย่างทั้งหมด
![](https://i2.wp.com/vuzlit.ru/imag_/29/1666/image031.png)
ในตอนแรก เราถือว่าแอตทริบิวต์รับค่าเพียงสองค่าเท่านั้น
ดังนั้นผลรวมของสัดส่วนขององค์ประกอบที่องค์ประกอบของอนุกรมทางสถิติมีค่าของแอตทริบิวต์ "ไม่" และองค์ประกอบของอนุกรมที่มีค่าของแอตทริบิวต์ "ใช่" จะเท่ากับหนึ่ง
ในการค้นหาค่าเฉลี่ยของอนุกรม เราจะแทนที่ค่าของคุณลักษณะทางเลือก (0 และ 1) ลงในสูตรเพื่อค้นหาค่าเฉลี่ยถ่วงน้ำหนักของอนุกรมทางสถิติ จากจุดนี้ เห็นได้ชัดว่าตัวส่วนจะมีค่าหนึ่ง และตัวเศษจะมีค่าเปอร์เซ็นต์ขององค์ประกอบ "1" นั่นคือค่าเปอร์เซ็นต์ขององค์ประกอบที่มีเครื่องหมาย "1" (สูตร 2)
สูตรการกระจายตัวคือค่าเฉลี่ยถ่วงน้ำหนักของค่าเบี่ยงเบนกำลังสองของแต่ละค่าในชุดข้อมูล (สูตร 3)
เนื่องจากในชุดข้อมูลของเราข้อมูลมีค่าเพียงสองประเภทคือ "0" และ "1" สูตรในการค้นหาความแปรปรวนสำหรับชุดข้อมูลที่มีคุณลักษณะทางเลือกจึงลดลงเป็นสูตร 4 คำอธิบาย เนื่องจากเราเพิ่งอนุมานได้ว่าค่าเฉลี่ยตัวอย่างเท่ากับ p (สูตร 2) ดังนั้นค่าของผลต่างกำลังสองของค่า (0/1) และค่าเฉลี่ยตามสูตร 1 จะอยู่ในกรณีแรก ( 1-p)2 และในกรณีที่สอง (1-q)2 ตอนนี้ ให้นำข้อพิสูจน์จากสูตรแรกไปใช้: q = 1 - p, p = 1- q เราได้ p2 กับ q2 ดังนั้นสัดส่วนของค่า “0” และ “1” จึงเท่ากับ p และ q ส่งผลให้มี q2 p และ p2 q ในตัวเศษ ผลรวมของการแชร์ฟีเจอร์ของค่า "0" และ "1" ตามสูตร 1 เท่ากับ 1 เป็นผลให้สูตร 4 รับค่า pq ซึ่งจะเท่ากับค่าของความแปรปรวนของ คุณสมบัติทางเลือก จากค่าที่พบของความแปรปรวนของคุณลักษณะทางเลือก เราจะพบค่าเบี่ยงเบนมาตรฐาน (สูตร 5) โดยการใส่ค่าจากสูตร 1 ลงในสูตร 5 เราจะได้สูตรสำหรับค่าเบี่ยงเบนมาตรฐานสำหรับความแปรปรวนของอนุกรมที่มีแอตทริบิวต์ทางเลือก