กำหนดตัวอย่างอัตราส่วนความสัมพันธ์เชิงประจักษ์ ค่าสัมประสิทธิ์สหสัมพันธ์และค่าสัมประสิทธิ์ของการกำหนด
วิธีการแก้. ในการคำนวณการกระจายกลุ่ม เราจะคำนวณค่าเฉลี่ยสำหรับแต่ละกลุ่ม:
พีซีเอส.; พีซีเอส
การคำนวณผลต่างระดับกลางตามกลุ่มแสดงในตาราง 3.2. แทนค่าที่ได้รับลงในสูตร (3.4) เราได้รับ:
ค่าเฉลี่ยของความแปรปรวนของกลุ่ม
จากนั้นเราจะคำนวณความแปรปรวนระหว่างกลุ่ม ในการดำเนินการนี้ ก่อนอื่น เราจะกำหนดค่าเฉลี่ยโดยรวมเป็นค่าเฉลี่ยถ่วงน้ำหนักของค่าเฉลี่ยกลุ่ม:
ตอนนี้เรากำหนดความแปรปรวนระหว่างกลุ่ม
ดังนั้น ความแปรปรวนทั้งหมดตามกฎของการบวกความแปรปรวน:
ตรวจสอบผลลัพธ์โดยการคำนวณความแปรปรวนทั้งหมด ด้วยวิธีปกติ:
ตามกฎสำหรับการเพิ่มความแปรปรวน เป็นไปได้ที่จะกำหนดตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างการจัดกลุ่ม (แฟกทอเรียล) และคุณลักษณะที่มีประสิทธิภาพ เรียกว่าอัตราส่วนสหสัมพันธ์เชิงประจักษ์ซึ่งแสดง ("นี่") และคำนวณโดยสูตร
สำหรับตัวอย่างของเรา เชิงประจักษ์ ความสัมพันธ์
.
ค่า 0.86 แสดงลักษณะความสัมพันธ์ที่สำคัญระหว่างการจัดกลุ่มและลักษณะการทำงาน
ค่านี้เรียกว่าค่าสัมประสิทธิ์ของการกำหนดและแสดงส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด
นอกเหนือจากการเปลี่ยนแปลงของลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตการเปลี่ยนแปลงของลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันดังกล่าวสำเร็จสำหรับสัดส่วนของลักษณะเชิงปริมาณ โดยการคำนวณและวิเคราะห์ความแปรปรวนประเภทต่างๆ ต่อไปนี้
ความแปรปรวนภายในกลุ่มของส่วนแบ่งถูกกำหนดโดยสูตร
. (3.17)
ค่าเฉลี่ยของผลต่างภายในกลุ่มคำนวณเป็น
. (3.18)
สูตรความแปรปรวนระหว่างกลุ่มมีดังนี้:
, (3.19)
ที่ไหน ฉัน– จำนวนหน่วยในกลุ่มแยก;
- สัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร
ความแปรปรวนทั้งหมดมีรูปแบบ
. (3.21)
การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้:
. (3.22)
ตัวอย่าง 3.4
เรามานิยามความแปรปรวนของกลุ่ม ค่าเฉลี่ยของกลุ่ม ระหว่างกลุ่ม และความแปรปรวนทั้งหมดตามข้อมูลในตาราง 3.3.
ตารางที่ 3.3
จำนวนและ แรงดึงดูดเฉพาะหนึ่งในหมวดหมู่
พื้นที่ฟาร์มเลี้ยงวัว
วิธีการแก้
ให้เรากำหนดส่วนแบ่งของโคนมโดยทั่วไปสำหรับสามฟาร์ม:
ความแปรปรวนทั้งหมดในสัดส่วนโคนม:
ความแปรปรวนภายในกลุ่ม:
; ; .
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:
ความแปรปรวนระหว่างกลุ่ม:
เมื่อใช้กฎสำหรับการเพิ่มความแปรปรวน เราได้รับ: 0.1025+0.0031=0.1056 ตัวอย่างถูกต้อง
ตัวอย่างที่ 3.5
จากข้อมูลตัวอย่างการสำรวจค่าจ้างพนักงานภาครัฐได้ตัวชี้วัดดังนี้ (ตารางที่ 3.4)
ตารางที่ 3.4
กำหนด:
1) เงินเดือนเฉลี่ยในสองอุตสาหกรรม
2) การกระจายค่าจ้าง:
ก) ค่าเฉลี่ยของการกระจายกลุ่ม (อุตสาหกรรม)
b) ระหว่างกลุ่ม (ภาคส่วน),
3) ค่าสัมประสิทธิ์ของการกำหนด;
4) ความสัมพันธ์เชิงประจักษ์
วิธีการแก้
1. ปานกลาง ค่าจ้างพนักงานในสองอุตสาหกรรมคำนวณโดยสูตร (2.10):
ถู.
2. ผลต่างของค่าจ้าง:
ก) ค่าเฉลี่ยของการกระจายตัวของกลุ่มตาม (3.14)
b) การกระจายระหว่างกลุ่มตาม (3.12)
c) ความแปรปรวนทั้งหมดที่ได้รับตามกฎสำหรับการเพิ่มความแปรปรวน (3.15):
3. ค่าสัมประสิทธิ์ของการกำหนดเท่ากับค่า
เหล่านั้น. คิดเป็น 44.24%
แสดงให้เห็นว่าค่าตอบแทน 44.24% ขึ้นอยู่กับความร่วมมือตามภาคส่วนของพนักงาน และ 55.76% - เหตุผลภายในอุตสาหกรรม
ตามสูตร (3.16) อัตราส่วนสหสัมพันธ์เชิงประจักษ์ ,
ซึ่งบ่งชี้ถึงผลกระทบอย่างมีนัยสำคัญต่อความแตกต่างของค่าจ้างของคุณลักษณะรายสาขา
3.2. งานสำหรับโซลูชันอิสระ
ภารกิจ 3.1
จากการกระจายคนงาน 60 คนตามประเภทอัตราค่าไฟฟ้า มีข้อมูลต่อไปนี้ (ตารางที่ 3.5)
ตารางที่ 3.5
กำหนด:
1) ประเภทค่าจ้างเฉลี่ยของคนงาน
2) ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย
3) การกระจาย;
4) ส่วนเบี่ยงเบนมาตรฐาน
5) ค่าสัมประสิทธิ์ของการแปรผัน
ภารกิจ 3.2
จากผลการสอบของหลักสูตรที่ 1 และ 2 ของมหาวิทยาลัยแห่งใดแห่งหนึ่งมีข้อมูลต่อไปนี้: ในปีที่ 1 นักเรียน 85% ผ่านเซสชันโดยไม่มีสองครั้งในปีที่ 2 - 90%
กำหนดความแปรปรวนของสัดส่วนของนักเรียนที่ผ่านเซสชั่นในแต่ละหลักสูตร
ภารกิจ 3.3
บริษัทร่วมทุนในภูมิภาคตามจำนวนพนักงานเฉลี่ย ณ วันที่ 1 มกราคม 2547 จำแนกได้ดังนี้ (ตารางที่ 3.6)
ตารางที่ 3.6
คำนวณ:
1) ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย
2) การกระจาย;
3) ส่วนเบี่ยงเบนมาตรฐาน
4) ค่าสัมประสิทธิ์ของการแปรผัน
ภารกิจ 3.4
มีข้อมูลเกี่ยวกับการกระจายครอบครัวของพนักงานขององค์กรตามจำนวนบุตร (ตารางที่ 3.7)
ตารางที่ 3.7
คำนวณ:
1) การกระจายตัวภายในกลุ่ม
2) ค่าเฉลี่ยของการกระจายตัวภายในกลุ่ม
3) การกระจายระหว่างกลุ่ม;
4) ความแปรปรวนทั้งหมด
ตรวจสอบความถูกต้องของการคำนวณโดยใช้กฎการบวกผลต่าง
ภารกิจ 3.5
การกระจายต้นทุนของผลิตภัณฑ์สำหรับการส่งออกโดยร้านค้าขององค์กรแสดงด้วยข้อมูลต่อไปนี้ (ตารางที่ 3.8)
ตารางที่ 3.8
คำนวณ:
1) ค่าเฉลี่ยของสินค้าภายในกลุ่ม ระหว่างกลุ่ม และส่วนแบ่งรวมของสินค้าส่งออก;
2) ค่าสัมประสิทธิ์ของการกำหนดและความสัมพันธ์เชิงประจักษ์
ภารกิจ 3.6
จากการสำรวจธนาคารพาณิชย์ในเมือง 70% ของจำนวนลูกค้าทั้งหมดเป็นนิติบุคคลโดยมีเงินกู้เฉลี่ย 120,000 รูเบิล และค่าสัมประสิทธิ์การแปรผัน 25% และ 20% - บุคคลด้วยขนาดเงินกู้เฉลี่ย 20,000 รูเบิล โดยมีค่าเบี่ยงเบนกำลังสองเฉลี่ย 6,000 รูเบิล
ใช้กฎสำหรับการเพิ่มความแปรปรวน กำหนดความใกล้ชิดของความสัมพันธ์ระหว่างขนาดของสินเชื่อและประเภทของลูกค้าโดยการคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์
หมวดที่ 4 การสังเกตแบบเลือก
4.1. คำแนะนำเชิงระเบียบวิธี
และวิธีแก้ปัญหาของงานทั่วไป
จุดประสงค์ของการสังเกตตัวอย่างคือการกำหนดลักษณะของประชากรทั่วไป - ค่าเฉลี่ยทั่วไป ( o) และส่วนแบ่งทั่วไป ( ร). ลักษณะของประชากรตัวอย่าง - ค่าเฉลี่ยตัวอย่าง () และส่วนแบ่งตัวอย่าง () แตกต่างจากลักษณะทั่วไปตามจำนวนข้อผิดพลาดในการสุ่มตัวอย่าง () ดังนั้น เพื่อกำหนดคุณลักษณะของประชากรทั่วไป จึงจำเป็นต้องคำนวณข้อผิดพลาดในการสุ่มตัวอย่างหรือข้อผิดพลาดในการเป็นตัวแทน ซึ่งกำหนดโดยสูตรที่พัฒนาขึ้นในทฤษฎีความน่าจะเป็นสำหรับตัวอย่างแต่ละประเภทและวิธีการคัดเลือก
การสุ่มตัวอย่างที่เหมาะสมและเชิงกลในกรณีของการสุ่มตัวอย่างซ้ำ ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับค่าเฉลี่ย () และสำหรับสัดส่วน () จะคำนวณโดยสูตร
; (4.1)
(4.2)
ความแปรปรวนของประชากรตัวอย่างอยู่ที่ไหน
น- ขนาดตัวอย่าง;
ทีคือค่าสัมประสิทธิ์ความเชื่อมั่นซึ่งพิจารณาจากตารางค่าของฟังก์ชันอินทิกรัล Laplace สำหรับความน่าจะเป็นที่กำหนด ( พี ดอส) (ตาราง A1).
ด้วยการสุ่มแบบไม่ซ้ำและการเลือกเชิงกล สูตรจะคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม
; (4.3)
, (4.4)
ที่ไหน เอ็น- ขนาดของประชากรทั่วไป
ตัวอย่าง 4.1
เพื่อกำหนดปริมาณเถ้าของถ่านหินในแหล่งสะสม ถ่านหิน 100 ตัวอย่างถูกสุ่มตรวจ จากการสำรวจพบว่าปริมาณเถ้าเฉลี่ยของถ่านหินในตัวอย่างคือ 16% ส่วนเบี่ยงเบนมาตรฐานคือ 5% ใน 10 ตัวอย่าง ปริมาณเถ้าของถ่านหินมากกว่า 20% ด้วยความน่าจะเป็น 0.954 ให้กำหนดขีดจำกัดที่ปริมาณขี้เถ้าเฉลี่ยของถ่านหินในแหล่งสะสมและสัดส่วนของถ่านหินที่มีปริมาณเถ้ามากกว่า 20%
วิธีการแก้
ปริมาณเถ้าเฉลี่ยของถ่านหินจะอยู่ภายใน
ในการกำหนดขอบเขตของค่าเฉลี่ยทั่วไป เราคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับค่าเฉลี่ยโดยใช้สูตร (4.1):
. (4.5)
ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าปริมาณขี้เถ้าเฉลี่ยของถ่านหินในเงินฝากจะอยู่ภายใน 16% 1% หรือ 15% 17%
ส่วนแบ่งของถ่านหินที่มีปริมาณเถ้ามากกว่า 20% จะอยู่ภายใน
ส่วนแบ่งตัวอย่างถูกกำหนดโดยสูตร
ที่ไหน มคือสัดส่วนของหน่วยที่มีคุณสมบัติ
ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับส่วนแบ่ง () คำนวณโดยสูตร (4.2):
หรือ ±6%
ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าสัดส่วนของถ่านหินที่มีปริมาณเถ้ามากกว่า 20% ในเงินฝากจะอยู่ภายใน , หรือ .
ตัวอย่าง 4.2
ในการกำหนดระยะเวลาเฉลี่ยของการใช้เงินกู้ระยะสั้นในธนาคาร ได้ทำการสร้างตัวอย่างเชิงกล 5% ซึ่งรวมบัญชี 100 บัญชี จากการสำรวจพบว่าระยะเวลาเฉลี่ยของการใช้เงินกู้ระยะสั้นอยู่ที่ 30 วัน โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ 9 วัน ใน 5 บัญชี ระยะเวลาการใช้เงินกู้เกิน 60 วัน ด้วยความน่าจะเป็น 0.954 ให้กำหนดขอบเขตระยะเวลาการใช้เงินกู้ระยะสั้นในประชากรทั่วไปและสัดส่วนของบัญชีที่มีระยะเวลาการใช้เงินกู้ระยะสั้นมากกว่า 60 วัน
วิธีการแก้
ระยะเวลาเฉลี่ยการใช้เงินกู้ธนาคารอยู่ภายใน
.
เนื่องจากการสุ่มตัวอย่างเป็นแบบกลไก ข้อผิดพลาดในการสุ่มตัวอย่างจึงถูกกำหนดโดยสูตร (2.3):
วัน.
ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าระยะเวลาการใช้เงินกู้ระยะสั้นในธนาคารคือภายใน = 30 วัน 2 วันหรือ
28 วันต่อวัน
ส่วนแบ่งของเงินให้กู้ยืมที่มีระยะเวลาครบกำหนดมากกว่า 60 วันอยู่ภายใน
ส่วนแบ่งตัวอย่างจะเป็น
ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับการแบ่งปันถูกกำหนดโดยสูตร (4.4):
หรือ 4.2%
ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าส่วนแบ่งของสินเชื่อธนาคารที่มีระยะเวลาครบกำหนดมากกว่า 60 วันจะอยู่ภายใน หรือ
ตัวอย่างทั่วไปในการเลือกแบบทั่วไป (แบ่งโซน) ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่มพื้นที่ทั่วไปที่เป็นเนื้อเดียวกัน ดำเนินการเลือกหน่วยการสังเกตในชุดตัวอย่าง วิธีการต่างๆ. พิจารณาตัวอย่างทั่วไปที่มีการเลือกตามสัดส่วนภายในกลุ่มทั่วไป
ขนาดตัวอย่างจากกลุ่มทั่วไปในการเลือกตามสัดส่วนของจำนวนกลุ่มทั่วไปถูกกำหนดโดยสูตร
ที่ไหน ฉันคือขนาดตัวอย่างจากกลุ่มทั่วไป
ฉันเป็นปริมาตรของกลุ่มทั่วไป
ข้อผิดพลาดเล็กน้อยของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับการสุ่มแบบไม่ซ้ำและ ทางกลการเลือกภายในกลุ่มทั่วไปคำนวณโดยสูตร
; (4.8)
, (4.9)
ความแปรปรวนของประชากรตัวอย่างอยู่ที่ไหน
ตัวอย่าง 4.3
ในการกำหนดอายุเฉลี่ยของผู้ชายที่เข้าสู่การแต่งงาน กลุ่มตัวอย่างทั่วไป 5% ถูกสร้างขึ้นในเขตด้วยการเลือกหน่วยตามสัดส่วนขนาดของกลุ่มทั่วไป ภายในกลุ่มใช้การเลือกเชิงกล ข้อมูลสรุปไว้ในตาราง 4.1.
ตารางที่ 4.1
ด้วยความน่าจะเป็น 0.954 กำหนดขีดจำกัดที่ อายุเฉลี่ยผู้ชายที่แต่งงานและสัดส่วนของผู้ชายที่แต่งงานครั้งที่สอง
วิธีการแก้
อายุเฉลี่ยของการแต่งงานสำหรับผู้ชายอยู่ในช่วง
.
อายุเฉลี่ยของการแต่งงานของผู้ชายในกลุ่มตัวอย่างถูกกำหนดโดยสูตรของค่าเฉลี่ยถ่วงน้ำหนัก
= ของปี.
ความแปรปรวนตัวอย่างเฉลี่ยถูกกำหนดโดยสูตร
กลาง
=
เราคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มโดยใช้สูตร (4.8):
ของปี.
ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าอายุเฉลี่ยของผู้ชายที่แต่งงานจะอยู่ในช่วงปีต่อปีหรือ
อายุ 24 ปี.
สัดส่วนของผู้ชายที่แต่งงานใหม่จะอยู่ภายใน
ส่วนแบ่งตัวอย่างถูกกำหนดโดยสูตรของค่าเฉลี่ย
หรือ 14%
ความแปรปรวนของตัวอย่างโดยเฉลี่ย คุณสมบัติทางเลือกคำนวณตามสูตร
(4.12)
ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับการแบ่งปันถูกกำหนดโดยสูตร (4.9):
หรือ 6%
ด้วยความน่าจะเป็น 0.954 สามารถโต้แย้งได้ว่าสัดส่วนของผู้ชายที่แต่งงานครั้งที่สองจะอยู่ภายใน , หรือ .
การสุ่มตัวอย่างแบบอนุกรมด้วยวิธีการเลือกแบบอนุกรมประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่มที่มีขนาดเท่ากัน - ชุด ซีรีส์ถูกเลือกในชุดตัวอย่าง ภายในซีรีส์ มีการสังเกตหน่วยที่ตกอยู่ในซีรีส์อย่างต่อเนื่อง
ในกรณีของการเลือกอนุกรมแบบไม่ซ้ำ ข้อผิดพลาดเล็กน้อยของค่าเฉลี่ยตัวอย่างและสัดส่วนจะถูกกำหนดโดยสูตร
, (4.13)
ความแปรปรวนของอินเตอร์ซีรีส์อยู่ที่ไหน
รคือจำนวนซีรีส์ในประชากรทั่วไป
ร– จำนวนซีรีส์ที่เลือก
ตัวอย่าง 4.4
มีทีมงาน 10 คนในร้านค้าขององค์กร เพื่อศึกษาผลิตภาพแรงงาน กลุ่มตัวอย่าง 20% ได้ดำเนินการ ซึ่งรวมถึง 2 กลุ่ม จากการสำรวจพบว่าผลผลิตเฉลี่ยของคนงานในทีมคือ 4.6 และ 3 ตัน ด้วยความน่าจะเป็น 0.997 กำหนดขีด จำกัด ซึ่งผลผลิตเฉลี่ยของคนงานในร้านค้าจะเป็น เสื้อ หรือ ที
ตัวอย่าง 4.5
มีสินค้าในสต๊อก ผลิตภัณฑ์สำเร็จรูปเวิร์กช็อปประกอบด้วยกล่องชิ้นส่วน 200 กล่อง กล่องละ 40 ชิ้น ในการตรวจสอบคุณภาพของผลิตภัณฑ์สำเร็จรูป ได้ทำการสร้างตัวอย่างอนุกรม 10% จากการสุ่มตัวอย่างพบว่ามีสัดส่วนของชิ้นส่วนที่ชำรุดอยู่ที่ 15% ความแปรปรวนตัวอย่างอนุกรมคือ 0.0049
ด้วยความน่าจะเป็น 0.997 ให้กำหนดขีดจำกัดที่สัดส่วนของผลิตภัณฑ์ที่บกพร่องในชุดกล่องอยู่
วิธีการแก้
สัดส่วนของชิ้นส่วนที่ชำรุดจะอยู่ภายใน
ให้เราพิจารณาข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับการแบ่งปันตามสูตร (4.13):
หรือ 4.4%
ด้วยความน่าจะเป็น 0.997 อาจเป็นที่ถกเถียงกันอยู่ว่าสัดส่วนของชิ้นส่วนที่ชำรุดในชุดงานอยู่ในช่วง 10.6% 19.6%
ตัวอย่าง 4.6
ในแคว้นที่ประกอบด้วย 20 เขต การสำรวจผลผลิตตัวอย่างได้ดำเนินการตามการเลือกชุด (เขต) ค่าเฉลี่ยตัวอย่างสำหรับเขตคือ 14.5 c/ha ตามลำดับ; 16; 15.5; 15 และ 14 คิว/เฮกตาร์ ด้วยความน่าจะเป็น 0.954 จงหาขีดจำกัดผลผลิตในพื้นที่ทั้งหมด
วิธีการแก้
คำนวณค่าเฉลี่ยโดยรวม:
ค/เฮกตาร์
ความแปรปรวนระหว่างกลุ่ม (interseries)
ให้เราพิจารณาข้อผิดพลาดเล็กน้อยของตัวอย่างที่ไม่ซ้ำแบบอนุกรม (t = 2, P dov = 0.954) โดยใช้สูตร (4.13):
.
ดังนั้นผลผลิตในภูมิภาค (ด้วยความน่าจะเป็น 0.954) จะอยู่ภายใน
15-1,7≤ ≤15+1,7,
13.3 c/ha ≤ ≤16.7 c/ha
ในการออกแบบการสังเกตตัวอย่างจำเป็นต้องหาขนาดของตัวอย่างซึ่งจำเป็นเพื่อให้แน่ใจว่ามีความแม่นยำในการคำนวณลักษณะทั่วไป - ค่าเฉลี่ยและสัดส่วน ในกรณีนี้ ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม ความน่าจะเป็นที่จะเกิดขึ้น และการเปลี่ยนแปลงของคุณลักษณะจะทราบล่วงหน้า
ด้วยการสุ่มตัวอย่างซ้ำ ขนาดตัวอย่างจะถูกกำหนดจากนิพจน์
ด้วยการสุ่มแบบไม่ซ้ำและการเลือกเชิงกล ขนาดตัวอย่างจะคำนวณตามสูตร
. (4.16)
สำหรับตัวอย่างทั่วไป
. (4.17)
สำหรับการสุ่มตัวอย่างแบบอนุกรม
. (4.18)
ตัวอย่าง 4.7
มี 2,000 ครอบครัวอาศัยอยู่ในเขต มีการวางแผนที่จะดำเนินการสำรวจตัวอย่างของพวกเขาโดยวิธีการสุ่มเลือกแบบไม่ซ้ำเพื่อหาขนาดเฉลี่ยของครอบครัว กำหนดขนาดตัวอย่างที่ต้องการ โดยมีเงื่อนไขว่าด้วยความน่าจะเป็น 0.954 ข้อผิดพลาดในการสุ่มตัวอย่างต้องไม่เกินหนึ่งคนโดยมีค่าเบี่ยงเบนมาตรฐานเท่ากับสามคน ( = 3)
วิธีการแก้
ด้วยการสุ่มเลือกแบบไม่ซ้ำ จะได้ขนาดตัวอย่างตามสูตร (4.16) ครอบครัว
ขนาดตัวอย่าง: อย่างน้อย 36 ครอบครัว
ตัวอย่าง 4.8
เมือง A มี 10,000 ครอบครัว ด้วยความช่วยเหลือของการสุ่มตัวอย่างเชิงกล มันควรจะกำหนดสัดส่วนของครอบครัวที่มีลูกสามคนขึ้นไป ขนาดตัวอย่างควรเป็นเท่าใดเพื่อให้มีความน่าจะเป็น 0.954 ที่ข้อผิดพลาดในการสุ่มตัวอย่างไม่เกิน 0.02 หากทราบความแปรปรวนจากการสำรวจครั้งก่อนว่าเป็น 0.2
วิธีการแก้
ให้เรากำหนดขนาดตัวอย่างที่ต้องการตามสูตร (4.16):
.
ขนาดตัวอย่าง: ไม่น้อยกว่า 1667
ในทางสถิติ มักจำเป็นต้องเปรียบเทียบผลลัพธ์ของตัวอย่างสองตัวอย่าง (หรือมากกว่า) จากการเปรียบเทียบค่าเฉลี่ยตัวอย่างสองค่า (หรือส่วนแบ่ง) จะได้ข้อสรุปเกี่ยวกับการสุ่มหรือความสำคัญของความแตกต่าง
สำหรับสิ่งนี้ ความแตกต่างสัมบูรณ์ระหว่างตัวบ่งชี้ของค่าเฉลี่ยตัวอย่างจะถูกเปรียบเทียบกับข้อผิดพลาดเฉลี่ยของความแตกต่าง:
. (4.19)
พบ ทีคำนวณ เปรียบเทียบกับ ทีแท็บ บน ที- การกระจายของนักเรียน (ตาราง P2) สำหรับจำนวนองศาอิสระ โวลต์=น 1 +น 2 -2 และระดับนัยสำคัญที่กำหนด a. (ที่นี่ น 1 และ น 2 – ปริมาตรของตัวอย่างเปรียบเทียบ)
คำตอบ
การประเมินเชิงปริมาณของความใกล้ชิดของการสื่อสารตามข้อมูลเชิงประจักษ์ประกอบด้วยตัวบ่งชี้การคำนวณความใกล้ชิดของการสื่อสาร:
· ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (อัตราส่วนการกระจายเชิงประจักษ์) - r 2 .
ตัวบ่งชี้นี้คำนวณตามข้อมูลของการจัดกลุ่มการวิเคราะห์ (ตาราง) โดยเป็นอัตราส่วนของความแปรปรวนระหว่างกลุ่มของลักษณะผลลัพธ์ Y (d y 2) ต่อความแปรปรวนทั้งหมด Y (s y 2):
ตามทฤษฎีบทการสลายตัวของความแปรปรวน ความแปรปรวนระหว่างกลุ่มเกี่ยวข้องกับความแปรปรวนทั้งหมด: s y 2 =d y 2 +e y 2 แล้ว ค่าสัมประสิทธิ์เชิงประจักษ์การกำหนดสามารถคำนวณได้ผ่านผลต่างที่เหลือตามสูตร:
โดยที่ s j 2 คือความแปรปรวนของผลลัพธ์ Y ภายในกลุ่ม j
ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดลักษณะความแข็งแกร่งของอิทธิพลของแอตทริบิวต์การจัดกลุ่ม (X) ต่อการก่อตัวของการแปรผันโดยรวมของแอตทริบิวต์ผลลัพธ์ Y และแสดงเปอร์เซ็นต์ (ส่วนแบ่ง) ของการแปรผันของแอตทริบิวต์ผลลัพธ์เนื่องจากปัจจัยแอตทริบิวต์ที่อยู่ภายใต้ การจัดกลุ่ม
สะดวกในการคำนวณ r 2 ในตาราง:
สัญญาณปัจจัย X เจ | นิวเจอร์ซีย์ | ค่าเฉลี่ยของคุณลักษณะ-ผลลัพธ์ | s j 2 N j | |
x1 | เอ็น 1 | ส 1 2 น 1 | ||
x2 | ยังไม่มีข้อความ 2 | ส 2 2 น 2 | ||
.... | ... | |||
X ม | N ม | เอส ม. 2 น. ม | ||
ทั้งหมด | เอ็น | เอ็กซ์ | es j 2 |
แล้ว .
พิจารณาตัวอย่าง ให้กำหนดคนงาน 20 คนโดยมีลักษณะดังต่อไปนี้: Y - ผลลัพธ์ของคนงาน (ชิ้น / กะ) และ X - คุณสมบัติ (อันดับ) ข้อมูลเริ่มต้นแสดงในตาราง:
เอ็กซ์ | ||||||||||||||||||||
วาย |
จำเป็นต้องประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะโดยใช้ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (r 2)
ในการคำนวณ r 2 เราจะทำการวิเคราะห์กลุ่มประชากร ในฐานะปัจจัยเครื่องหมาย เราใช้ X (หมวดหมู่ของผู้ปฏิบัติงาน) เป็นผลลัพธ์เครื่องหมาย - Y ซึ่งเป็นผลลัพธ์ของผู้ปฏิบัติงาน) การจัดกลุ่มการวิเคราะห์ทำขึ้นบนพื้นฐานของ X. B กรณีนี้จะไม่ต่อเนื่อง (เนื่องจากค่าของแอตทริบิวต์ X ค่อนข้างซ้ำกัน) จำนวนกลุ่มเท่ากับจำนวนค่าของแอตทริบิวต์ X ในการรวมนั่นคือ 6. ผลลัพธ์ของการจัดกลุ่มและการคำนวณของ r 2 สรุปไว้ในตาราง:
ปัจจัยเครื่องหมาย X | แอตทริบิวต์ผลลัพธ์ Y | จำนวนหน่วยในกลุ่ม N j | ค่าเฉลี่ยของผลการลงชื่อในกลุ่ม | ( - ) 2 N j | การกระจายของลักษณะ-ผลลัพธ์ในกลุ่ม s 2 j | s 2 j N j |
(10+12+13)/3=11,7 | (11,7-17,1) 2 3=88,56 | ส 2 1 \u003d ((10-11.7) 2 + (12-11.7) 2 + (13-11.7) 2) / 3 \u003d 1.56 | 4,7 | |||
(11+14)/2=12,5 | (12,5-17,1) 2 2=42,3 | ส 2 2 \u003d ((11-12.5) 2 + (14-12.5) 2) / 2 \u003d 2.25 | 4,5 | |||
(12+13+15+16)/4= 14 | (14-17,1) 2 4=38,4 | ส 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2.5 | ||||
(15+17+17+18)/4= 16,75 | (16,75-17,1) 2 4=0,49 | ส 2 4 \u003d ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \u003d 1.9 | 4,75 | |||
(18+20+22)/3=20 | (20-17,1) 2 3=25,23 | ส 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2.7 | ||||
(23+24+27+25)/4= 24,75 | (24,75-17,1) 2 4=234,1 | ส 2 6 \u003d ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 \u003d 2.19 | 8,75 | |||
=17,1 | 429,1 | 40,7 |
ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเท่ากับอัตราส่วนของความแปรปรวนระหว่างกลุ่มของแอตทริบิวต์ผลลัพธ์ (d y 2) ต่อความแปรปรวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2 + อี y 2).
การกระจายระหว่างกลุ่ม Y จะเท่ากับ: d y 2 = å( - ) 2 N j / N = 429.1/20=21.45
ความแปรปรวนที่เหลือ Y จะเป็น: e y 2 = ås 2 j ·N j / N= 40.7/20= 2.035
จากนั้น: r 2 \u003d 21.45 / (21.45 + 2.035) \u003d 429.1 / (429.1 + 40.7) \u003d 0.913
สรุป: 91.3% ของการเปลี่ยนแปลงในผลผลิตของคนงานเกิดจากอิทธิพลของปัจจัยการปลดปล่อย
· ความสัมพันธ์เชิงประจักษ์ - ร.
ตัวบ่งชี้นี้เป็นรากของค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด แสดงให้เห็นความแน่นของการเชื่อมต่อ (ไม่เฉพาะเชิงเส้น!) ระหว่างการจัดกลุ่มและคุณสมบัติการทำงาน ช่วงของค่าที่อนุญาตของอัตราส่วนสหสัมพันธ์เชิงประจักษ์คือตั้งแต่ 0 ถึง +1
ขีดสุด ปิดการเชื่อมต่อ- นี่คือความสัมพันธ์เชิงฟังก์ชัน เมื่อแต่ละค่าของแอตทริบิวต์-ผลลัพธ์ Y ถูกกำหนดโดยค่าของแอตทริบิวต์-แฟกเตอร์ X (เช่น ผลลัพธ์ของการจัดกลุ่ม) ในกรณีนี้ ความแปรปรวนของค่าเฉลี่ยของกลุ่ม (d y 2) เท่ากับความแปรปรวนทั้งหมด (s y 2) เช่น จะไม่มีการเปลี่ยนแปลงภายในกลุ่ม ในกรณีนี้ การกระจายที่เหลือ (e y 2) เท่ากับ 0 และค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเท่ากับ 1
หากไม่มีการเชื่อมต่อระหว่างเครื่องหมาย แสดงว่าค่าเฉลี่ยของกลุ่มทั้งหมดมีค่าเท่ากัน จะไม่มีการเปลี่ยนแปลงระหว่างกลุ่ม (d y 2 =0) และค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดคือ 0
ลองคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์สำหรับตัวอย่างของเรา: r= 0.9555 สรุป: สัญญาณของ "การผลิตของคนงาน" และ "การปลดออก" นั้นค่อนข้างสัมพันธ์กัน
ตัวบ่งชี้ r และ r 2 ไม่เพียงถูกกำหนดโดยการเชื่อมต่อระหว่างคุณสมบัติ X และ Y เท่านั้น แต่ยังพิจารณาจากข้อเท็จจริงของการจัดกลุ่มข้อมูลหลักด้วย เมื่อจำนวนกลุ่ม m เพิ่มขึ้น ความแปรปรวนระหว่างกลุ่ม d 2 จะเพิ่มขึ้นและเข้าใกล้ความแปรปรวนทั้งหมด หากจำนวนกลุ่มน้อยกว่าจำนวนหน่วยประชากร N ค่าของ r และ r 2 จะไม่เท่ากับ 1 แม้ว่าจะมีความสัมพันธ์เชิงหน้าที่เข้มงวดก็ตาม
โปรดทราบว่าค่าของตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อไม่ได้พิสูจน์ถึงการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคุณลักษณะที่ศึกษา แต่เป็นการประเมินระดับความสอดคล้องร่วมกันในการเปลี่ยนแปลงคุณลักษณะต่างๆ การสร้างความสัมพันธ์เชิงเหตุและผลจำเป็นต้องนำหน้าด้วยการวิเคราะห์ลักษณะเชิงคุณภาพของปรากฏการณ์
ค่า 0.86 แสดงลักษณะความสัมพันธ์ที่สำคัญระหว่างการจัดกลุ่มและลักษณะการทำงาน
ค่า เรียกว่า ค่าสัมประสิทธิ์การกำหนดและแสดงส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด
นอกเหนือจากการเปลี่ยนแปลงของลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตการเปลี่ยนแปลงของลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันดังกล่าวสำเร็จสำหรับสัดส่วนของลักษณะเชิงปริมาณ โดยการคำนวณและวิเคราะห์ความแปรปรวนประเภทต่างๆ ต่อไปนี้
ความแปรปรวนของส่วนแบ่งภายในกลุ่มถูกกำหนดโดยสูตร
. (3.17)
ค่าเฉลี่ยของผลต่างภายในกลุ่มคำนวณเป็น
. (3.18)
สูตร ความแปรปรวนระหว่างกลุ่มมีรูปแบบดังนี้
, (3.19)
ที่ไหน น ผม– จำนวนหน่วยในกลุ่มแยก;
- สัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร
. (3.20)
ความแปรปรวนทั้งหมดมีแบบฟอร์ม
. (3.21)
การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้:
. (3.22)
ตัวอย่าง 3.4
เรามานิยามความแปรปรวนของกลุ่ม ค่าเฉลี่ยของกลุ่ม ระหว่างกลุ่ม และความแปรปรวนทั้งหมดตามข้อมูลในตาราง 3.3.
ตารางที่ 3.3
จำนวนและสัดส่วนของฟาร์มโคประเภทใดประเภทหนึ่งในเขต
วิธีการแก้
ให้เรากำหนดส่วนแบ่งของโคนมโดยทั่วไปสำหรับสามฟาร์ม:
;
ความแปรปรวนทั้งหมดในสัดส่วนโคนม:
ความแปรปรวนภายในกลุ่ม:
;
;
.
ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:
ความแปรปรวนระหว่างกลุ่ม:
เมื่อใช้กฎสำหรับการเพิ่มความแปรปรวน เราได้รับ: 0.1025+0.0031=0.1056 ตัวอย่างถูกต้อง
ตัวอย่างที่ 3.5
จากข้อมูลตัวอย่างการสำรวจค่าจ้างพนักงานภาครัฐได้ตัวชี้วัดดังนี้ (ตารางที่ 3.4)
ตารางที่ 3.4
กำหนด:
เงินเดือนเฉลี่ยในสองอุตสาหกรรม
การกระจายค่าจ้าง:
ก) ค่าเฉลี่ยของการกระจายกลุ่ม (อุตสาหกรรม)
b) ระหว่างกลุ่ม (ภาคส่วน),
ค่าสัมประสิทธิ์การกำหนด
ความสัมพันธ์เชิงประจักษ์
วิธีการแก้
เงินเดือนเฉลี่ยของคนงานในสองอุตสาหกรรมคำนวณโดยสูตร (2.10):
ถู.
ผลต่างของค่าจ้าง:
ก) ค่าเฉลี่ยของการกระจายตัวของกลุ่มตาม (3.14)
b) การกระจายระหว่างกลุ่มตาม (3.12)
.
c) ความแปรปรวนทั้งหมดที่ได้รับตามกฎสำหรับการเพิ่มความแปรปรวน (3.15):
ค่าสัมประสิทธิ์ของการกำหนดเท่ากับค่า
; (3.23)
เหล่านั้น.
คิดเป็น 44.24%
แสดงให้เห็นว่าค่าตอบแทน 44.24% ขึ้นอยู่กับความร่วมมือตามภาคส่วนของพนักงาน และ 55.76% - เหตุผลภายในอุตสาหกรรม
ตามสูตร (3.16) อัตราส่วนสหสัมพันธ์เชิงประจักษ์
,
ซึ่งบ่งชี้ถึงผลกระทบอย่างมีนัยสำคัญต่อความแตกต่างของค่าจ้างของลักษณะเฉพาะสาขา
ความสัมพันธ์เชิงประจักษ์
มีการใช้ตัวบ่งชี้หลายตัวเพื่อวัดความใกล้ชิดของการเชื่อมโยง ด้วยการเชื่อมต่อแบบคู่ ความแน่นของการเชื่อมต่อจะถูกกำหนดเป็นอันดับแรกโดยอัตราส่วนสหสัมพันธ์ซึ่งแสดงด้วย η กำลังสองของอัตราส่วนสหสัมพันธ์คืออัตราส่วนของความแปรปรวนระหว่างกลุ่มของลักษณะผลลัพธ์ ซึ่งแสดงผลของความแตกต่างในลักษณะปัจจัยการจัดกลุ่มต่อค่าเฉลี่ยของลักษณะผลลัพธ์ ต่อความแปรปรวนทั้งหมดของลักษณะผลลัพธ์ ซึ่งแสดงความ ผลกระทบจากเหตุและปัจจัยทั้งหมด กำลังสองของอัตราส่วนสหสัมพันธ์เรียกว่า สัมประสิทธิ์ของการกำหนด
ปรากฏการณ์ ny และสัญญาณของพวกเขา: ________________ หรือกำหนดขึ้นอย่างตายตัว
โดยที่ k คือจำนวนของกลุ่ม
N คือจำนวนการสังเกต
y ผม - ค่าเริ่มต้นของคุณสมบัติที่มีประสิทธิภาพ
y j - ค่าเฉลี่ยของแอตทริบิวต์ที่มีประสิทธิภาพสำหรับกลุ่มนี้
y คือค่าเฉลี่ยของคุณลักษณะ
fj คือขนาดของกลุ่ม
สูตรข้างต้นใช้เมื่อคำนวณตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อสำหรับการจัดกลุ่มเชิงวิเคราะห์ เมื่อคำนวณอัตราส่วนสหสัมพันธ์ตามระดับของการสื่อสาร จะใช้สูตรต่อไปนี้:
ผลรวมของกำลังสองในตัวเศษคือความแปรปรวนของคุณลักษณะผลลัพธ์ y ที่อธิบายโดยความสัมพันธ์กับตัวประกอบ x (ตัวประกอบ) คำนวณจากข้อมูลส่วนตัวที่ได้รับสำหรับแต่ละหน่วยของประชากรตามสมการการถดถอย
หากเลือกสมการไม่ถูกต้องหรือเกิดข้อผิดพลาดเมื่อคำนวณพารามิเตอร์ ผลรวมของกำลังสองในตัวเศษอาจมากกว่าในตัวส่วน และอัตราส่วนจะสูญเสียความหมายที่ควรจะเป็น เพื่อหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด ควรคำนวณอัตราส่วนสหสัมพันธ์โดยใช้สูตรต่อไปนี้:
สูตรนี้ขึ้นอยู่กับกฎที่รู้จักกันดีสำหรับการขยายผลรวมของส่วนเบี่ยงเบนกำลังสองเมื่อจัดกลุ่มประชากร:
ง ทั่วไป= ง อินเตอร์+ด ภายใน
ตามกฎนี้ แทนที่จะใช้ความแปรปรวนระหว่างกลุ่ม (แฟกทอเรียล) คุณสามารถใช้ความแตกต่างได้:
ง ทั่วไป-ด ภายใน
สิ่งที่ช่วยให้:
เมื่อคำนวณ η ไม่ใช่โดยการจัดกลุ่ม แต่โดยสมการสหสัมพันธ์ (สมการถดถอย) เราใช้สูตร ในกรณีนี้ กฎการสลายตัวสำหรับผลรวมของการเบี่ยงเบนกำลังสองของคุณลักษณะที่เป็นผลลัพธ์จะถูกเขียนเป็น
D ทั้งหมด \u003d D แกน + D ส่วนที่เหลือ
จุดสำคัญที่สุดที่ควรเรียนรู้โดยใครก็ตามที่ต้องการใช้วิธีการวิเคราะห์การถดถอยสหสัมพันธ์อย่างถูกต้องคือการตีความสูตร (1.2) และ (1.3) บทบัญญัตินี้อ่าน:
สมการสหสัมพันธ์จะวัดความสัมพันธ์ระหว่างการแปรผันของคุณลักษณะที่เป็นผลลัพธ์และการแปรผันของคุณลักษณะปัจจัย การวัดความหนาแน่นของการเชื่อมต่อจะวัดสัดส่วนของความแปรผันของคุณลักษณะที่เป็นผลลัพธ์ ซึ่งสัมพันธ์กับความแปรผันของคุณลักษณะปัจจัย (คุณลักษณะ)
| | การบรรยายครั้งต่อไป ==> | |
อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความผันผวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ที่เกิดจากปัจจัยที่ศึกษา ค่าเฉลี่ยสหสัมพันธ์เชิงประจักษ์มีค่าตั้งแต่ 0 ถึง 1
ความสัมพันธ์เชิงประจักษ์มักพบใน ประเภทต่อไปนี้งาน:
- 1) เมื่อจำเป็นต้องสร้างการจัดกลุ่มเชิงวิเคราะห์สำหรับชุดข้อมูล X และ Y สองชุด
- 2) จัดกลุ่มเรียบร้อยแล้ว จำเป็นต้องตรวจสอบกฎสำหรับการเพิ่มความแปรปรวน
- 3) สำหรับชุดข้อมูล X และ Y สองชุด จำเป็นต้องค้นหาสมการการถดถอยและประเมินความสำคัญของมัน
สูตรผลต่างคุณลักษณะทางเลือก
จากข้อมูลข้างต้น เราสามารถหาสูตรสำหรับค้นหาความแปรปรวนของคุณลักษณะทางเลือกได้ หากเราทราบเปอร์เซ็นต์ของคุณลักษณะดังกล่าวในตัวอย่างทั้งหมด
ในขั้นต้น เราคิดว่าคุณลักษณะนี้ใช้ค่าเพียงสองค่าเท่านั้น
ดังนั้น ผลรวมของสัดส่วนขององค์ประกอบที่องค์ประกอบของอนุกรมสถิติมีค่าแอตทริบิวต์ "ไม่" และองค์ประกอบของอนุกรมที่มีค่าแอตทริบิวต์ "ใช่" เท่ากับหนึ่ง
ในการค้นหาค่าเฉลี่ยของซีรีส์ เราจะแทนค่าของคุณลักษณะทางเลือก (0 และ 1) ลงในสูตรเพื่อค้นหาค่าเฉลี่ยถ่วงน้ำหนักของซีรีส์ทางสถิติ จากที่เห็นได้ชัดว่าจะมีหน่วยในตัวส่วนและค่าเปอร์เซ็นต์ขององค์ประกอบ "1" ในตัวเศษ นั่นคือค่าเปอร์เซ็นต์ขององค์ประกอบที่มีแอตทริบิวต์ "1" (สูตร 2)
สูตรความแปรปรวนคือค่าเฉลี่ยถ่วงน้ำหนักของความเบี่ยงเบนกำลังสองของแต่ละค่าในชุดข้อมูล (สูตร 3)
เนื่องจากในชุดข้อมูลของเรามีค่าเพียงสองประเภทคือ "0" และ "1" ดังนั้นสูตรสำหรับค้นหาความแปรปรวนสำหรับชุดข้อมูลที่มีคุณสมบัติทางเลือกจึงลดลงเหลือสูตร 4 คำอธิบาย เนื่องจากเราอนุมานได้ว่าค่าเฉลี่ยตัวอย่างเท่ากับ p (สูตร 2) ดังนั้นค่าของกำลังสองของผลต่างระหว่างค่า (0/1) และค่าเฉลี่ยตามสูตร 1 จะเป็น (1- p)2 ในกรณีแรก และในกรณีที่สอง (1-q)2 ตอนนี้ใช้ผลสรุปจากสูตรแรก: q = 1 - p, p = 1- q . เราได้ p2 และ q2 ดังนั้นสัดส่วนของค่า "0" และ "1" จึงเท่ากับ p และ q เป็นผลให้ในตัวเศษและกลายเป็น q2 p และ p2 q ผลรวมของการแบ่งปันคุณสมบัติของค่า "0" และ "1" ตามสูตร 1 เท่ากับ 1 ดังนั้นสูตร 4 จึงใช้ค่า pq ซึ่งจะเท่ากับค่าความแปรปรวนของ คุณสมบัติทางเลือก จากค่าที่พบของความแปรปรวนของคุณลักษณะทางเลือก เราจะหาค่าเบี่ยงเบนมาตรฐาน (สูตร 5) การใส่ค่าจากสูตร 1 ลงในสูตร 5 เราจะได้สูตรส่วนเบี่ยงเบนมาตรฐานสำหรับความแปรปรวนของอนุกรมที่มีคุณสมบัติทางเลือก