บ้าน › เด็ก › กำหนดตัวอย่างอัตราส่วนความสัมพันธ์เชิงประจักษ์ ค่าสัมประสิทธิ์สหสัมพันธ์และค่าสัมประสิทธิ์ของการกำหนด

กำหนดตัวอย่างอัตราส่วนความสัมพันธ์เชิงประจักษ์ ค่าสัมประสิทธิ์สหสัมพันธ์และค่าสัมประสิทธิ์ของการกำหนด

วิธีการแก้. ในการคำนวณการกระจายกลุ่ม เราจะคำนวณค่าเฉลี่ยสำหรับแต่ละกลุ่ม:

พีซีเอส.; พีซีเอส

การคำนวณผลต่างระดับกลางตามกลุ่มแสดงในตาราง 3.2. แทนค่าที่ได้รับลงในสูตร (3.4) เราได้รับ:

ค่าเฉลี่ยของความแปรปรวนของกลุ่ม

จากนั้นเราจะคำนวณความแปรปรวนระหว่างกลุ่ม ในการดำเนินการนี้ ก่อนอื่น เราจะกำหนดค่าเฉลี่ยโดยรวมเป็นค่าเฉลี่ยถ่วงน้ำหนักของค่าเฉลี่ยกลุ่ม:

ตอนนี้เรากำหนดความแปรปรวนระหว่างกลุ่ม

ดังนั้น ความแปรปรวนทั้งหมดตามกฎของการบวกความแปรปรวน:

ตรวจสอบผลลัพธ์โดยการคำนวณความแปรปรวนทั้งหมด ด้วยวิธีปกติ:

ตามกฎสำหรับการเพิ่มความแปรปรวน เป็นไปได้ที่จะกำหนดตัวบ่งชี้ความใกล้ชิดของความสัมพันธ์ระหว่างการจัดกลุ่ม (แฟกทอเรียล) และคุณลักษณะที่มีประสิทธิภาพ เรียกว่าอัตราส่วนสหสัมพันธ์เชิงประจักษ์ซึ่งแสดง ("นี่") และคำนวณโดยสูตร

สำหรับตัวอย่างของเรา เชิงประจักษ์ ความสัมพันธ์

ค่า 0.86 แสดงลักษณะความสัมพันธ์ที่สำคัญระหว่างการจัดกลุ่มและลักษณะการทำงาน

ค่านี้เรียกว่าค่าสัมประสิทธิ์ของการกำหนดและแสดงส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด

นอกเหนือจากการเปลี่ยนแปลงของลักษณะเชิงปริมาณแล้ว ยังสามารถสังเกตการเปลี่ยนแปลงของลักษณะเชิงคุณภาพได้อีกด้วย การศึกษาความแปรผันดังกล่าวสำเร็จสำหรับสัดส่วนของลักษณะเชิงปริมาณ โดยการคำนวณและวิเคราะห์ความแปรปรวนประเภทต่างๆ ต่อไปนี้

ความแปรปรวนภายในกลุ่มของส่วนแบ่งถูกกำหนดโดยสูตร

. (3.17)

ค่าเฉลี่ยของผลต่างภายในกลุ่มคำนวณเป็น

. (3.18)

สูตรความแปรปรวนระหว่างกลุ่มมีดังนี้:

, (3.19)

ที่ไหน ฉัน– จำนวนหน่วยในกลุ่มแยก;

- สัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร

ความแปรปรวนทั้งหมดมีรูปแบบ

. (3.21)

การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้:

. (3.22)

ตัวอย่าง 3.4

เรามานิยามความแปรปรวนของกลุ่ม ค่าเฉลี่ยของกลุ่ม ระหว่างกลุ่ม และความแปรปรวนทั้งหมดตามข้อมูลในตาราง 3.3.

ตารางที่ 3.3

จำนวนและ แรงดึงดูดเฉพาะหนึ่งในหมวดหมู่
พื้นที่ฟาร์มเลี้ยงวัว

วิธีการแก้

ให้เรากำหนดส่วนแบ่งของโคนมโดยทั่วไปสำหรับสามฟาร์ม:

ความแปรปรวนทั้งหมดในสัดส่วนโคนม:

ความแปรปรวนภายในกลุ่ม:

; ; .

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

ความแปรปรวนระหว่างกลุ่ม:

เมื่อใช้กฎสำหรับการเพิ่มความแปรปรวน เราได้รับ: 0.1025+0.0031=0.1056 ตัวอย่างถูกต้อง

ตัวอย่างที่ 3.5

จากข้อมูลตัวอย่างการสำรวจค่าจ้างพนักงานภาครัฐได้ตัวชี้วัดดังนี้ (ตารางที่ 3.4)

ตารางที่ 3.4

กำหนด:

1) เงินเดือนเฉลี่ยในสองอุตสาหกรรม

2) การกระจายค่าจ้าง:

ก) ค่าเฉลี่ยของการกระจายกลุ่ม (อุตสาหกรรม)

b) ระหว่างกลุ่ม (ภาคส่วน),

3) ค่าสัมประสิทธิ์ของการกำหนด;

4) ความสัมพันธ์เชิงประจักษ์

วิธีการแก้

1. ปานกลาง ค่าจ้างพนักงานในสองอุตสาหกรรมคำนวณโดยสูตร (2.10):

ถู.

2. ผลต่างของค่าจ้าง:

ก) ค่าเฉลี่ยของการกระจายตัวของกลุ่มตาม (3.14)

b) การกระจายระหว่างกลุ่มตาม (3.12)

c) ความแปรปรวนทั้งหมดที่ได้รับตามกฎสำหรับการเพิ่มความแปรปรวน (3.15):

3. ค่าสัมประสิทธิ์ของการกำหนดเท่ากับค่า

เหล่านั้น. คิดเป็น 44.24%

แสดงให้เห็นว่าค่าตอบแทน 44.24% ขึ้นอยู่กับความร่วมมือตามภาคส่วนของพนักงาน และ 55.76% - เหตุผลภายในอุตสาหกรรม

ตามสูตร (3.16) อัตราส่วนสหสัมพันธ์เชิงประจักษ์ ,

ซึ่งบ่งชี้ถึงผลกระทบอย่างมีนัยสำคัญต่อความแตกต่างของค่าจ้างของคุณลักษณะรายสาขา

3.2. งานสำหรับโซลูชันอิสระ

ภารกิจ 3.1

จากการกระจายคนงาน 60 คนตามประเภทอัตราค่าไฟฟ้า มีข้อมูลต่อไปนี้ (ตารางที่ 3.5)

ตารางที่ 3.5

กำหนด:

1) ประเภทค่าจ้างเฉลี่ยของคนงาน

2) ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

3) การกระจาย;

4) ส่วนเบี่ยงเบนมาตรฐาน

5) ค่าสัมประสิทธิ์ของการแปรผัน

ภารกิจ 3.2

จากผลการสอบของหลักสูตรที่ 1 และ 2 ของมหาวิทยาลัยแห่งใดแห่งหนึ่งมีข้อมูลต่อไปนี้: ในปีที่ 1 นักเรียน 85% ผ่านเซสชันโดยไม่มีสองครั้งในปีที่ 2 - 90%

กำหนดความแปรปรวนของสัดส่วนของนักเรียนที่ผ่านเซสชั่นในแต่ละหลักสูตร

ภารกิจ 3.3

บริษัทร่วมทุนในภูมิภาคตามจำนวนพนักงานเฉลี่ย ณ วันที่ 1 มกราคม 2547 จำแนกได้ดังนี้ (ตารางที่ 3.6)

ตารางที่ 3.6

คำนวณ:

1) ค่าเบี่ยงเบนเชิงเส้นเฉลี่ย

2) การกระจาย;

3) ส่วนเบี่ยงเบนมาตรฐาน

4) ค่าสัมประสิทธิ์ของการแปรผัน

ภารกิจ 3.4

มีข้อมูลเกี่ยวกับการกระจายครอบครัวของพนักงานขององค์กรตามจำนวนบุตร (ตารางที่ 3.7)

ตารางที่ 3.7

คำนวณ:

1) การกระจายตัวภายในกลุ่ม

2) ค่าเฉลี่ยของการกระจายตัวภายในกลุ่ม

3) การกระจายระหว่างกลุ่ม;

4) ความแปรปรวนทั้งหมด

ตรวจสอบความถูกต้องของการคำนวณโดยใช้กฎการบวกผลต่าง

ภารกิจ 3.5

การกระจายต้นทุนของผลิตภัณฑ์สำหรับการส่งออกโดยร้านค้าขององค์กรแสดงด้วยข้อมูลต่อไปนี้ (ตารางที่ 3.8)

ตารางที่ 3.8

คำนวณ:

1) ค่าเฉลี่ยของสินค้าภายในกลุ่ม ระหว่างกลุ่ม และส่วนแบ่งรวมของสินค้าส่งออก;

2) ค่าสัมประสิทธิ์ของการกำหนดและความสัมพันธ์เชิงประจักษ์

ภารกิจ 3.6

จากการสำรวจธนาคารพาณิชย์ในเมือง 70% ของจำนวนลูกค้าทั้งหมดเป็นนิติบุคคลโดยมีเงินกู้เฉลี่ย 120,000 รูเบิล และค่าสัมประสิทธิ์การแปรผัน 25% และ 20% - บุคคลด้วยขนาดเงินกู้เฉลี่ย 20,000 รูเบิล โดยมีค่าเบี่ยงเบนกำลังสองเฉลี่ย 6,000 รูเบิล

ใช้กฎสำหรับการเพิ่มความแปรปรวน กำหนดความใกล้ชิดของความสัมพันธ์ระหว่างขนาดของสินเชื่อและประเภทของลูกค้าโดยการคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์

หมวดที่ 4 การสังเกตแบบเลือก

4.1. คำแนะนำเชิงระเบียบวิธี
และวิธีแก้ปัญหาของงานทั่วไป

จุดประสงค์ของการสังเกตตัวอย่างคือการกำหนดลักษณะของประชากรทั่วไป - ค่าเฉลี่ยทั่วไป ( o) และส่วนแบ่งทั่วไป ( ร). ลักษณะของประชากรตัวอย่าง - ค่าเฉลี่ยตัวอย่าง () และส่วนแบ่งตัวอย่าง () แตกต่างจากลักษณะทั่วไปตามจำนวนข้อผิดพลาดในการสุ่มตัวอย่าง () ดังนั้น เพื่อกำหนดคุณลักษณะของประชากรทั่วไป จึงจำเป็นต้องคำนวณข้อผิดพลาดในการสุ่มตัวอย่างหรือข้อผิดพลาดในการเป็นตัวแทน ซึ่งกำหนดโดยสูตรที่พัฒนาขึ้นในทฤษฎีความน่าจะเป็นสำหรับตัวอย่างแต่ละประเภทและวิธีการคัดเลือก

การสุ่มตัวอย่างที่เหมาะสมและเชิงกลในกรณีของการสุ่มตัวอย่างซ้ำ ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับค่าเฉลี่ย () และสำหรับสัดส่วน () จะคำนวณโดยสูตร

; (4.1)

(4.2)

ความแปรปรวนของประชากรตัวอย่างอยู่ที่ไหน

น- ขนาดตัวอย่าง;

ทีคือค่าสัมประสิทธิ์ความเชื่อมั่นซึ่งพิจารณาจากตารางค่าของฟังก์ชันอินทิกรัล Laplace สำหรับความน่าจะเป็นที่กำหนด ( พี ดอส) (ตาราง A1).

ด้วยการสุ่มแบบไม่ซ้ำและการเลือกเชิงกล สูตรจะคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม

; (4.3)

, (4.4)

ที่ไหน เอ็น- ขนาดของประชากรทั่วไป

ตัวอย่าง 4.1

เพื่อกำหนดปริมาณเถ้าของถ่านหินในแหล่งสะสม ถ่านหิน 100 ตัวอย่างถูกสุ่มตรวจ จากการสำรวจพบว่าปริมาณเถ้าเฉลี่ยของถ่านหินในตัวอย่างคือ 16% ส่วนเบี่ยงเบนมาตรฐานคือ 5% ใน 10 ตัวอย่าง ปริมาณเถ้าของถ่านหินมากกว่า 20% ด้วยความน่าจะเป็น 0.954 ให้กำหนดขีดจำกัดที่ปริมาณขี้เถ้าเฉลี่ยของถ่านหินในแหล่งสะสมและสัดส่วนของถ่านหินที่มีปริมาณเถ้ามากกว่า 20%

วิธีการแก้

ปริมาณเถ้าเฉลี่ยของถ่านหินจะอยู่ภายใน

ในการกำหนดขอบเขตของค่าเฉลี่ยทั่วไป เราคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับค่าเฉลี่ยโดยใช้สูตร (4.1):

. (4.5)

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าปริมาณขี้เถ้าเฉลี่ยของถ่านหินในเงินฝากจะอยู่ภายใน 16% 1% หรือ 15% 17%

ส่วนแบ่งของถ่านหินที่มีปริมาณเถ้ามากกว่า 20% จะอยู่ภายใน

ส่วนแบ่งตัวอย่างถูกกำหนดโดยสูตร

ที่ไหน มคือสัดส่วนของหน่วยที่มีคุณสมบัติ

ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับส่วนแบ่ง () คำนวณโดยสูตร (4.2):

หรือ ±6%

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าสัดส่วนของถ่านหินที่มีปริมาณเถ้ามากกว่า 20% ในเงินฝากจะอยู่ภายใน , หรือ .

ตัวอย่าง 4.2

ในการกำหนดระยะเวลาเฉลี่ยของการใช้เงินกู้ระยะสั้นในธนาคาร ได้ทำการสร้างตัวอย่างเชิงกล 5% ซึ่งรวมบัญชี 100 บัญชี จากการสำรวจพบว่าระยะเวลาเฉลี่ยของการใช้เงินกู้ระยะสั้นอยู่ที่ 30 วัน โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ 9 วัน ใน 5 บัญชี ระยะเวลาการใช้เงินกู้เกิน 60 วัน ด้วยความน่าจะเป็น 0.954 ให้กำหนดขอบเขตระยะเวลาการใช้เงินกู้ระยะสั้นในประชากรทั่วไปและสัดส่วนของบัญชีที่มีระยะเวลาการใช้เงินกู้ระยะสั้นมากกว่า 60 วัน

วิธีการแก้

ระยะเวลาเฉลี่ยการใช้เงินกู้ธนาคารอยู่ภายใน

เนื่องจากการสุ่มตัวอย่างเป็นแบบกลไก ข้อผิดพลาดในการสุ่มตัวอย่างจึงถูกกำหนดโดยสูตร (2.3):

วัน.

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าระยะเวลาการใช้เงินกู้ระยะสั้นในธนาคารคือภายใน = 30 วัน 2 วันหรือ

28 วันต่อวัน

ส่วนแบ่งของเงินให้กู้ยืมที่มีระยะเวลาครบกำหนดมากกว่า 60 วันอยู่ภายใน

ส่วนแบ่งตัวอย่างจะเป็น

ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับการแบ่งปันถูกกำหนดโดยสูตร (4.4):

หรือ 4.2%

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าส่วนแบ่งของสินเชื่อธนาคารที่มีระยะเวลาครบกำหนดมากกว่า 60 วันจะอยู่ภายใน หรือ

ตัวอย่างทั่วไปในการเลือกแบบทั่วไป (แบ่งโซน) ประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่มพื้นที่ทั่วไปที่เป็นเนื้อเดียวกัน ดำเนินการเลือกหน่วยการสังเกตในชุดตัวอย่าง วิธีการต่างๆ. พิจารณาตัวอย่างทั่วไปที่มีการเลือกตามสัดส่วนภายในกลุ่มทั่วไป

ขนาดตัวอย่างจากกลุ่มทั่วไปในการเลือกตามสัดส่วนของจำนวนกลุ่มทั่วไปถูกกำหนดโดยสูตร

ที่ไหน ฉันคือขนาดตัวอย่างจากกลุ่มทั่วไป

ฉันเป็นปริมาตรของกลุ่มทั่วไป

ข้อผิดพลาดเล็กน้อยของค่าเฉลี่ยตัวอย่างและสัดส่วนสำหรับการสุ่มแบบไม่ซ้ำและ ทางกลการเลือกภายในกลุ่มทั่วไปคำนวณโดยสูตร

; (4.8)

, (4.9)

ความแปรปรวนของประชากรตัวอย่างอยู่ที่ไหน

ตัวอย่าง 4.3

ในการกำหนดอายุเฉลี่ยของผู้ชายที่เข้าสู่การแต่งงาน กลุ่มตัวอย่างทั่วไป 5% ถูกสร้างขึ้นในเขตด้วยการเลือกหน่วยตามสัดส่วนขนาดของกลุ่มทั่วไป ภายในกลุ่มใช้การเลือกเชิงกล ข้อมูลสรุปไว้ในตาราง 4.1.

ตารางที่ 4.1

ด้วยความน่าจะเป็น 0.954 กำหนดขีดจำกัดที่ อายุเฉลี่ยผู้ชายที่แต่งงานและสัดส่วนของผู้ชายที่แต่งงานครั้งที่สอง

วิธีการแก้

อายุเฉลี่ยของการแต่งงานสำหรับผู้ชายอยู่ในช่วง

อายุเฉลี่ยของการแต่งงานของผู้ชายในกลุ่มตัวอย่างถูกกำหนดโดยสูตรของค่าเฉลี่ยถ่วงน้ำหนัก

= ของปี.

ความแปรปรวนตัวอย่างเฉลี่ยถูกกำหนดโดยสูตร
กลาง

เราคำนวณข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มโดยใช้สูตร (4.8):

ของปี.

ด้วยความน่าจะเป็น 0.954 อาจเป็นที่ถกเถียงกันอยู่ว่าอายุเฉลี่ยของผู้ชายที่แต่งงานจะอยู่ในช่วงปีต่อปีหรือ

อายุ 24 ปี.

สัดส่วนของผู้ชายที่แต่งงานใหม่จะอยู่ภายใน

ส่วนแบ่งตัวอย่างถูกกำหนดโดยสูตรของค่าเฉลี่ย

หรือ 14%

ความแปรปรวนของตัวอย่างโดยเฉลี่ย คุณสมบัติทางเลือกคำนวณตามสูตร

(4.12)

ข้อผิดพลาดในการสุ่มตัวอย่างสำหรับการแบ่งปันถูกกำหนดโดยสูตร (4.9):

หรือ 6%

ด้วยความน่าจะเป็น 0.954 สามารถโต้แย้งได้ว่าสัดส่วนของผู้ชายที่แต่งงานครั้งที่สองจะอยู่ภายใน , หรือ .

การสุ่มตัวอย่างแบบอนุกรมด้วยวิธีการเลือกแบบอนุกรมประชากรทั่วไปจะถูกแบ่งออกเป็นกลุ่มที่มีขนาดเท่ากัน - ชุด ซีรีส์ถูกเลือกในชุดตัวอย่าง ภายในซีรีส์ มีการสังเกตหน่วยที่ตกอยู่ในซีรีส์อย่างต่อเนื่อง

ในกรณีของการเลือกอนุกรมแบบไม่ซ้ำ ข้อผิดพลาดเล็กน้อยของค่าเฉลี่ยตัวอย่างและสัดส่วนจะถูกกำหนดโดยสูตร

, (4.13)

ความแปรปรวนของอินเตอร์ซีรีส์อยู่ที่ไหน

รคือจำนวนซีรีส์ในประชากรทั่วไป

ร– จำนวนซีรีส์ที่เลือก

ตัวอย่าง 4.4

มีทีมงาน 10 คนในร้านค้าขององค์กร เพื่อศึกษาผลิตภาพแรงงาน กลุ่มตัวอย่าง 20% ได้ดำเนินการ ซึ่งรวมถึง 2 กลุ่ม จากการสำรวจพบว่าผลผลิตเฉลี่ยของคนงานในทีมคือ 4.6 และ 3 ตัน ด้วยความน่าจะเป็น 0.997 กำหนดขีด จำกัด ซึ่งผลผลิตเฉลี่ยของคนงานในร้านค้าจะเป็น เสื้อ หรือ ที

ตัวอย่าง 4.5

มีสินค้าในสต๊อก ผลิตภัณฑ์สำเร็จรูปเวิร์กช็อปประกอบด้วยกล่องชิ้นส่วน 200 กล่อง กล่องละ 40 ชิ้น ในการตรวจสอบคุณภาพของผลิตภัณฑ์สำเร็จรูป ได้ทำการสร้างตัวอย่างอนุกรม 10% จากการสุ่มตัวอย่างพบว่ามีสัดส่วนของชิ้นส่วนที่ชำรุดอยู่ที่ 15% ความแปรปรวนตัวอย่างอนุกรมคือ 0.0049

ด้วยความน่าจะเป็น 0.997 ให้กำหนดขีดจำกัดที่สัดส่วนของผลิตภัณฑ์ที่บกพร่องในชุดกล่องอยู่

วิธีการแก้

สัดส่วนของชิ้นส่วนที่ชำรุดจะอยู่ภายใน

ให้เราพิจารณาข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่มสำหรับการแบ่งปันตามสูตร (4.13):

หรือ 4.4%

ด้วยความน่าจะเป็น 0.997 อาจเป็นที่ถกเถียงกันอยู่ว่าสัดส่วนของชิ้นส่วนที่ชำรุดในชุดงานอยู่ในช่วง 10.6% 19.6%

ตัวอย่าง 4.6

ในแคว้นที่ประกอบด้วย 20 เขต การสำรวจผลผลิตตัวอย่างได้ดำเนินการตามการเลือกชุด (เขต) ค่าเฉลี่ยตัวอย่างสำหรับเขตคือ 14.5 c/ha ตามลำดับ; 16; 15.5; 15 และ 14 คิว/เฮกตาร์ ด้วยความน่าจะเป็น 0.954 จงหาขีดจำกัดผลผลิตในพื้นที่ทั้งหมด

วิธีการแก้

คำนวณค่าเฉลี่ยโดยรวม:

ค/เฮกตาร์

ความแปรปรวนระหว่างกลุ่ม (interseries)

ให้เราพิจารณาข้อผิดพลาดเล็กน้อยของตัวอย่างที่ไม่ซ้ำแบบอนุกรม (t = 2, P dov = 0.954) โดยใช้สูตร (4.13):

ดังนั้นผลผลิตในภูมิภาค (ด้วยความน่าจะเป็น 0.954) จะอยู่ภายใน

15-1,7≤ ≤15+1,7,

13.3 c/ha ≤ ≤16.7 c/ha

ในการออกแบบการสังเกตตัวอย่างจำเป็นต้องหาขนาดของตัวอย่างซึ่งจำเป็นเพื่อให้แน่ใจว่ามีความแม่นยำในการคำนวณลักษณะทั่วไป - ค่าเฉลี่ยและสัดส่วน ในกรณีนี้ ข้อผิดพลาดในการสุ่มตัวอย่างส่วนเพิ่ม ความน่าจะเป็นที่จะเกิดขึ้น และการเปลี่ยนแปลงของคุณลักษณะจะทราบล่วงหน้า

ด้วยการสุ่มตัวอย่างซ้ำ ขนาดตัวอย่างจะถูกกำหนดจากนิพจน์

ด้วยการสุ่มแบบไม่ซ้ำและการเลือกเชิงกล ขนาดตัวอย่างจะคำนวณตามสูตร

. (4.16)

สำหรับตัวอย่างทั่วไป

. (4.17)

สำหรับการสุ่มตัวอย่างแบบอนุกรม

. (4.18)

ตัวอย่าง 4.7

มี 2,000 ครอบครัวอาศัยอยู่ในเขต มีการวางแผนที่จะดำเนินการสำรวจตัวอย่างของพวกเขาโดยวิธีการสุ่มเลือกแบบไม่ซ้ำเพื่อหาขนาดเฉลี่ยของครอบครัว กำหนดขนาดตัวอย่างที่ต้องการ โดยมีเงื่อนไขว่าด้วยความน่าจะเป็น 0.954 ข้อผิดพลาดในการสุ่มตัวอย่างต้องไม่เกินหนึ่งคนโดยมีค่าเบี่ยงเบนมาตรฐานเท่ากับสามคน ( = 3)

วิธีการแก้

ด้วยการสุ่มเลือกแบบไม่ซ้ำ จะได้ขนาดตัวอย่างตามสูตร (4.16) ครอบครัว

ขนาดตัวอย่าง: อย่างน้อย 36 ครอบครัว

ตัวอย่าง 4.8

เมือง A มี 10,000 ครอบครัว ด้วยความช่วยเหลือของการสุ่มตัวอย่างเชิงกล มันควรจะกำหนดสัดส่วนของครอบครัวที่มีลูกสามคนขึ้นไป ขนาดตัวอย่างควรเป็นเท่าใดเพื่อให้มีความน่าจะเป็น 0.954 ที่ข้อผิดพลาดในการสุ่มตัวอย่างไม่เกิน 0.02 หากทราบความแปรปรวนจากการสำรวจครั้งก่อนว่าเป็น 0.2

วิธีการแก้

ให้เรากำหนดขนาดตัวอย่างที่ต้องการตามสูตร (4.16):

ขนาดตัวอย่าง: ไม่น้อยกว่า 1667

ในทางสถิติ มักจำเป็นต้องเปรียบเทียบผลลัพธ์ของตัวอย่างสองตัวอย่าง (หรือมากกว่า) จากการเปรียบเทียบค่าเฉลี่ยตัวอย่างสองค่า (หรือส่วนแบ่ง) จะได้ข้อสรุปเกี่ยวกับการสุ่มหรือความสำคัญของความแตกต่าง

สำหรับสิ่งนี้ ความแตกต่างสัมบูรณ์ระหว่างตัวบ่งชี้ของค่าเฉลี่ยตัวอย่างจะถูกเปรียบเทียบกับข้อผิดพลาดเฉลี่ยของความแตกต่าง:

. (4.19)

พบ ทีคำนวณ เปรียบเทียบกับ ทีแท็บ บน ที- การกระจายของนักเรียน (ตาราง P2) สำหรับจำนวนองศาอิสระ โวลต์=น 1 +น 2 -2 และระดับนัยสำคัญที่กำหนด a. (ที่นี่ น 1 และ น 2 – ปริมาตรของตัวอย่างเปรียบเทียบ)

คำตอบ

การประเมินเชิงปริมาณของความใกล้ชิดของการสื่อสารตามข้อมูลเชิงประจักษ์ประกอบด้วยตัวบ่งชี้การคำนวณความใกล้ชิดของการสื่อสาร:

· ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (อัตราส่วนการกระจายเชิงประจักษ์) - r 2 .

ตัวบ่งชี้นี้คำนวณตามข้อมูลของการจัดกลุ่มการวิเคราะห์ (ตาราง) โดยเป็นอัตราส่วนของความแปรปรวนระหว่างกลุ่มของลักษณะผลลัพธ์ Y (d y 2) ต่อความแปรปรวนทั้งหมด Y (s y 2):

ตามทฤษฎีบทการสลายตัวของความแปรปรวน ความแปรปรวนระหว่างกลุ่มเกี่ยวข้องกับความแปรปรวนทั้งหมด: s y 2 =d y 2 +e y 2 แล้ว ค่าสัมประสิทธิ์เชิงประจักษ์การกำหนดสามารถคำนวณได้ผ่านผลต่างที่เหลือตามสูตร:

โดยที่ s j 2 คือความแปรปรวนของผลลัพธ์ Y ภายในกลุ่ม j

ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดลักษณะความแข็งแกร่งของอิทธิพลของแอตทริบิวต์การจัดกลุ่ม (X) ต่อการก่อตัวของการแปรผันโดยรวมของแอตทริบิวต์ผลลัพธ์ Y และแสดงเปอร์เซ็นต์ (ส่วนแบ่ง) ของการแปรผันของแอตทริบิวต์ผลลัพธ์เนื่องจากปัจจัยแอตทริบิวต์ที่อยู่ภายใต้ การจัดกลุ่ม

สะดวกในการคำนวณ r 2 ในตาราง:

สัญญาณปัจจัย X เจ	นิวเจอร์ซีย์	ค่าเฉลี่ยของคุณลักษณะ-ผลลัพธ์	s j 2 N j
x1	เอ็น 1		ส 1 2 น 1
x2	ยังไม่มีข้อความ 2		ส 2 2 น 2
....			...
X ม	N ม		เอส ม. 2 น. ม
ทั้งหมด	เอ็น	เอ็กซ์	es j 2

แล้ว .

พิจารณาตัวอย่าง ให้กำหนดคนงาน 20 คนโดยมีลักษณะดังต่อไปนี้: Y - ผลลัพธ์ของคนงาน (ชิ้น / กะ) และ X - คุณสมบัติ (อันดับ) ข้อมูลเริ่มต้นแสดงในตาราง:

เอ็กซ์

วาย

จำเป็นต้องประเมินความใกล้ชิดของความสัมพันธ์ระหว่างคุณลักษณะโดยใช้ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด (r 2)

ในการคำนวณ r 2 เราจะทำการวิเคราะห์กลุ่มประชากร ในฐานะปัจจัยเครื่องหมาย เราใช้ X (หมวดหมู่ของผู้ปฏิบัติงาน) เป็นผลลัพธ์เครื่องหมาย - Y ซึ่งเป็นผลลัพธ์ของผู้ปฏิบัติงาน) การจัดกลุ่มการวิเคราะห์ทำขึ้นบนพื้นฐานของ X. B กรณีนี้จะไม่ต่อเนื่อง (เนื่องจากค่าของแอตทริบิวต์ X ค่อนข้างซ้ำกัน) จำนวนกลุ่มเท่ากับจำนวนค่าของแอตทริบิวต์ X ในการรวมนั่นคือ 6. ผลลัพธ์ของการจัดกลุ่มและการคำนวณของ r 2 สรุปไว้ในตาราง:

ปัจจัยเครื่องหมาย X	แอตทริบิวต์ผลลัพธ์ Y	จำนวนหน่วยในกลุ่ม N j	ค่าเฉลี่ยของผลการลงชื่อในกลุ่ม	( - ) 2 N j	การกระจายของลักษณะ-ผลลัพธ์ในกลุ่ม s 2 j	s 2 j N j
			(10+12+13)/3=11,7	(11,7-17,1) 2 3=88,56	ส 2 1 \u003d ((10-11.7) 2 + (12-11.7) 2 + (13-11.7) 2) / 3 \u003d 1.56	4,7


			(11+14)/2=12,5	(12,5-17,1) 2 2=42,3	ส 2 2 \u003d ((11-12.5) 2 + (14-12.5) 2) / 2 \u003d 2.25	4,5

			(12+13+15+16)/4= 14	(14-17,1) 2 4=38,4	ส 2 3 \u003d ((12-14) 2 + (13-14) 2 + (15-14) 2 + (16-14) 2) / 4 \u003d 2.5



			(15+17+17+18)/4= 16,75	(16,75-17,1) 2 4=0,49	ส 2 4 \u003d ((15-16.75) 2 + (17-16.75) 2 ++ (17-16.75) 2 + (18-16.75) 2) / 4 \u003d 1.9	4,75



			(18+20+22)/3=20	(20-17,1) 2 3=25,23	ส 2 5 \u003d ((18-20) 2 + (20-20) 2 + (22-20) 2) / 3 \u003d 2.7


			(23+24+27+25)/4= 24,75	(24,75-17,1) 2 4=234,1	ส 2 6 \u003d ((23-24.75) 2 + (24-24.75) 2 + (27-24.75) 2 + (25-24.75) 2) / 4 \u003d 2.19	8,75



	=17,1			429,1		40,7

ค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเท่ากับอัตราส่วนของความแปรปรวนระหว่างกลุ่มของแอตทริบิวต์ผลลัพธ์ (d y 2) ต่อความแปรปรวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ (s y 2): r 2 = d y 2 /s y 2 = d y 2 /(d y 2 + อี y 2).

การกระจายระหว่างกลุ่ม Y จะเท่ากับ: d y 2 = å( - ) 2 N j / N = 429.1/20=21.45

ความแปรปรวนที่เหลือ Y จะเป็น: e y 2 = ås 2 j ·N j / N= 40.7/20= 2.035

จากนั้น: r 2 \u003d 21.45 / (21.45 + 2.035) \u003d 429.1 / (429.1 + 40.7) \u003d 0.913

สรุป: 91.3% ของการเปลี่ยนแปลงในผลผลิตของคนงานเกิดจากอิทธิพลของปัจจัยการปลดปล่อย

· ความสัมพันธ์เชิงประจักษ์ - ร.

ตัวบ่งชี้นี้เป็นรากของค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนด แสดงให้เห็นความแน่นของการเชื่อมต่อ (ไม่เฉพาะเชิงเส้น!) ระหว่างการจัดกลุ่มและคุณสมบัติการทำงาน ช่วงของค่าที่อนุญาตของอัตราส่วนสหสัมพันธ์เชิงประจักษ์คือตั้งแต่ 0 ถึง +1

ขีดสุด ปิดการเชื่อมต่อ- นี่คือความสัมพันธ์เชิงฟังก์ชัน เมื่อแต่ละค่าของแอตทริบิวต์-ผลลัพธ์ Y ถูกกำหนดโดยค่าของแอตทริบิวต์-แฟกเตอร์ X (เช่น ผลลัพธ์ของการจัดกลุ่ม) ในกรณีนี้ ความแปรปรวนของค่าเฉลี่ยของกลุ่ม (d y 2) เท่ากับความแปรปรวนทั้งหมด (s y 2) เช่น จะไม่มีการเปลี่ยนแปลงภายในกลุ่ม ในกรณีนี้ การกระจายที่เหลือ (e y 2) เท่ากับ 0 และค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดเท่ากับ 1

หากไม่มีการเชื่อมต่อระหว่างเครื่องหมาย แสดงว่าค่าเฉลี่ยของกลุ่มทั้งหมดมีค่าเท่ากัน จะไม่มีการเปลี่ยนแปลงระหว่างกลุ่ม (d y 2 =0) และค่าสัมประสิทธิ์เชิงประจักษ์ของการกำหนดคือ 0

ลองคำนวณอัตราส่วนสหสัมพันธ์เชิงประจักษ์สำหรับตัวอย่างของเรา: r= 0.9555 สรุป: สัญญาณของ "การผลิตของคนงาน" และ "การปลดออก" นั้นค่อนข้างสัมพันธ์กัน

ตัวบ่งชี้ r และ r 2 ไม่เพียงถูกกำหนดโดยการเชื่อมต่อระหว่างคุณสมบัติ X และ Y เท่านั้น แต่ยังพิจารณาจากข้อเท็จจริงของการจัดกลุ่มข้อมูลหลักด้วย เมื่อจำนวนกลุ่ม m เพิ่มขึ้น ความแปรปรวนระหว่างกลุ่ม d 2 จะเพิ่มขึ้นและเข้าใกล้ความแปรปรวนทั้งหมด หากจำนวนกลุ่มน้อยกว่าจำนวนหน่วยประชากร N ค่าของ r และ r 2 จะไม่เท่ากับ 1 แม้ว่าจะมีความสัมพันธ์เชิงหน้าที่เข้มงวดก็ตาม

โปรดทราบว่าค่าของตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อไม่ได้พิสูจน์ถึงการมีอยู่ของความสัมพันธ์เชิงสาเหตุระหว่างคุณลักษณะที่ศึกษา แต่เป็นการประเมินระดับความสอดคล้องร่วมกันในการเปลี่ยนแปลงคุณลักษณะต่างๆ การสร้างความสัมพันธ์เชิงเหตุและผลจำเป็นต้องนำหน้าด้วยการวิเคราะห์ลักษณะเชิงคุณภาพของปรากฏการณ์

ค่า เรียกว่า ค่าสัมประสิทธิ์การกำหนดและแสดงส่วนแบ่งของความแปรปรวนระหว่างกลุ่มในความแปรปรวนทั้งหมด

ความแปรปรวนของส่วนแบ่งภายในกลุ่มถูกกำหนดโดยสูตร

. (3.17)

ค่าเฉลี่ยของผลต่างภายในกลุ่มคำนวณเป็น

. (3.18)

สูตร ความแปรปรวนระหว่างกลุ่มมีรูปแบบดังนี้

, (3.19)

ที่ไหน น ผม– จำนวนหน่วยในกลุ่มแยก;

- สัดส่วนของลักษณะที่ศึกษาในประชากรทั้งหมดซึ่งกำหนดโดยสูตร

. (3.20)

ความแปรปรวนทั้งหมดมีแบบฟอร์ม

. (3.21)

การกระจายทั้งสามประเภทมีความสัมพันธ์กันดังนี้:

. (3.22)

ตัวอย่าง 3.4

ตารางที่ 3.3

จำนวนและสัดส่วนของฟาร์มโคประเภทใดประเภทหนึ่งในเขต

วิธีการแก้

ให้เรากำหนดส่วนแบ่งของโคนมโดยทั่วไปสำหรับสามฟาร์ม:

;

ความแปรปรวนทั้งหมดในสัดส่วนโคนม:

ความแปรปรวนภายในกลุ่ม:

; ;
.

ค่าเฉลี่ยของความแปรปรวนภายในกลุ่ม:

ความแปรปรวนระหว่างกลุ่ม:

ตัวอย่างที่ 3.5

ตารางที่ 3.4

กำหนด:

เงินเดือนเฉลี่ยในสองอุตสาหกรรม

การกระจายค่าจ้าง:

ก) ค่าเฉลี่ยของการกระจายกลุ่ม (อุตสาหกรรม)

b) ระหว่างกลุ่ม (ภาคส่วน),

ค่าสัมประสิทธิ์การกำหนด

ความสัมพันธ์เชิงประจักษ์

วิธีการแก้

เงินเดือนเฉลี่ยของคนงานในสองอุตสาหกรรมคำนวณโดยสูตร (2.10):

ถู.

ผลต่างของค่าจ้าง:

ก) ค่าเฉลี่ยของการกระจายตัวของกลุ่มตาม (3.14)

b) การกระจายระหว่างกลุ่มตาม (3.12)

c) ความแปรปรวนทั้งหมดที่ได้รับตามกฎสำหรับการเพิ่มความแปรปรวน (3.15):

ค่าสัมประสิทธิ์ของการกำหนดเท่ากับค่า

; (3.23)

เหล่านั้น.
คิดเป็น 44.24%

ตามสูตร (3.16) อัตราส่วนสหสัมพันธ์เชิงประจักษ์
,

ซึ่งบ่งชี้ถึงผลกระทบอย่างมีนัยสำคัญต่อความแตกต่างของค่าจ้างของลักษณะเฉพาะสาขา

ความสัมพันธ์เชิงประจักษ์

มีการใช้ตัวบ่งชี้หลายตัวเพื่อวัดความใกล้ชิดของการเชื่อมโยง ด้วยการเชื่อมต่อแบบคู่ ความแน่นของการเชื่อมต่อจะถูกกำหนดเป็นอันดับแรกโดยอัตราส่วนสหสัมพันธ์ซึ่งแสดงด้วย η กำลังสองของอัตราส่วนสหสัมพันธ์คืออัตราส่วนของความแปรปรวนระหว่างกลุ่มของลักษณะผลลัพธ์ ซึ่งแสดงผลของความแตกต่างในลักษณะปัจจัยการจัดกลุ่มต่อค่าเฉลี่ยของลักษณะผลลัพธ์ ต่อความแปรปรวนทั้งหมดของลักษณะผลลัพธ์ ซึ่งแสดงความ ผลกระทบจากเหตุและปัจจัยทั้งหมด กำลังสองของอัตราส่วนสหสัมพันธ์เรียกว่า สัมประสิทธิ์ของการกำหนด

ปรากฏการณ์ ny และสัญญาณของพวกเขา: ________________ หรือกำหนดขึ้นอย่างตายตัว

โดยที่ k คือจำนวนของกลุ่ม

N คือจำนวนการสังเกต

y ผม - ค่าเริ่มต้นของคุณสมบัติที่มีประสิทธิภาพ

y j - ค่าเฉลี่ยของแอตทริบิวต์ที่มีประสิทธิภาพสำหรับกลุ่มนี้

y คือค่าเฉลี่ยของคุณลักษณะ

fj คือขนาดของกลุ่ม

สูตรข้างต้นใช้เมื่อคำนวณตัวบ่งชี้ความใกล้ชิดของการเชื่อมต่อสำหรับการจัดกลุ่มเชิงวิเคราะห์ เมื่อคำนวณอัตราส่วนสหสัมพันธ์ตามระดับของการสื่อสาร จะใช้สูตรต่อไปนี้:

ผลรวมของกำลังสองในตัวเศษคือความแปรปรวนของคุณลักษณะผลลัพธ์ y ที่อธิบายโดยความสัมพันธ์กับตัวประกอบ x (ตัวประกอบ) คำนวณจากข้อมูลส่วนตัวที่ได้รับสำหรับแต่ละหน่วยของประชากรตามสมการการถดถอย

หากเลือกสมการไม่ถูกต้องหรือเกิดข้อผิดพลาดเมื่อคำนวณพารามิเตอร์ ผลรวมของกำลังสองในตัวเศษอาจมากกว่าในตัวส่วน และอัตราส่วนจะสูญเสียความหมายที่ควรจะเป็น เพื่อหลีกเลี่ยงผลลัพธ์ที่ผิดพลาด ควรคำนวณอัตราส่วนสหสัมพันธ์โดยใช้สูตรต่อไปนี้:

สูตรนี้ขึ้นอยู่กับกฎที่รู้จักกันดีสำหรับการขยายผลรวมของส่วนเบี่ยงเบนกำลังสองเมื่อจัดกลุ่มประชากร:

ง ทั่วไป= ง อินเตอร์+ด ภายใน

ตามกฎนี้ แทนที่จะใช้ความแปรปรวนระหว่างกลุ่ม (แฟกทอเรียล) คุณสามารถใช้ความแตกต่างได้:

ง ทั่วไป-ด ภายใน

สิ่งที่ช่วยให้:

เมื่อคำนวณ η ไม่ใช่โดยการจัดกลุ่ม แต่โดยสมการสหสัมพันธ์ (สมการถดถอย) เราใช้สูตร ในกรณีนี้ กฎการสลายตัวสำหรับผลรวมของการเบี่ยงเบนกำลังสองของคุณลักษณะที่เป็นผลลัพธ์จะถูกเขียนเป็น

D ทั้งหมด \u003d D แกน + D ส่วนที่เหลือ

จุดสำคัญที่สุดที่ควรเรียนรู้โดยใครก็ตามที่ต้องการใช้วิธีการวิเคราะห์การถดถอยสหสัมพันธ์อย่างถูกต้องคือการตีความสูตร (1.2) และ (1.3) บทบัญญัตินี้อ่าน:

สมการสหสัมพันธ์จะวัดความสัมพันธ์ระหว่างการแปรผันของคุณลักษณะที่เป็นผลลัพธ์และการแปรผันของคุณลักษณะปัจจัย การวัดความหนาแน่นของการเชื่อมต่อจะวัดสัดส่วนของความแปรผันของคุณลักษณะที่เป็นผลลัพธ์ ซึ่งสัมพันธ์กับความแปรผันของคุณลักษณะปัจจัย (คุณลักษณะ)

	\|	การบรรยายครั้งต่อไป ==>

อัตราส่วนสหสัมพันธ์เชิงประจักษ์วัดความผันผวนทั้งหมดของแอตทริบิวต์ผลลัพธ์ที่เกิดจากปัจจัยที่ศึกษา ค่าเฉลี่ยสหสัมพันธ์เชิงประจักษ์มีค่าตั้งแต่ 0 ถึง 1

ความสัมพันธ์เชิงประจักษ์มักพบใน ประเภทต่อไปนี้งาน:

1) เมื่อจำเป็นต้องสร้างการจัดกลุ่มเชิงวิเคราะห์สำหรับชุดข้อมูล X และ Y สองชุด
2) จัดกลุ่มเรียบร้อยแล้ว จำเป็นต้องตรวจสอบกฎสำหรับการเพิ่มความแปรปรวน
3) สำหรับชุดข้อมูล X และ Y สองชุด จำเป็นต้องค้นหาสมการการถดถอยและประเมินความสำคัญของมัน

สูตรผลต่างคุณลักษณะทางเลือก

จากข้อมูลข้างต้น เราสามารถหาสูตรสำหรับค้นหาความแปรปรวนของคุณลักษณะทางเลือกได้ หากเราทราบเปอร์เซ็นต์ของคุณลักษณะดังกล่าวในตัวอย่างทั้งหมด

ในขั้นต้น เราคิดว่าคุณลักษณะนี้ใช้ค่าเพียงสองค่าเท่านั้น

ดังนั้น ผลรวมของสัดส่วนขององค์ประกอบที่องค์ประกอบของอนุกรมสถิติมีค่าแอตทริบิวต์ "ไม่" และองค์ประกอบของอนุกรมที่มีค่าแอตทริบิวต์ "ใช่" เท่ากับหนึ่ง

ในการค้นหาค่าเฉลี่ยของซีรีส์ เราจะแทนค่าของคุณลักษณะทางเลือก (0 และ 1) ลงในสูตรเพื่อค้นหาค่าเฉลี่ยถ่วงน้ำหนักของซีรีส์ทางสถิติ จากที่เห็นได้ชัดว่าจะมีหน่วยในตัวส่วนและค่าเปอร์เซ็นต์ขององค์ประกอบ "1" ในตัวเศษ นั่นคือค่าเปอร์เซ็นต์ขององค์ประกอบที่มีแอตทริบิวต์ "1" (สูตร 2)

สูตรความแปรปรวนคือค่าเฉลี่ยถ่วงน้ำหนักของความเบี่ยงเบนกำลังสองของแต่ละค่าในชุดข้อมูล (สูตร 3)

เนื่องจากในชุดข้อมูลของเรามีค่าเพียงสองประเภทคือ "0" และ "1" ดังนั้นสูตรสำหรับค้นหาความแปรปรวนสำหรับชุดข้อมูลที่มีคุณสมบัติทางเลือกจึงลดลงเหลือสูตร 4 คำอธิบาย เนื่องจากเราอนุมานได้ว่าค่าเฉลี่ยตัวอย่างเท่ากับ p (สูตร 2) ดังนั้นค่าของกำลังสองของผลต่างระหว่างค่า (0/1) และค่าเฉลี่ยตามสูตร 1 จะเป็น (1- p)2 ในกรณีแรก และในกรณีที่สอง (1-q)2 ตอนนี้ใช้ผลสรุปจากสูตรแรก: q = 1 - p, p = 1- q . เราได้ p2 และ q2 ดังนั้นสัดส่วนของค่า "0" และ "1" จึงเท่ากับ p และ q เป็นผลให้ในตัวเศษและกลายเป็น q2 p และ p2 q ผลรวมของการแบ่งปันคุณสมบัติของค่า "0" และ "1" ตามสูตร 1 เท่ากับ 1 ดังนั้นสูตร 4 จึงใช้ค่า pq ซึ่งจะเท่ากับค่าความแปรปรวนของ คุณสมบัติทางเลือก จากค่าที่พบของความแปรปรวนของคุณลักษณะทางเลือก เราจะหาค่าเบี่ยงเบนมาตรฐาน (สูตร 5) การใส่ค่าจากสูตร 1 ลงในสูตร 5 เราจะได้สูตรส่วนเบี่ยงเบนมาตรฐานสำหรับความแปรปรวนของอนุกรมที่มีคุณสมบัติทางเลือก

เป็นที่นิยมในหมวดหมู่: