Đề bài
Hai mẫu số liệu sau đây cho biết số lượng trường Trung học phổ thông ở mỗi tỉnh/thành phố thuộc Đồng bằng sông Hồng và Đồng bằng sông Cửu Long năm 2017:
Đồng bằng sông Hồng:
187 34 35 46 54 57 37 39 23 57 27
Đồng bằng sông Cửu Long:
33 34 33 29 24 39 42 24 23 19 24 15 26
(Theo Tổng cục Thống kê)
a) Tính số trung bình, trung vị, các tứ phân vị, mốt, khoảng biến thiên, khoảng tứ phân vị, độ lệch chuẩn cho mỗi mẫu số liệu trên.
b) Tại sao số trung bình của hai mẫu số liệu có sự sai khác nhiều trong khi trung vị thì không?
c) Tại sao khoảng biến thiên và độ lệch chuẩn của hai mẫu số liệu khác nhau nhiều trong khi khoảng từ phân vị thì không?
Phương pháp giải - Xem chi tiết
a)
- Sắp xếp lại mẫu số liệu theo thứ tự không giảm.
- Áp dụng công thức số trung bình của mẫu số liệu \({x_1},{x_2},...,{x_n}\):
\(\overline X = \frac{{{x_1} + {x_2} + ... + {x_n}}}{n}\)
- Số trung vị
+ Sắp xếp lại số liệu theo thứ tự không giảm.
+ Nếu số giá trị của mẫu số liệu là số lẻ thì giá trị chính giữa của mẫu là trung vị. Nếu là số chẵn thì trung vị là trung bình cộng của hai giá trị chính giữa của mẫu.
Để tìm các tứ phân vị của mẫu số liệu có n giá trị cho dưới dạng bảng tần số, ta làm như sau:
+ Tìm trung vị. Giá trị này là \({Q_2}\)
+ Tìm trung vị của nửa số liệu bên trái \({Q_2}\), (không bao gồm \({Q_2}\), nếu n lẻ). Giá trị này là \({Q_1}\)
+ Tìm trung vị của nửa số liệu bên phải \({Q_2}\), (không bao gồm \({Q_2}\), nếu n lẻ). Giá trị này là \({Q_3}\)
Mốt: Giá trị có tần số lớn nhất.
Khoảng biến thiên R = Số lớn nhất – Số nhỏ nhất
Khoảng tứ phân vị: \({\Delta _Q} = {Q_3} - {Q_1}\)
Phương sai \({s^2} = \frac{{{{\left( {{x_1} - \overline x} \right)}^2} + {{\left( {{x_2} - \overline x} \right)}^2} + ... + {{\left( {{x_n} - \overline x} \right)}^2}}}{n}\)
Độ lệch chuẩn: \(s = \sqrt {{s^2}} \)
b) Trong trường hợp mẫu số liệu có giá trị bất thường (rất lớn hoặc rất bé so với đa số các giá trị khác) thì sẽ làm cho số trung bình và trung vị có sự khác nhau rõ rệt.
c) Khoảng biến thiên và độ lệch chuẩn dễ bị ảnh hưởng bởi giá trị bất thường, còn khoảng tứ phân vị thì không.
Lời giải chi tiết
a) Đồng bằng sông Hồng:
23 27 34 35 37 39 46 54 57 57 187
n=11.
Số trung bình: \(\overline X \approx 54,18\)
Trung vị: 39
Tứ phân vị: \({Q_1} = 34,{Q_3} = 57\)
Mốt là 57 vì có tần số là 2 (xuất hiện 2 lần).
Khoảng biến thiên: R=187-23=164
Khoảng tứ phân vị: \({\Delta _Q} = {Q_3} - {Q_1} = 57 - 34 = 23\)
Ta có bảng sau:
Giá trị | Độ lệch | Bình phương độ lệch |
23 | 31,18 | 972,192 |
27 | 27,18 | 738,752 |
34 | 20,18 | 407,232 |
35 | 19,18 | 367,872 |
37 | 17,18 | 295,152 |
39 | 15,18 | 230,432 |
46 | 8,18 | 66,912 |
54 | 0,18 | 0,032 |
57 | 2,82 | 7,952 |
57 | 2,82 | 7,952 |
187 | 132,82 | 17641,2 |
Tổng | 20735,64 |
Độ lệch chuẩn: 144
Đồng bằng sông Cửu Long:
15 19 23 24 24 24 26 29 33 33 34 39 42
n=13
Số trung bình: \(\overline X \approx 28,1\)
Trung vị: 26
Tứ phân vị: \({Q_1} = 23,5,{Q_3} = 33,5\)
Mốt là 24 vì có tần số là 3 (xuất hiện 3 lần).
Khoảng biến thiên: R=42-15=27
Khoảng tứ phân vị: \({\Delta _Q} = {Q_3} - {Q_1} = 33,5 - 23,5 = 10\)
Ta có bảng sau:
Giá trị | Độ lệch | Bình phương độ lệch |
15 | 13,1 | 171,61 |
19 | 9,1 | 82,81 |
23 | 5,1 | 26,01 |
24 | 4,1 | 16,81 |
24 | 4,1 | 16,81 |
24 | 4,1 | 16,81 |
26 | 2,1 | 4,41 |
29 | 0,9 | 0,81 |
33 | 4,9 | 24,.01 |
33 | 4,9 | 24,01 |
34 | 5,9 | 34,81 |
39 | 10,9 | 118,81 |
42 | 13,9 | 193,21 |
Tổng | 730,93 |
Độ lệch chuẩn: 27,04
b) Số trung bình sai khác vì ở Đồng bằng sông Hồng thì có giá trị bất thường là 187 (cao hơn hẳn giá trị trung bình), còn ở Đồng bằng sông Cửu Long thì không có giá trị bất thường.
Chính giá trị bất thường làm nên sự sai khác đó, còn trung vị không bị ảnh hưởng đến giá trị bất thường nên trung vị ở hai mẫu đều như nhau.
c) Giá trị bất thường ảnh hưởng đến khoảng biến thiên và độ lệch chuẩn, còn với khoảng tứ phân vị thì không (khoảng tứ phân vị đo 50% giá trị ở chính giữa).