I. Số gần đúng. Sai số
1. Số gần đúng
- Trong nhiều trường hợp, ta không biết hoặc khó biết số đúng (kí hiệu là \(\bar a\) ) mà chỉ tìm được giá trị khác xấp xỉ nó. Giá trị này được gọi là số gần đúng, kí hiệu là \(a\).
- Trong đo đạc, tính toán ta thường chỉ nhận được các số gần đúng.
2. Sai số của số gần đúng
a. Sai số tuyệt đối
Nếu a là số gần đúng của số đúng \(\bar a\) thì \({\Delta _a} = \left| {\bar a - a} \right|\) được gọi là sai số tuyệt đối của số gần đúng a.
Chú ý
- Trên thực tế, nhiều khi ta không biết \(\bar a\) nên cũng không biết \({\Delta _a}\). Tuy nhiên, ta có thể đánh giá được \({\Delta _a}\) không vượt quá một số dương \(d\) nào đó.
- Nếu \({\Delta _a} \le d\) thì \(a - d \le \bar a \le a + d\), khi đó ta viết \(\bar a = a \pm d\) và hiểu là số đúng \(\bar a\) nằm trong đoạn \([a - d;a + d]\). Do \(d\) càng nhỏ thì a càng gần \(\bar a\) nên \(d\) được gọi là độ chính xác của số gần đúng.
- Trong các phép đo, độ chính xác \(d\) của số gần đúng bằng một nửa đơn vị của thước đo.
b. Sai số tương đối
Sai số tương đối của số gần đúng a là tỉ số giữa sai số tuyệt đối và \(\left| a \right|\), kí hiệu \({\delta _a} = \dfrac{{{\Delta _a}}}{{\left| a \right|}}\).
\({\delta _a}\) càng nhỏ thì độ chính xác của phép đo đạc hoặc tính toán càng lớn.
Ta thường viết \({\delta _a}\) dưới dạng phần trăm.
3. Số quy tròn. Quy tròn số gần đúng
Khi quy tròn một số nguyên hoặc một số thập phân đến một hàng nào đó thì số nhận được gọi là số quy tròn của số ban đầu.
- Các bước xác định số quy tròn của số gần đúng \(a\) với độ chính xác \(d\) cho trước:
Bước 1: Tìm hàng của chữ số khác 0 đầu tiên bên trái của \(d\).
Bước 2: Quy tròn số \(a\) ở hàng gấp 10 lần hàng tìm được ở Bước 1 .
- Để tìm số gần đúng \(a\) của số đúng \(\bar a\) với độ chính xác \(d\), ta thực hiện các bước sau:
Bước 1: Tìm hàng của chữ số khác 0 đầu tiên bên trái của \(d\).
Bước 2: Quy tròn \(\bar a\) đến hàng tìm được ở trên.
II. Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu không ghép nhóm
1. Số trung bình cộng (Số trung bình)
Số trung bình (số trung bình cộng) của mẫu số liệu \({x_1},{x_2}, \ldots ,{x_n}\), kí hiệu là \(\bar x\), được tính bằng công thức:
\(\bar x = \dfrac{{{x_1} + {x_2} + \ldots + {x_n}}}{n}.\)
2. Trung vị
Sắp xếp mẫu số liệu theo thứ tự không giảm, ta được:
\({x_1} \le {x_2} \le \ldots \le {x_n}\)
Trung vị của mẫu, kí hiệu là \({M_e}\), là giá trị ở chính giữa dãy \({x_1},{x_2}, \ldots ,{x_n}\). Cụ thế:
- Nếu \(n = 2k + 1,k \in \mathbb{N}\), thì trung vị của mẫu \({M_e} = {x_{k + 1}}\).
- Nếu \(n = 2k,k \in \mathbb{N}\), thì trung vị của mẫu \({M_e} = \dfrac{1}{2}\left( {{x_k} + {x_{k + 1}}} \right)\).
3. Tứ phân vị
Để tìm các tứ phân vị của mẫu số liệu có \(n\) giá trị, ta làm như sau:
- Sắp xếp mẫu số liệu theo thứ tự không giảm.
- Tìm trung vị. Giá trị này là \({Q_2}\).
- Tìm trung vị của nửa số liệu bên trái \({Q_2}\) (không bao gồm \({Q_2}\) nếu \(n\) lẻ). Giá trị này là \({Q_1}\).
- Tìm trung vị của nửa số liệu bên phải \({Q_2}\) (không bao gồm \({Q_2}\) nếu \(n\) lẻ). Giá trị này là \({Q_3}\). \({Q_1},{Q_2},{Q_3}\) được gọi là các tứ phân vị của mẫu số liệu.
4. Mốt
Mốt của mẫu số liệu là giá trị có tần số lớn nhất trong bảng phân bố tần số và kí hiệu là \({M_0}\).
Ý nghĩa của mốt:
Mốt đặc trưng cho giá trị xuất hiện nhiều nhất trong mẫu.
III. Các số đặc trưng đo mức độ phân tán cho mẫu số liệu không ghép nhóm
1. Khoảng biến thiên. Khoảng tứ phân vị
Định nghĩa
- Trong một mẫu số liệu, khoảng biến thiên là hiệu số giữa giá trị lớn nhất và giá trị nhỏ nhất của mẫu số liệu đó.
Ta có thể tính khoảng biến thiên \(R\) của mẫu số liệu theo công thức sau: \(R = {x_{{\rm{max }}}} - {x_{{\rm{min'}}}}\), trong đó \({x_{\max }}\) là giá trị lớn nhất, \({x_{\min }}\) là giá trị nhỏ nhất của mẫu số liệu đó.
- Giả sử \({Q_1},{Q_2},{Q_3}\) là tứ phân vị của mẫu số liệu. Ta gọi hiệu \({\Delta _Q} = {Q_3} - {Q_1}\) là khoảng tứ phân vị, của mẫu số liệu đó.
Chú ý: Một số tài liệu gọi khoảng biến thiên là biên độ và khoảng tứ phân vị là độ trải giữa.
2. Ý nghĩa của khoảng biến thiên và khoảng tứ phân vị
- Khoảng biến thiên đặc trưng cho độ phân tán của toàn bộ mẫu số liệu.
- Khoảng tứ phân vị đặc trımg cho độ phân tán của một nửa các số liệu, có giá trị thuộc đoạn từ \({Q_1}\) đển \({Q_3}\) trong mẫu.
- Khoảng tứ phân vị không bị ảnh hưởng bởi các giá trị rất lớn hoặc rất bé trong mẫu.
IV. Xác suất của biến cố trong một số trò chơi đơn giản
1. Phương sai
Cho mẫu số liệu thống kê có \(n\) giá trị \({x_1},{x_2}, \ldots ,{x_n}\) và số trung bình cộng là \(\bar x\).
Ta gọi số \({s^2} = \dfrac{{{{\left( {{x_1} - \bar x} \right)}^2} + {{\left( {{x_2} - \bar x} \right)}^2} + \ldots + {{\left( {{x_n} - \bar x} \right)}^2}}}{n}\) là phương sai của mẫu số liệu trên.
Chú ý: Có thể biến đổi công thức tính phương sai ở trên thành:
\({s^2} = \dfrac{1}{n}\left( {x_1^2 + x_2^2 + \ldots + x_n^2} \right) - {\bar x^2}.\)
Trong thống kê, người ta cũng quan tâm đến phương sai hiệu chỉnh, kí hiệu là \({\hat s^2}\), được tính bởi công thức:
\({\hat s^2} = \dfrac{1}{{n - 1}}\left[ {{{\left( {{x_1} - \bar x} \right)}^2} + {{\left( {{x_2} - \bar x} \right)}^2} + \ldots + {{\left( {{x_n} - \bar x} \right)}^2}} \right]\)
2. Độ lệch chuẩn
Căn bậc hai của phương sai gọi là độ lệch chuẩn của mẫu số liệu thống kê: \(s = \sqrt {{s^2}} \)
3. Tính hợp lí của số liệu thống kê
Giả sử \({Q_1},{Q_2},{Q_3}\) là tứ phân vị của mẫu số liệu và hiệu \({\Delta _Q} = {Q_3} - {Q_1}\) là khoảng tứ phân vị của mẫu số liệu đó. Một giá trị trong mẫu số liệu được coi là một giá trị bất thường nếu nó nhỏ hơn \({Q_1} - \dfrac{3}{2}{\Delta _Q}\) hoặc lớn hơn \({Q_3} + \dfrac{3}{2}{\Delta _Q}\).
Như vậy, khoảng tứ phân vị cho ta cách nhận ra giá trị bất thường của mẫu số liệu.
4. Xác suất của biến cố trong trò chơi tung đồng xu
- Tập hợp \(A\) các kết quả có thể xảy ra đối với sự kiện trên là: \(A = \{ {\rm{SS}};{\rm{NN}}\} \). Ta thấy \(A \subset \Omega \). Tập hợp \(A\) còn gọi là biến cố ngẫu nhiên (hay gọi tắt là biến cố) trong trò chơi nói trên.
Xác suất của biến cố \(A\), kí hiệu \({\rm{P}}(A)\), là tỉ số giữa số các kết quả thuận lợi cho biến cố \(A\) và số phần tử của không gian mẫu \(\Omega \):
\({\rm{P}}(A) = \dfrac{{n(A)}}{{n(\Omega )}}\)
ở đó \(n(A),n(\Omega )\) lần lượt là số phần tử của hai tập hợp \(A\) và \(\Omega \).
5. Xác suất của biến cố trong trò chơi gieo xúc xắc
Tập hợp \(\Omega \) các kết quả có thể xảy ra đối với mặt xuất hiện của xúc xắc sau hai lần gieo là \(\Omega = \{ (i;j)\mid i,j = 1,2,3,4,5,6\} \), trong đó \((i;j)\) là kết quả "Lần thứ nhất xuất hiện mặt \(i\) chấm, lần thứ hai xuất hiện mặt \(j\) chấm".
Xác suất của biến cố \(C\), kí hiệu \({\rm{P}}(C)\), là tỉ số giữa số các kết quả thuận lợi cho biến cố \(C\) và số phần tử của không gian mẫu \(\Omega \) :
\({\rm{P}}(C) = \dfrac{{n(C)}}{{n(\Omega )}}\)
ở đó \(n(C),n(\Omega )\) lần lượt là số phần tử của hai tập hợp \(C\) và \(\Omega \).
V. Xác suất của biến cố
1. Phép thử ngẫu nhiên và không gian mẫu
- Phép thử ngẫu nhiên (gọi tắt là phép thử) là một thí nghiệm hay một hành động mà kết quả của nó không thể biết được trước khi phép thử được thực hiện.
- Không gian mẫu của phép thử là tập hợp tất cả các kết quả có thể khi thực hiện phép thử. Kí hiệu là \(\Omega \).
- Kết quả thuận lợi cho một biến cố \(E\) liên quan tới phép thử \(T\) là kết quả của phép thử \(T\) làm cho biến cố đó xảy ra.
2. Biến cố
Biến cố ngẫu nhiên (gọi tắt là biến cố) là một tập con của không gian mẫu.
Tập con \(\Omega \backslash A\) xác định một biến cố, gọi là biến cố đối của biến cố \(A\). Kí hiệu là \(\bar A\).
Biến cố chắc chắn là biến cố luôn xảy ra, kí hiệu là \(\Omega \).
Biến cố không thể là biến cố không bao giờ xảy ra, kí hiệu là \(\emptyset \).
3. Xác suất của biến cố
Xác suất của biến cố \(A\), kí hiệu là \({\rm{P}}(A)\), bằng tỉ số \(\dfrac{{n(A)}}{{n(\Omega )}}\), ở đó \(n(A),n(\Omega )\) lần lượt là số phần tử của hai tập hợp \(A\) và \(\Omega \). Như vậy: \({\rm{P}}(A) = \dfrac{{n(A)}}{{n(\Omega )}}\).
4. Tính chất của xác suất
Xét phép thử \(T\) với không gian mẫu là \(\Omega \). Khi đó, ta có các tính chất sau:
- \({\rm{P}}(\emptyset ) = 0;{\rm{P}}(\Omega ) = 1\);
- \(0 \le {\rm{P}}(A) \le 1\) với mỗi biến cố \(A\);
- \({\rm{P}}(\bar A) = 1 - {\rm{P}}(A)\) vối mỗi biến cố \(A\).
5. Nguyên lí xác suất bé
Nếu một biến cố có xác suất rất bé thì trong một phép thử biến cố đó sẽ không xảy ra.