Thu thập và phân loại dữ liệu

Sách kết nối tri thức với cuộc sống

Đổi lựa chọn

I. Thu thập và phân loại dữ liệu

Dữ liệu được phân làm 2 loại:

+ Dữ liệu số còn gọi là dữ liệu định lượng.

+ Dữ liệu không là số gọi là dữ liệu định tính.

Chú ý: Dữ liệu không là số có thể phân thành hai loại:

+ Loại không thể sắp thứ tự (chẳng hạn dữ liệu về tên các tỉnh: Nam Định, Thái Bình,...)

+ Loại có thể sắp thứ tự (chẳng hạn dữ liệu về đánh giá chất lượng dịch vụ khách sạn với các mức Rất tốt, Tốt, Trung bình, Kém).

Ví dụ: Phân loại các dãy dữ liệu sau dựa trên các tiêu chí định tính và định lượng.

a) Các loại xe ô tô được sản xuất: A; B; C;…

b) Chiều cao (tính theo cm) của một số bạn học sinh lớp 7C: 142; 148; 152; ...

c) Danh sách các môn thể thao được học sinh yêu thích: bóng đá; cầu lông; bóng chuyền...

d) Điểm trung bình môn Toán của một số bạn học sinh: 5,5; 6,5; 8,2;...

Giải

a) Các loại xe ô tô (A; B; C;...) là đữ liệu định tính.

b) Chiều cao (tính theo cm: 142; 148; 152…) là đữ liệu định lượng.

c) Danh sách các môn thể thao (bóng đá; cầu lông; bóng chuyền; ...) là dữ liệu định tính.

d) Điểm trung bình môn Toán (5,5; 6,5; 8,2;...) là dữ liệu định lượng.

II. Tính đại diện của dữ liệu

Để đảm bảo tính hợp lí, dữ liệu cần phải đáp ứng đúng các tiêu chí toán học đơn giản, chẳng hạn như:

- Tổng tỉ lệ phần trăm của tất cả các thành phần phải bằng 100%;

- Số lượng của bộ phận phải nhỏ hơn số lượng của toàn thể; ...

- Phải có tính đại diện đối với vấn đề cần thống kê.

Ví dụ: Khi đối tượng quan tâm là toàn thể học sinh thì không thể chỉ lấy ý kiến các bạn nam hoặc chỉ lấy ý kiến của các bạn trong câu lạc bộ Toán học,... mà phải lấy ý kiến của các học sinh được chọn một cách ngẫu nhiên.