Bài 2: Ðại cương về thống kê và thống kê mô tả
Ðại cương về thống kê và thống kê mô tả
Một số định nghĩa
Thí dụ: Khi tôi quan sát giới tính của các học viên trong lớp, tôi có số liệu là: Nam, nam, nữ, nữ, nữ, nam, nữ, v.v
Thí dụ: Một nhà nghiên cứu đo nồng độ hemoglobin của 70 thai phụ có kết quả như sau:
Biến số và các loại biến số
- Biến số nhị giá – binary variable (khi chỉ có 2 giá trị)
- Biến số danh định – nominal variable (khi có 3 hay nhiều hơn các giá trị và các bản thân các giá trị không có tính chất thứ tụ)
- Biến số thứ tự - ordinal variable (khi có 3 hay nhiều hơn các giá trị và các bản thân các giá trị có tính chất thứ tự
Phương pháp mô tả tóm tắt và trình bày số liệu
Tóm tắt và trình bày số liệu |
Các số thống kê mô tả
Thống kê mô tả khuynh hướng tập trung
Thí dụ: có hai loại thuốc hạ áp A và B. Giả sử có 5 đối tượng sau khi sử dụng thuốc hạ áp A sẽ có huyết áp 110 - 115 -120 - 125 -130 và ở 5 đối tượng khác sau khi sử dụng thuốc hạ áp B sẽ có huyết áp 120 - 125 - 130 - 135 - 140. Con số tiêu biểu nhất để cho biết tác dụng của thuốc A là huyết áp trung bình sau khi sử dụng thuốc A và là 120. Con số huyết áp trung bình này thấp hơn huyết áp trung bình sau khi sử dụng thuốc B cho biết thuốc A có tác dụng mạnh hơn.
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150. Trung vị của huyết áp tâm thu là giá trị đứng ở giữa và bằng 130
Số liệu về chiều cao (cm) của 6 người là 153, 155, 160, 162, 165, 161. Ðể tính trung vị, trước tiên chúng ta phải sắp xếp số liệu này: 153, 155, 160, 161, 162, 165. Do có hai giá trị 160 và 161 cùng ở giữa, trung vị sẽ là (160+161)/2 = 160,5 cm
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150. Trong trường hợp này không có yếu vị.
Ðiểm số của 5 học sinh là 5, 5, 6, 7, 9. Yếu vị của điểm số là 5.
Trong một ấp có 361 gia đình người Kinh, 120 gia đình người Khmer và 27 gia đình người Hoa. Yếu vị của biên số dân tộc là dân tộc Kinh.
Thí dụ: Bệnh nhân bị loét dạ dày - tá tràng được điều trị theo một phác đồ diệt vi khuẩn Helicobacter. Sau điều trị, bệnh nhân được theo dõi và ghi nhận thời gian kể từ khi sử dụng thuốc đến lúc bắt đầu cải thiện triệu chứng đau. Ở 10 bệnh nhân thời gian này (ngày ) là như sau: 1, 2, 2, 2, 2, 2, 3, 3, 3, 30. Bệnh nhân có thời gian từ lúc điều trị đến lúc giảm triệu chứng là 30 ngày trên thực chất là bệnh nhân không đáp ứng với điều trị.
Trung vị và trung bình của số liệu là 2 và 5 ngày. Con số trung vị phản ánh chân thực hơn bởi vì với tư cách là một bác sĩ lâm sàng từ số liệu trên có thể nhận xét rằng một bệnh nhân tiêu biểu sẽ giảm đau sau 2 ngày dùng thuốc. Con sôs 30 trong thí dụ trên được gọi là số ngoại lai (outlier) và làm số liệu bị lệch. Nhìn chung, khi số liệu bị lệch thì con số trung bình sẽ bị ảnh hưởng rất nhiều và không phản ánh giá trị tiêu biểu như con số trung vị.
Thống kê mô tả tính phân tán:
Thí dụ: Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuốc là 110, 115, 120, 125 và 130. Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và có huyết áp sau sử dụng thuốc là 100, 110, 120, 130, 140. Như vậy hai thuốc hạ áp này có hiệu quả hạ áp là tương đương (bởi vì trung bình của hai số liệu là bằng nhau) nhưng kết quả của thuốc B phân tán hơn và điều này làm thuốc B trở nên kém an toàn.
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150. Trung bình của huyết áp là 132 và độ lệch chuẩn bằng
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150. Phạm vi của biến số huyết áp là 120 đến 150.
Thí dụ: Thuốc hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu sau khi dùng thuốc là 110, 115, 120, 125 và 130. Thuốc hạ áp B được sử dụng trên 5 bệnh nhân và có huyết áp sau sử dụng thuốc là 100, 110, 120, 130, 140. Số liệu của thuốc B có tính phân tán cao hơn do phạm vi thay đổi từ 100-140 trong khi đó phạm vị của số liệu thuốc A chỉ từ 110-130.
Khoảng tứ phân vị (inter-quartile): Nếu chúng ta chia số liệu sắp theo thứ tự làm 2 phần đều nhau, khoảng tứ phân vị là khoảng cách của trung vị phần trên và trung vị phần dưới.
Thí dụ: Số liệu về huyết áp tâm thu (mmHg) của 5 đối tượng là 120, 125, 130, 135, 150. Số liệu này được chia làm 2 phần: phần 1 gồm 120, 125, 130 và phần 2 gồm 130, 135, và 150. Trung vị của phần trên là 125 - trung vị của phần dưới là 135, do đó phạm tứ phân vị là 125-135.
Phương pháp trình bày số liệu: Số liệu có thể được trình bày thành bảng hoặc các đồ thị.
Giới
|
Số trẻ
|
Phần trăm
|
Nam
|
45
|
65%
|
Nữ
|
24
|
35%
|
Tổng số
|
69
|
100%
|
Phương pháp đỡ đẻ
|
Số sinh
|
Phần trăm
|
Sinh thường
|
478
|
79,7
|
Sinh forceps
|
65
|
10,8
|
Sinh mổ
|
57
|
9,5
|
Tổng số
|
600
|
100,0
|
Hemoglobin
(g/100ml)
|
Ðếm
|
8-8,9
|
1
|
9-9,9
|
111
|
10-10,9
|
|
11-11,9
|
|
12-12,9
|
|
13-13,9
|
|
14-14,9
|
|
15-15,9
|
1
|
Hemoglobin
|
Tần suất
|
Phần trăm
|
Phần trăm tích lũy
|
8-8,9
|
1
|
1.43
|
1.43
|
9-9,9
|
3
|
4.29
|
5.71
|
10-10,9
|
14
|
20.00
|
25.71
|
11-11,9
|
19
|
27.14
|
52.86
|
12-12,9
|
14
|
20.00
|
72.86
|
13-13,9
|
13
|
18.57
|
91.43
|
14-14,9
|
5
|
7.14
|
98.57
|
15-15,9
|
1
|
1.43
|
100.00
|
Vòng cánh tay
|
Tần suất
|
Phần trăm
|
Phần trăm tích lũy
|
13- <14
|
2
|
2.78
|
2.78
|
14- <15
|
31
|
43.06
|
45.83
|
15- <16
|
27
|
37.50
|
83.33
|
16- <17
|
9
|
12.50
|
95.83
|
17- <18
|
0
|
12.50
|
95.83
|
18- <19
|
2
|
2.78
|
98.61
|
19- <20
|
1
|
1.39
|
100.00
|
Xem thêm:
Bài 6 Xác định và chọn ưu tiên nghiên cứu
Bài 7: Xác xuất có điều kiện - Định luật nhân xác suất
- Có tựa ngắn gọn và rõ ràng
- Ðặt tên cho các hàng và cột
- Trình bày tổng số của hàng và cột
- Ðịnh nghĩa các kí hiệu và chữ viết tắt ở dưới bảng
- Ghi nguồn số liệu ở dưới bảng
Đăng nhận xét