Các NC đều có mục đích đánh giá sự biến thiên:
Giữa các nhóm so sánh
Của nhóm nghiên cứu theo thời gian
Càng nhiều nguồn biến thiên càng nhiều khảnăng
phiên giải số liệu
Hai (2) nguồn biến thiên chính:
Khác biệt giữa các cá thể
Biến thiên do đo lư ờng
Một PP nghiên c ứu tốt khống chế và giảm thiểu
được nhiều nguồn biến thiên
36 trang |
Chia sẻ: oanh_nt | Lượt xem: 2419 | Lượt tải: 6
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích số liệu định lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH SỐ LIỆU
ĐỊNH LƯỢNG
BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC
THIẾT KẾ NGHIÊN CỨU
Các giả thuyết
Loại thiết kế
Định nghĩa đơn vị quan sát và các quan sát
Xác định các nguồn sai số
Ai sẽ là người sử dụng các báo cáo NC
9/15/2010
SỰ BIẾN THIÊN
Các NC đều có mục đích đánh giá sự biến thiên:
Giữa các nhóm so sánh
Của nhóm nghiên cứu theo thời gian
Càng nhiều nguồn biến thiên càng nhiều khả năng
phiên giải số liệu
Hai (2) nguồn biến thiên chính:
Khác biệt giữa các cá thể
Biến thiên do đo lường
Một PP nghiên cứu tốt khống chế và giảm thiểu
được nhiều nguồn biến thiên
9/15/2010
SAI SỐ
Sai số ngẫu nhiên (random error)
Không dự đoán được
Sai số hệ thống (systematic error hoặc bias)
Nghiêm trọng hơn
Có thể dẫn đến kết quả NC không chính xác
Nhiều loại
• Sai số lựa chọn (selection bias)
• Nhiễu (confounding)
• Sai số thông tin (information bias)
9/15/2010
CÂU HỎI NGHIÊN CỨU
Giúp cho người NC tập trung vào nội dung NC
Cần được đặt ra trước khi thiết kế nghiên cứu
Cần phải được chuyển sang dạng gigiảả thuythuyếếtt khoakhoa hhọọcc
Xác định biến độc lập, phụ thuộc
Đo lường chúng như thế nào?
Phiên giải các mối quan hệ như thế nào?
9/15/2010
VÍ DỤ
Chủ đề NC: “Sự hài lòng của các bác sỹ lâm sàng”
Câu hỏi NC: “có sự khác nhau về sự hài lòng của
các bác sỹ ở những khoa điều trị khác nhau
không?”
Biến số:
Biến phụ thuộc: Sự hài lòng của các bác sỹ
Biến độc lập: Khoa điều trị
9/15/2010
GIẢ THUYẾT KHOA HỌC
Giả thuyết khoa học được đổi thành:
Giả thuyết không (H0)
Đối thuyết/Giả thuyết đối (H1)
Ví dụ:
H0: Sự hài lòng như nhau H0: Sự hài lòng như nhau
H1: Sự hài lòng khác nhau H1: Các bác sỹ làm hệ ngoại sản hài
lòng với công việc hơn BS hệ nội nhi
Kiểm định 2 phía Kiểm định 1 phía
9/15/2010
GIẢ THUYẾT KHOA HỌC [CONT.]
Kiểm định thống kê : tính toán giá trị thống kê để nhằm
bác bỏ giả thuyết H0
Ví dụ:
Không đủ bằng chứng để bác bỏ H0, như vậy, chúng ta kết luận
nghiên cứu cho thấy không có mối liên quan giữa làm ở các
khoa điều trị và sự hài lòng của các bác sỹ
Hoặc
Có đủ bằng chứng để bác bỏ H0 có mối liên quan giữa việc
làm ở khoa điều nào với sự hài lòng của các bác sỹ.
9/15/2010
CÁC THÀNH PHẦN THIẾT KẾ
Các thành phần thiết kế ảnh hưởng tới phân tích
Đơn vị quan sát
Phương pháp chọn mẫu
Các biến đầu ra
9/15/2010
ĐƠN VỊ QUAN SÁT
Đơn vị quan sát
Là một thành phần: người, động vật, cơ sở Y tế
Quan sát
Số lần quan sát, thu thập số liệu về một đơn vị quan sát
Nghiên cứu 1 lần:
Đơn vị quan sát = số quan sát
So sánh giữa các đơn vị quan sát
Nghiên cứu giữa các đối tượng
Nghiên cứu lặp lại:
một ĐVQS được quan sát nhiều lần
So sánh giữa các đơn vị quan sát
So sánh giữa các lần quan sát
Nghiên cứu trong/Giữa các đối tượng
9/15/2010
PHƯƠNG PHÁP CHỌN MẪU
Mẫu được chọn như thế nào?
Mẫu được chọn từ quần thể nào?
Mục đích chọn ra nhóm đại diện để nghiên cứu
Mỗi một cách chọn mẫu đều có ảnh hưởng khác nhau
đến việc ước lượng sai số chuẩn và khoảng tin cậy.
9/15/2010
BIẾN ĐẦU RA
Xác định thông qua câu hỏi nghiên cứu
Biến thuộc loại gì:
Liên tục
Biến phân loại
• Nhị thức
• Định danh
• Thứ bậc
9/15/2010
BẢNG KIỂM PHÂN TÍCH SỐ LIỆU
1. Câu hỏi nghiên cứu là gì?
2. Thiết kế nghiên cứu là thực nghiệm hay quan sát?
3. Đơn vị quan sát là gì?
4. Phương pháp chọn mẫu như thế nào?
5. Đo lường lặp lại hay một lần?
6. Biến đầu ra là gì?
7. Biến loại gì: liên tục, phân loại?
8. Những nhóm nào được so sánh?
9/15/2010
TIẾN HÀNH
PHÂN TÍCH
BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC
QUẢN LÝ SỐ LIỆU
Nhập số liệu vào máy
Epi Info, EpiData
Làm sạch
Kiểm tra các giá trị sai sót: Mã hóa, nhập phiếu
Kiểm tra tính đồng nhất
Phân tích số liệu
9/15/2010
CHIẾN LƯỢC PHÂN TÍCH
Dựa vào mục tiêu nghiên cứu
Mô tả:
• Biến số quan trọng: định lượng/phân loại
• Quy mô, phân bố của yếu tố nghiên cứu (con người,
thời gian, địa điểm)
Phân tích/ so sánh
• Hình thành giả thuyết và kiểm định giả thuyết
• So sánh tìm sự khác biệt
• Xác định, mô tả mối liên quan và sự kết hợp
9/15/2010
XÂY DỰNG BẢNG GIẢ
Bảng giả định các kết quả nghiên cứu
Thiết lập khi tiến hành thiết kế nghiên cứu
Dựa vào các biến (thông tin) trong bộ câu hỏi điều tra
Bảng
Mô tả: các nội dung mô tả
Phân tích:
• các biến dự kiến phân tích
• Kiểm định thống kê sẽ sử dụng
9/15/2010
VÍ DỤ
Bảng 1: Tình trạng dinh dưỡng của trẻ
Chỉ số Loại n Tỷ lệ 95% CI
Bình thường
Nhẹ cân Nhẹ
(W/A) Độ 1
Độ 2
Bình thường
Còi c c
ọ Nh
(H/A) ẹ
Độ 1
Độ 2
9/15/2010
VÍ DỤ
Bảng 2: So sánh thu nhập trung bình
Xã n TB Std. Err. Std. Dev. [KTC 95% ]
Sao Do
An Lac
Chung
t, p-value
9/15/2010
PHÂN TÍCH MÔ TẢ
Biến định lượng
Đo lường độ tập trung: trung bình, trung vị
Đo lường độ phân tán: phương sai, độ lệch chuẩn
Sự phân bố: chuẩn, lệch trái, lệch phải
Các giá trị ngoài khoảng (bất thường)
9/15/2010
VÍ DỤ
Age in month
N 4164 700
600
Trung binh 27.48 500
Trung vi 25.00 400
300
SD 13.69 200
Std. Dev = 13.69
100
Minimum 3 Mean = 27.5
N = 4164.00
Frequency 0
5.0 15.0 25.0 35.0 45.0 55.0
Maximum 60 10.0 20.0 30.0 40.0 50.0 60.0
Age in month
9/15/2010
PHÂN TÍCH MÔ TẢ [CONT.]
Biến phân loại
Đo lường độ tập trung: tỷ lệ
Đo lường độ phân tán: bảng phân phối tần số
9/15/2010
VÍ DỤ
Chỉ số Loại n Tỷ lệ % 95% CI
Bình thường 1311 31.5 30.1 – 32.9
Nhẹ cân Nhẹ 1599 38.4 36.9 - 39.9
(W/A) Độ 1 986 23.7 22.4 – 25.0
Độ 2 268 6.4 5.7 – 7.2
Bình thường 117 2.8 2.3 – 3.4
Còi c c
ọ Nhẹ 2000 48.0 46.5 – 49.6
(H/A)
Độ 1 1171 28.1 26.8 – 29.5
Độ 2 876 21.0 19.8 – 22.3
9/15/2010
PHÂN TÍCH MỐI LIÊN QUAN
BIẾN ĐỊNH LƯỢNG
So sánh
Kiểm định trung bình:
• 2 trung bình độc lập : t-test
• 2 trung bình lặp lại : t –ghép cặp
• nhiều trung bình : ANOVA
Mối quan hệ không định hướng
Hệ số tương quan r
Mối quan hệ định hướng
Hồi quy tuyến tính
9/15/2010
VÍ DỤ
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Sao Do 1336 1794524 65030.55 2376953 1666950 1922097
An Lac 1488 903472 27554.39 1062900 849422.4 957521.6
combined 2824 1325018 35027.96 1861432 1256335 1393701
diff 891051.5 68135.77 757450.6 1024652
Degrees of freedom: 2822
Ho: mean(Sao Do) - mean(An Lac) = diff = 0
Ha: diff 0
t = 13.0776 t = 13.0776 t = 13.0776
P t = 0.0000 P > t = 0.000
9/15/2010
PHÂN TÍCH MỐI LIÊN QUAN
BIẾN PHÂN LOẠI
So sánh
• 2 tỷ lệ : z-test, Khi bình phương
• nhiều tỷ lệ : Khi bình phương
Mối quan hệ định hướng
Hồi quy logistics
9/15/2010
VÍ DỤ
E NE Tổng
D 12 2 14
ND 7 9 16
Tổng 19 11 30
OR=7.7 (95%CI: 1,4-40,6)
Chi square=5.66, p_value=0.0173
9/15/2010
VÍ DỤ
Bệnh Không Tổng
Tốt n 7 12 19
% 36.84 63.16 100
TB n 10 5 15
% 66.67 33.33 100
Kém n 9 2 11
% 81.82 18.18 100
Tổng n 26 19 45
% 57.78 42.22 100
Chi square=6.5 p=0.039
9/15/2010
PHÂN TÍCH YẾU TỐ NHIỄU
Phân tầng
Nhiều bảng 2x2
Giá trị OR thô, hiệu chỉnh
Giá trị Khi bình phương MH
Hồi quy đa biến
9/15/2010
PHÂN TÍCH PHÂN TẦNG
D Dˉ
E a b a+b
ORc = ad/bc
Eˉ c d c+d
a+c b+d
tầng 1 D Dˉ 2 D Dˉ
E e f e+f E i j i+j
Eˉ g h g+h Eˉ k l k+l
e+g f+h i+k j+l
OR1 = eh/fg OR2 = il/kj
9/15/2010
YẾU TỐ NHIỄU
ORc = ad/bc
ORa = f(OR1, OR2), kiểm định Mantel Haenszel
Nếu ORc = ORa Không phải là nhiễu
Nếu ORc ≠ ORa, có yếu tố nhiễu
9/15/2010
PHÂN TÍCH PHÂN TẦNG
D Dˉ
E 30 18 48
ORc = ad/bc = 1.95
Eˉ 70 82 152
100 100 200
Tuổi < 40 D Dˉ Tuổi ≥ 40 D Dˉ
E 5 8 13 E 25 10 35
Eˉ 45 72 117 Eˉ 25 10 35
50 80 130 50 20 70
OR1 = eh/fg = 1.0 OR2 = il/kj = 1.0
9/15/2010
PHÂN TÍCH PHÂN TẦNG
D Dˉ
E 200 800 1000
ORc = ad/bc = 4.75
Eˉ 50 950 1000
250 1750 2000
Tầng 1 D Dˉ 2 D Dˉ
E 160 240 400 E 40 560 600
Eˉ 40 360 400 Eˉ 10 590 600
200 600 800 50 1150 1200
OR1 = eh/fg = 6.0 OR2 = il/kj = 4.2
9/15/2010
PHÂN TÍCH PHÂN TẦNG
D Dˉ
E 30 18 48
ORc = ad/bc = 1.95
Eˉ 70 82 152
100 100 200
Yếu tố nhiễu có liên quan với bệnh? Yếu tố nhiễu có liên quan với phơi nhiễm?
D Dˉ E Eˉ
≥ 40 50 20 70 ≥ 40 35 35 70
< 40 50 80 130 < 40 13 117 130
100 100 200 48 152 200
OR = 4 OR = 9
9/15/2010
YẾU TỐ NHIỄU
Tiêu chuẩn là yếu tố nhiễu
Giá trị ước lượng thô khác biệt với giá trị hiệu chỉnh
Các bước phân tích
Tính toán giá trị đo lường tác động (RR, OR)
Phân tầng theo yếu tố nhiễu
Phân tích trong từng tầng
Nếu tác động là như nhau, phân tích hiệu chỉnh MH
So sánh giá trị thô và hiệu chỉnh
• ORc = ORa không có nhiễu
• ORc ≠ ORa có yếu tố nhiễu
9/15/2010
TÓM TẮT
Chuẩn bị một bộ số liệu tốt
Làm sạch
Có bảng mã
Phân tích cụ thể, dựa vào mục tiêu
Phân tích yếu tố nhiễu
9/15/2010