Bài giảng Phân tích số liệu định lượng

Các NC đều có mục đích đánh giá sự biến thiên:  Giữa các nhóm so sánh  Của nhóm nghiên cứu theo thời gian  Càng nhiều nguồn biến thiên  càng nhiều khảnăng phiên giải số liệu  Hai (2) nguồn biến thiên chính:  Khác biệt giữa các cá thể  Biến thiên do đo lư ờng  Một PP nghiên c ứu tốt  khống chế và giảm thiểu được nhiều nguồn biến thiên

pdf36 trang | Chia sẻ: oanh_nt | Lượt xem: 2143 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Bài giảng Phân tích số liệu định lượng, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
PHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC THIẾT KẾ NGHIÊN CỨU  Các giả thuyết  Loại thiết kế  Định nghĩa đơn vị quan sát và các quan sát  Xác định các nguồn sai số  Ai sẽ là người sử dụng các báo cáo NC 9/15/2010 SỰ BIẾN THIÊN Các NC đều có mục đích đánh giá sự biến thiên:  Giữa các nhóm so sánh  Của nhóm nghiên cứu theo thời gian Càng nhiều nguồn biến thiên  càng nhiều khả năng phiên giải số liệu Hai (2) nguồn biến thiên chính:  Khác biệt giữa các cá thể  Biến thiên do đo lường Một PP nghiên cứu tốt  khống chế và giảm thiểu được nhiều nguồn biến thiên 9/15/2010 SAI SỐ Sai số ngẫu nhiên (random error)  Không dự đoán được Sai số hệ thống (systematic error hoặc bias)  Nghiêm trọng hơn  Có thể dẫn đến kết quả NC không chính xác  Nhiều loại • Sai số lựa chọn (selection bias) • Nhiễu (confounding) • Sai số thông tin (information bias) 9/15/2010 CÂU HỎI NGHIÊN CỨU Giúp cho người NC tập trung vào nội dung NC Cần được đặt ra trước khi thiết kế nghiên cứu Cần phải được chuyển sang dạng gigiảả thuythuyếếtt khoakhoa hhọọcc  Xác định biến độc lập, phụ thuộc  Đo lường chúng như thế nào?  Phiên giải các mối quan hệ như thế nào? 9/15/2010 VÍ DỤ Chủ đề NC: “Sự hài lòng của các bác sỹ lâm sàng” Câu hỏi NC: “có sự khác nhau về sự hài lòng của các bác sỹ ở những khoa điều trị khác nhau không?” Biến số: Biến phụ thuộc: Sự hài lòng của các bác sỹ Biến độc lập: Khoa điều trị 9/15/2010 GIẢ THUYẾT KHOA HỌC Giả thuyết khoa học được đổi thành:  Giả thuyết không (H0)  Đối thuyết/Giả thuyết đối (H1) Ví dụ: H0: Sự hài lòng như nhau H0: Sự hài lòng như nhau H1: Sự hài lòng khác nhau H1: Các bác sỹ làm hệ ngoại sản hài lòng với công việc hơn BS hệ nội nhi Kiểm định 2 phía Kiểm định 1 phía 9/15/2010 GIẢ THUYẾT KHOA HỌC [CONT.]  Kiểm định thống kê : tính toán giá trị thống kê để nhằm bác bỏ giả thuyết H0  Ví dụ:  Không đủ bằng chứng để bác bỏ H0, như vậy, chúng ta kết luận nghiên cứu cho thấy không có mối liên quan giữa làm ở các khoa điều trị và sự hài lòng của các bác sỹ Hoặc  Có đủ bằng chứng để bác bỏ H0  có mối liên quan giữa việc làm ở khoa điều nào với sự hài lòng của các bác sỹ. 9/15/2010 CÁC THÀNH PHẦN THIẾT KẾ Các thành phần thiết kế ảnh hưởng tới phân tích  Đơn vị quan sát  Phương pháp chọn mẫu  Các biến đầu ra 9/15/2010 ĐƠN VỊ QUAN SÁT  Đơn vị quan sát  Là một thành phần: người, động vật, cơ sở Y tế  Quan sát  Số lần quan sát, thu thập số liệu về một đơn vị quan sát  Nghiên cứu 1 lần:  Đơn vị quan sát = số quan sát  So sánh giữa các đơn vị quan sát  Nghiên cứu giữa các đối tượng  Nghiên cứu lặp lại:  một ĐVQS được quan sát nhiều lần  So sánh giữa các đơn vị quan sát  So sánh giữa các lần quan sát  Nghiên cứu trong/Giữa các đối tượng 9/15/2010 PHƯƠNG PHÁP CHỌN MẪU Mẫu được chọn như thế nào? Mẫu được chọn từ quần thể nào? Mục đích chọn ra nhóm đại diện để nghiên cứu Mỗi một cách chọn mẫu đều có ảnh hưởng khác nhau đến việc ước lượng sai số chuẩn và khoảng tin cậy. 9/15/2010 BIẾN ĐẦU RA Xác định thông qua câu hỏi nghiên cứu Biến thuộc loại gì:  Liên tục  Biến phân loại • Nhị thức • Định danh • Thứ bậc 9/15/2010 BẢNG KIỂM PHÂN TÍCH SỐ LIỆU 1. Câu hỏi nghiên cứu là gì? 2. Thiết kế nghiên cứu là thực nghiệm hay quan sát? 3. Đơn vị quan sát là gì? 4. Phương pháp chọn mẫu như thế nào? 5. Đo lường lặp lại hay một lần? 6. Biến đầu ra là gì? 7. Biến loại gì: liên tục, phân loại? 8. Những nhóm nào được so sánh? 9/15/2010 TIẾN HÀNH PHÂN TÍCH BỘ MÔN THỐNG KÊ Y TẾ-ĐHYTCC QUẢN LÝ SỐ LIỆU Nhập số liệu vào máy  Epi Info, EpiData Làm sạch  Kiểm tra các giá trị sai sót: Mã hóa, nhập phiếu  Kiểm tra tính đồng nhất Phân tích số liệu 9/15/2010 CHIẾN LƯỢC PHÂN TÍCH Dựa vào mục tiêu nghiên cứu  Mô tả: • Biến số quan trọng: định lượng/phân loại • Quy mô, phân bố của yếu tố nghiên cứu (con người, thời gian, địa điểm)  Phân tích/ so sánh • Hình thành giả thuyết và kiểm định giả thuyết • So sánh tìm sự khác biệt • Xác định, mô tả mối liên quan và sự kết hợp 9/15/2010 XÂY DỰNG BẢNG GIẢ Bảng giả định các kết quả nghiên cứu  Thiết lập khi tiến hành thiết kế nghiên cứu  Dựa vào các biến (thông tin) trong bộ câu hỏi điều tra Bảng  Mô tả: các nội dung mô tả  Phân tích: • các biến dự kiến phân tích • Kiểm định thống kê sẽ sử dụng 9/15/2010 VÍ DỤ Bảng 1: Tình trạng dinh dưỡng của trẻ Chỉ số Loại n Tỷ lệ 95% CI Bình thường Nhẹ cân Nhẹ (W/A) Độ 1 Độ 2 Bình thường Còi c c ọ Nh (H/A) ẹ Độ 1 Độ 2 9/15/2010 VÍ DỤ Bảng 2: So sánh thu nhập trung bình Xã n TB Std. Err. Std. Dev. [KTC 95% ] Sao Do An Lac Chung  t, p-value 9/15/2010 PHÂN TÍCH MÔ TẢ Biến định lượng  Đo lường độ tập trung: trung bình, trung vị  Đo lường độ phân tán: phương sai, độ lệch chuẩn  Sự phân bố: chuẩn, lệch trái, lệch phải  Các giá trị ngoài khoảng (bất thường) 9/15/2010 VÍ DỤ Age in month N 4164 700 600 Trung binh 27.48 500 Trung vi 25.00 400 300 SD 13.69 200 Std. Dev = 13.69 100 Minimum 3 Mean = 27.5 N = 4164.00 Frequency 0 5.0 15.0 25.0 35.0 45.0 55.0 Maximum 60 10.0 20.0 30.0 40.0 50.0 60.0 Age in month 9/15/2010 PHÂN TÍCH MÔ TẢ [CONT.] Biến phân loại  Đo lường độ tập trung: tỷ lệ  Đo lường độ phân tán: bảng phân phối tần số 9/15/2010 VÍ DỤ Chỉ số Loại n Tỷ lệ % 95% CI Bình thường 1311 31.5 30.1 – 32.9 Nhẹ cân Nhẹ 1599 38.4 36.9 - 39.9 (W/A) Độ 1 986 23.7 22.4 – 25.0 Độ 2 268 6.4 5.7 – 7.2 Bình thường 117 2.8 2.3 – 3.4 Còi c c ọ Nhẹ 2000 48.0 46.5 – 49.6 (H/A) Độ 1 1171 28.1 26.8 – 29.5 Độ 2 876 21.0 19.8 – 22.3 9/15/2010 PHÂN TÍCH MỐI LIÊN QUAN BIẾN ĐỊNH LƯỢNG So sánh  Kiểm định trung bình: • 2 trung bình độc lập : t-test • 2 trung bình lặp lại : t –ghép cặp • nhiều trung bình : ANOVA Mối quan hệ không định hướng  Hệ số tương quan r Mối quan hệ định hướng  Hồi quy tuyến tính 9/15/2010 VÍ DỤ Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Sao Do 1336 1794524 65030.55 2376953 1666950 1922097 An Lac 1488 903472 27554.39 1062900 849422.4 957521.6 combined 2824 1325018 35027.96 1861432 1256335 1393701 diff 891051.5 68135.77 757450.6 1024652 Degrees of freedom: 2822 Ho: mean(Sao Do) - mean(An Lac) = diff = 0 Ha: diff 0 t = 13.0776 t = 13.0776 t = 13.0776 P t = 0.0000 P > t = 0.000 9/15/2010 PHÂN TÍCH MỐI LIÊN QUAN BIẾN PHÂN LOẠI So sánh • 2 tỷ lệ : z-test, Khi bình phương • nhiều tỷ lệ : Khi bình phương Mối quan hệ định hướng  Hồi quy logistics 9/15/2010 VÍ DỤ E NE Tổng D 12 2 14 ND 7 9 16 Tổng 19 11 30 OR=7.7 (95%CI: 1,4-40,6) Chi square=5.66, p_value=0.0173 9/15/2010 VÍ DỤ Bệnh Không Tổng Tốt n 7 12 19 % 36.84 63.16 100 TB n 10 5 15 % 66.67 33.33 100 Kém n 9 2 11 % 81.82 18.18 100 Tổng n 26 19 45 % 57.78 42.22 100 Chi square=6.5 p=0.039 9/15/2010 PHÂN TÍCH YẾU TỐ NHIỄU Phân tầng  Nhiều bảng 2x2  Giá trị OR thô, hiệu chỉnh  Giá trị Khi bình phương MH Hồi quy đa biến 9/15/2010 PHÂN TÍCH PHÂN TẦNG D Dˉ E a b a+b ORc = ad/bc Eˉ c d c+d a+c b+d tầng 1 D Dˉ 2 D Dˉ E e f e+f E i j i+j Eˉ g h g+h Eˉ k l k+l e+g f+h i+k j+l OR1 = eh/fg OR2 = il/kj 9/15/2010 YẾU TỐ NHIỄU ORc = ad/bc ORa = f(OR1, OR2), kiểm định Mantel Haenszel Nếu ORc = ORa Không phải là nhiễu Nếu ORc ≠ ORa, có yếu tố nhiễu 9/15/2010 PHÂN TÍCH PHÂN TẦNG D Dˉ E 30 18 48 ORc = ad/bc = 1.95 Eˉ 70 82 152 100 100 200 Tuổi < 40 D Dˉ Tuổi ≥ 40 D Dˉ E 5 8 13 E 25 10 35 Eˉ 45 72 117 Eˉ 25 10 35 50 80 130 50 20 70 OR1 = eh/fg = 1.0 OR2 = il/kj = 1.0 9/15/2010 PHÂN TÍCH PHÂN TẦNG D Dˉ E 200 800 1000 ORc = ad/bc = 4.75 Eˉ 50 950 1000 250 1750 2000 Tầng 1 D Dˉ 2 D Dˉ E 160 240 400 E 40 560 600 Eˉ 40 360 400 Eˉ 10 590 600 200 600 800 50 1150 1200 OR1 = eh/fg = 6.0 OR2 = il/kj = 4.2 9/15/2010 PHÂN TÍCH PHÂN TẦNG D Dˉ E 30 18 48 ORc = ad/bc = 1.95 Eˉ 70 82 152 100 100 200 Yếu tố nhiễu có liên quan với bệnh? Yếu tố nhiễu có liên quan với phơi nhiễm? D Dˉ E Eˉ ≥ 40 50 20 70 ≥ 40 35 35 70 < 40 50 80 130 < 40 13 117 130 100 100 200 48 152 200 OR = 4 OR = 9 9/15/2010 YẾU TỐ NHIỄU  Tiêu chuẩn là yếu tố nhiễu  Giá trị ước lượng thô khác biệt với giá trị hiệu chỉnh  Các bước phân tích  Tính toán giá trị đo lường tác động (RR, OR)  Phân tầng theo yếu tố nhiễu  Phân tích trong từng tầng  Nếu tác động là như nhau, phân tích hiệu chỉnh MH  So sánh giá trị thô và hiệu chỉnh • ORc = ORa không có nhiễu • ORc ≠ ORa có yếu tố nhiễu 9/15/2010 TÓM TẮT Chuẩn bị một bộ số liệu tốt  Làm sạch  Có bảng mã Phân tích cụ thể, dựa vào mục tiêu Phân tích yếu tố nhiễu 9/15/2010
Luận văn liên quan