Bài giảng Thu thập, xử lý và phân tích dữ liệu

Các vấn đề đạo đức  Lựa chọn PP thu thập DL  Chọn mẫu và Tính xác thực, độ tin cậy  Phân tích dữ liệu

pdf15 trang | Chia sẻ: oanh_nt | Lượt xem: 2124 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Bài giảng Thu thập, xử lý và phân tích dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
20-Oct-12 Qui trình nghiên cứu (8 bước) NC các KN và LT THU THẬP, XỬ LÝ Giải Xây thích XĐ vấn Xây dựng dựng Thu Phân & PHÂN TÍCH DỮ LIỆU KQ, viết đề NC GT ĐC thập DL tích DL BC Tìm hiểu các NC trước đây THU THẬP VÀ PHÂN TÍCH DỮ LIỆU Vấn đề đạo đức trong thu thập DL  Các vấn đề đạo đức 1) Người tham gia/ chủ thể  Lựa chọn PP thu thập DL 2) Người nghiên cứu  Chọn mẫu và Tính xác thực, độ tin cậy 3) Cơ quan tài trợ…  Phân tích dữ liệu 1 20-Oct-12 người tham gia người nghiên cứu  Thái độ đồng ý của người tham gia là tự  Tránh thiên lệch nguyện, không chịu bất kỳ cáp lực nào.  Sử dụng PPNC thích hợp  Nên hay không nên tưởng thưởng cho người  tham gia? Báo cáo chính xác  Những câu hỏi có thông tin nhạy cảm?  Sử dụng thông tin  Bảo mật danh tánh người tham gia? đơn vị tài trợ  Đặt ra điều kiện  Sử dụng thông tin Lựa chọn PP thu thập DL 2 20-Oct-12 Xác định mục tiêu nghiên cứu cụ thể Lập kế họach thu thập DL  Cần xem xét một cách hệ thống các mục tiêu trong một cây mục tiêu:  Xác định mục tiêu nghiên cứu cụ thể  Xem xét mọi khía cạnh, mọi tầng lớp của một tập  Xác định xuất phát điểm của nghiên cứu hợp các mục tiêu có quan hệ tương tác  Xác định được quy mô của đề tài, giới hạn phạm vi  Xác định đối tượng nghiên cứu cụ thể của đề tài nghiên cứu  Xác định cách thu thập thông tin, thời điểm, chi phí  Tạo cơ sở cho việc hình thành tập hợp nghiên cứu   Lập chương trình hành động cụ thể cho từng công Số lượng các cấp mục tiêu được quyết định bởi: việc  Nhu cầu nghiên cứu (sâu hay rộng)  Khả năng tổ chức nghiên cứu (mỗi nhánh phân cho một hay nhiều người) Xác định xuất phát điểm của nghiên cứu Xác định đối tượng nghiên cứu cụ thể  Đối tượng nghiên cứu cụ thể cho từng mục  Ở đâu? tiêu nghiên cứu  Bao giờ?  Cần khảo sát trên bao nhiêu đơn vị nghiên cứu   Điều tra tổng thể hay chọn mẫu? Trong bao lâu?  Chọn mẫu thế nào?  Đã có những gì rồi?  Tiếp cận đối tượng nghiên cứu ra sao?  Cần thêm những gì?  Vd: Nghiên cứu về nhu cầu du khách  Đối tượng nghiên cứu là du khách  Cần bao nhiêu người thực hiện?  Cần bao nhiêu du khách? Tiến hành chọn thế nào để số lượng đủ đại diện? 3 20-Oct-12 Chương trình hành động cụ thể Xác định cách thu thập thông tin cho từng công việc  Thu thập thông tin ở đâu?  Phân bố công việc theo từng giai đọan  Như thế nào?  Dành một phần thời gian dự trữ cho những vấn  Bằng phương pháp gì? đề không mong đợi   Các công cụ để thu thập? Lập lịch theo sơ đồ   Vào thời điểm nào? Trong bao lâu? Có thể lập lịch cho từng thành viên dựa trên lịch chung.  Chi phí?  Ai đi thu thập? Có cần huấn luyện không? Lựa chọn PP thu thập dữ liệu  Dữ liệu thứ cấp (phụ)  Dữ liệu sơ cấp (chính) Không có DL nào thu thập được Có độ tin cậy và xác thực 100%. 4 20-Oct-12 Đóng Bảng Mở hỏi Kết hợp Sơ Có cấu trúc cấp Phỏng vấn Không có cấu trúc PP thu thập DL Tham dự Quan sát Không tham dự Thứ cấp Tư liệu Phương pháp quan sát  Quy trình:  Cần lưu ý:  Xác định đối tượng quan sát  Tránh tính chủ quan  Lập kế họach quan sát: thời của người quan sát gian, địa điểm, số lượng đối  Cảm giác, việc lựa chọn tượng, người quan sát, phương  tiện quan sát… Trình độ của người quan sát  Lựa chọn phương thức quan  Thiên về mô tả, chưa sát: trực tiếp hay gián tiếp, một đạt đến trình độ nhận hay nhiều lần, khỏang cách giữa thức bản chất bên các lần quan sát… trong của đối tượng.  Tiến hành quan sát  Nên kết hợp với các phương pháp khác  Ghi chép  Xử lý  Kiểm tra kết quả quan sát 5 20-Oct-12 Phương pháp chuyên gia  Khái niệm: Là phương pháp sử dụng trí tuệ của đội ngũ chuyên gia có trình độ cao của một chuyên ngành để xem xét, nhận định bản chất của một sự kiện khoa học hay thực tiễn phức tạp, để tìm ra giải pháp tối ưu cho các sự kiện đó hay phân tích, đánh giá một sản phẩm khoa học.  Cần lưu ý: Bảng hỏi  Chọn đúng chuyên gia  Nếu để nhận định một sự kiện hay một giải pháp,  Dùng để đo được các biến số nhất định có quan hệ có thể tổ chức dưới dạng hội thảo, ghi chép đầy tới đối tượng nghiên cứu. đủ, xử lý thông tin theo một chuẩn, một hệ thống  để tìm ra được các ý kiến gần nhau hoặc trùng Sử dụng khi: nhau - Vấn đề được xác định rõ ràng, không thay đổi  Nếu để đánh giá một công trình, phải xây dựng trong suốt quá trình nc. một hệ thống tiêu chí, có thang điểm để đánh giá - Các câu hỏi có liên quan đến các sự kiện, số  Đảm bảo tính khách quan trong đánh giá và lượng, đồ vật. nhận định - Có những câu hỏi trả lời dưới dạng ẩn danh - Người nghiên cứu thích phân tích các con số 6 20-Oct-12 Bố cục bảng hỏi Các dạng câu hỏi 1. Phần thư giải thích • Câu hỏi đóng: 2. Các câu hỏi liên quan đến thông tin nhân khẩu • Câu hỏi mở: xã hội của người được hỏi • Kết hợp: 3. Nội dung chính 4. Lời cảm ơn Lưu ý: bảng hỏi không nên quá dài dòng, cần bao Lưu ý: Trong nội dung các câu hỏi nên có những quát được chủ đề nghiên cứu. Không nên dùng câu để kiểm tra độ xác thực của thông tin. thuật ngữ khoa học mà nên dùng từ ngữ thông dụng, dễ hiểu Phỏng vấn sâu • Mục đích của phỏng vấn sâu? • Khi nào sử dụng phương pháp pvấn? • Phỏng vấn sâu không cấu trúc: một số câu hỏi được dẫn dắt bởi người trả lời (nên sử dụng băng ghi âm) • Phỏng vấn sâu cấu trúc: câu hỏi được xác định rõ ràng. • Phỏng vấn sâu bán cơ cấu: kết hợp 2 loại trên. 7 20-Oct-12 Thang đo 1. Thang đo danh nghĩa • Thang đo danh nghĩa • Đây là loại thang đo có mức độ đo lường yếu nhất. • Thang đo thứ bậc • là loại thang đo định tính • Thang đo khoảng cách • Thang đo tỉ lệ 2. Thang đo thứ bậc  Như khi đo lường về tôn giáo, ta có thể • Đây là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém, cao thấp. xây dựng thang đo định danh sau:  Với câu hỏi: Có haì lòng với quy định bắt buộc đội mũ  1- Không theo tôn giáo nào bảo hiểm khi đi xe máy không? Ta có thể triển khai một thang đo thứ bậc có 3 nấc:  2- Phật giáo 1- Hài lòng  2- Lưỡng lự 3- Thiên chúa giáo 3- Không hàì lòng  4- Tin lành  5- Hồi giáo  6- Các tôn giáo khác. 8 20-Oct-12 3. Thang đo khoảng cách 4. Thang đo tỷ lệ • Là thang đo thứ bậc có các khoảng cách • Là thang đo khoảng cách với một điểm 0 tuyệt đối đều nhau nhưng không có điểm gốc là 0. (điểm gốc) trên thang đo. • Nhờ điểm gốc và một tiêu chuẩn đo cụ thể, ta có thể sử • Trong thực tế nghiên cứu xã hội, nhiều dụng được mọi công cụ toán - thống kê để phân tích dữ thang đo thứ bậc được dùng như thang liệu, so sánh được tỷ lệ giữa các trị số đo. • Thang đo tỷ lệ được sử dụng rất rộng rãi để đo lường đo khoảng cách. các hiện tượng kinh tế - xã hội, như: thu nhập, chi tiêu, thời gian lao động, tuổi, số con ... Các đơn vị đo lường • VD như thang điểm… vật lý thông thường (kg, mét, lít ..) cũng là các thang đo loại này. Độ giá trị và độ tin cậy Độ đáng tin (reliability) • Con người đáng tin: phụ thuộc, nhất quán, • Giá trị (validity) có thể dự đoán được, ổn định, trung thực. • Về logic và về thống kê. Công cụ: ổn định, nhất quán, dự đoán  Logic: xem xét câu hỏi liên quan mục tiêu nghiên cứu • đựơc, đâu vào đó. Công cụ càng nhất quán  Thống kê: liên kết chặt giữa câu hỏi n/c với biến số đầu ra . và ổn định, độ đáng tin càng cao. • Những khái niệm trừu tượng (hiệu quả, khả thi, • Sử dụng cùng công cụ, có cùng kết quả thói quen, hài lòng, bền vững…) phải bao quát trong những điều kiện tương tự hoặc y như nhiều khía cạnh và bảo đảm các câu hỏi đo được vậy. Nếu lập lại cùng điều tra ra kết quả những cái cần đo. chênh lệch nhiều ĐĐT thấp. 9 20-Oct-12 Chọn mẫu Yếu tố ảnh hưởng đến độ đáng tin  Mẫu là tập hợp các yếu tố đã được chọn từ một • Từ ngữ không rõ, hiểu nhầm tổng thể.  • Bối cảnh hỏi/ trả lời Khung mẫu: Khung lấy mẫu là sự mô tả chung • Phương thức trả lời tất cả các cá thể có thể chọn làm mẫu.  • Tương tác người hỏi, trả lời. Qui mô mẫu:  Mẫu lớn không phải luôn luôn tốt  PP lấy mẫu là vô cùng quan trọng Vì sao phải chọn mẫu? 10 20-Oct-12 Phương pháp lấy mẫu • Chọn mẫu, phương pháp nghiên cứu không phù hợp. hệ thống Hỗn hợp VD: Tìm hiểu về đời sống dân cư nhưng chỉ Thuận tiện phỏng vấn người định cư lâu năm, cần Các loại Phán đoán hiểu sâu tâm tư nguyện vọng nhưng chỉ lấy mẫu dùng đến bảng hỏi. P/v sâu, ít mẫu, rồi Theo xác suất Chỉ tiêu không ngẫu nhiên khái quát hóa lên (báo chí)… Tăng nhanh Đơn giản Theo xác suất Phân tầng ngẫu nhiên Nhóm Phương pháp lấy mẫu Mẫu ngẫu nhiên Dùng khi Kiểu Mô tả Ưu điểm Nhược điểm Lấy mẫu ngẫu nhiên cho  Lấy mẫu không ngẫu nào phép mỗi cá nhân trong nhiên, có chủ ý và trọng tâm Khi các phần Ngẫu Mỗi phần tử của tử của tổng thể Mất nhiều thời cộng đồng một cơ hội công Dễ tiến hành hơn trong phạm vi một số nhiên tổng thể có cơ hội là tương đồng gian Tính tiêu bằng được lựa chọn. lượng nào đó. được chọn vào mẫu nhau ở những Cỡ mẫu phải lớn đơn biểu cao Phương pháp này có qui giản như nhau biến số quan Mẫu chi phí lớn trình lựa chọn được xác trọng định rõ và cho phép sai số. 11 20-Oct-12 Chia tổng thể thành từng phân khúc nhỏ có Khi tổng thể Kiểm soát được cùng 1 đặc điểm là đồng nhất cỡ mẫu Dễ tăng sai Phân rồi áp dụng cách và có nhiều Hiệu quả thống kê lầm mẫu tầng chọn mẫu ngẫu phân nhóm cao Chi phí cao nhiên đơn giản khác nhau cho từng phân khúc mẫu ngẫu nhiên đơn giản Nếu làm đúng Hiệu quả mẫu phân tầng Tổng thể được cách sẽ cho phép thống kê chia thành từng Khi tổng thể ước lượng chính thấp (sai nhóm tương là tập hợp xác các tham số lầm mẫu Theo đồng. Toàn bộ của những của tổng thể cao) do các một hoặc vài nhóm Nhóm tương Chi phí thấp, đặc nhóm sẽ nhóm sẽ được đối độc lập biệt với những đồng nhất chọn ngẫu nhiên nhóm khác biệt về thay vì đa làm mẫu địa lý dạng. Chọn mẫu ngẫu nhiên đơn giản Chọn mẫu không ngẫu nhiên Kiểu Dùng khi Mô tả Ưu điểm Nhược điểm mẫu nào Khi các phần Không chắc Chọn mẫu theo Tiện lợi và Thuận tử của tổng chắn mức độ sự thuận tiện của ít tốn chi tiện thể tiện cho khái quát của người nghiên cứu phí việc chọn mẫu mẫu dùng trong Không chắc Dựa trên phán Phán giai đoạn đầu Không có chắn mức độ đoán của nguười đoán của nghiên xu hướng đại diện của nghiên cứu. cứu khám phá mẫu 12 20-Oct-12 Khi tổng thể có Đảm bảo Chỉ Chọn các phần tử Không nhiều tầng lớp và tính tiêu tiêu/ của mẫu sao cho chắc chắn phương pháp chọn biểu cho định mẫu phải có sự phân mức độ mẫu phân tầng các tầng mức bố giống như của đại diện không thể thực lớp của quota tổng thể đã chọn sẵn của mẫu hiện được tổng thể Khi tổng thể Mẫu được dùng để không xác định và Ít tốn chi xác định các mẫu Tăng đối tượng nghiên phí Độ tin cậy khác có đặc điểm nhanh cứu chỉ có thể xác Dễ thực thấp tương tự và phát định qua tham hiện triển ra chiếu 13 20-Oct-12 Chọn mẫu hỗn hợp Kiểu Dùng khi Mô tả Ưu điểm Nhược điểm mẫu nào Bắt đầu bằng cách Thiết kế đơn Khi các phần chọn 1 phần tử giản tử của tổng thể Ít tính ngẫu ngẫu nhiên của tổng Ít tốn chi phí Hệ là tương đồng nhiên hơn cách thể, sau đó chọn các hơn kiểu nhau ở những chọn mẫu ngẫu thống phần tử tiếp theo là chọn mẫu biến số quan nhiên đơn giản phần tử thứ k sau ngẫu nhiên trọng phần tử đã chọn đơn giản Chọn mẫu hệ thống 14 20-Oct-12 • Chọn mẫu không đại diện => Kiến thức Thảo luận trên lớp về địa bàn nc. • Mối quan hệ giữa mục tiêu và câu hỏi 1.Cứ mỗi lớp trong Khoa Địa Lý chọn ra 10 sinh nghiên cứu (?) viên. 2.Chọn 5 trang trong danh sách sinh viên hệ chính • Bỏ qua hay không coi trọng phần tổng quy của trường. Tất cả các SV trong danh sách quan tư liệu (GDMT => lặp lại n/c đã có, này được gọi tới để phỏng vấn. dữ liệu và kết qủa còn sơ xài). 3.Trên đường Nguyễn Thị Minh Khai, chọn hộ ở số • Đánh giá CTGDMT (nhưng lại làm bảng nhà số 02, sau đó cách 3 nhà chọn 1 nhà để phỏng hỏi liên quan đến đánh giá nhận thức vấn. của học sinh về MT). Đúng nếu làm before-after studies. XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU Thiết kế bảng hỏi Dữ liệu thô Hiệu chỉnh Mã hóa Phân tích Nghiên cứu nhu cầu về nhà ở cho người thu nhập thấp tại TPHCM 15
Luận văn liên quan