Ban tổ chức các hoạt động hỗ trợ nghiên cứu khoa học sinh viên 2011

Phân tích phương sai là một dạng mở rộng của phương pháp kiểm nghiệm t hai mẫu ngẫu nhiên độc lập (Independent-Samples T Test), và được sử dụng để kiểm nghiệm cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm. Với giả thuyết ban đầu H0cho rằng các giá trị trung bình này là bằng nhau

pdf44 trang | Chia sẻ: lvbuiluyen | Lượt xem: 2094 | Lượt tải: 5download
Bạn đang xem trước 20 trang tài liệu Ban tổ chức các hoạt động hỗ trợ nghiên cứu khoa học sinh viên 2011, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT *** BAN TỔ CHỨC CÁC HOẠT ĐỘNG HỖ TRỢ NGHIÊN CỨU KHOA HỌC SINH VIÊN 2011 TÀI LIỆU THAM KHẢO Chuyên đề 1: “Kỹ năng xử lý và phân tích số liệu” LƯU HÀNH NỘI BỘ TP.HCM – T3/2011 Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 2 MỤC LỤC A.KHÁI QUÁT VỀ QUI TRÌNH NGHIÊN CỨU–XỬ LÝ THÔNG TIN 3 I. Qui trình của một cuộc nghiên cứu ......................................................... 3 II. Xử lý thông tin trong nghiên cứu ........................................................... 3 III. Qui trình xử lý số liệu ............................................................................3 B. GIỚI THIỆU VỀ PHẦN MỀM SPSS VÀ THAO TÁC CƠ BẢN ........5 I. Khái quát về SPSS .................................................................................. 5 II. Một số khái niệm và thao tác trên SPSS ............................................... 6 Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 3 A. KHÁI QUÁT VỀ QUI TRÌNH NGHIÊN CỨU – XỬ LÝ THÔNG TIN I. Qui trình của một cuộc nghiên cứu Thông thường một qui trình nghiên cứu bao gồm 8 bước: - Bước 1: Xác định vấn đề cần nghiên cứu - Bước 2: Xác định loại thông tin cần thu thập và nguồn cung cấp thông tin - Bước 3: Chọn mẫu nghiên cứu - Bước 4: Thiết kế nghiên cứu và xác định phương pháp thu thập thông tin. - Bước 5: Thiết kế bảng câu hỏi - Bước 6: Thu thập dữ liệu - Bước 7: Xử lý, phân tích và diễn giải các dữ liệu đã được xử lý - Bước 8: Trình bày và báo cáo kết quả II. Xử lý thông tin trong nghiên cứu Có hai dạng thông tin nghiên cứu cần thu thập: - Thông tin thứ cấp là những thông tin đã hiện hữu trên các nguồn tài liệu đã được đăng tải, được tổ chức thành bảng biểu, đồ thị. Loại thông tin này người nghiên cứu chỉ việc sử dụng và diễn giải theo nhu cầu nghiên cứu của mình mà không cần quá trình xử lý đòi hỏi sự hỗ trợ của các phần mềm phân tích chuyên dụng. - Thông tin sơ cấp là thông tin chưa hiện hữu, muốn có thông tin này đòi hỏi các nhà nghiên cứu phải thực hiện một qui trình nghiên cứu với nhiều bước. Trong nghiên cứu thu thập thông tin sơ cấp tồn tại hai dạng nghiên cứu chính yếu nghiên cứu định tính và nghiên cứu định lượng. Nhiệm vụ tổng quát của việc xử lý – phân tích dữ liệu là chuyển những mẫu dữ liệu quan sát thô mà ta đã tiến hành mã hóa và kiểm tra thành những con số thống kê có ý nghĩa cho việc diễn giải kết quả nghiên cứu. Toàn bộ công việc xử lý – phân tích phức tạp này đòi hỏi cần phải có máy tính và các phần mềm chuyên dụng hỗ trợ. III. Qui trình xử lý số liệu Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 4 Việc xử lý dữ liệu bắt đầu từ khi ta nhận được bảng câu hỏi đã được phỏng vấn, bao gồm các bước sau: - Bước 1: Kiểm tra, hiệu chỉnh các trả lời trên bảng câu hỏi - Bước 2: Mã hóa các câu trả lời trên bảng câu hỏi - Bước 3: Nhập dữ liệu đã được mã hóa vào máy tính - Bước 4: Xác định các lỗi trong cơ sở dữ liệu và làm sạch dữ liệu - Bước 5: Tạo bảng cho dữ liệu và tiến hành các phân tích thống kê Hai giai đoạn đầu tiên là những bước chuẩn bị cho việc phân tích bằng máy tính sau này. Giai đoạn 3 là nhập các dữ liệu đã được mã hóa vào máy tính. Quá trình nhập liệu này có thể dẫn đến những sai xót do đó một bước kế tiếp phải được thực hiện trước khi tiến hành phân tích dữ liệu là phải làm sạch dữ liệu đã được nhập vào trong máy. Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 5 B. GIỚI THIỆU VỀ PHẦN MỀM SPSS VÀ THAO TÁC CƠ BẢN I. Khái quát về SPSS: SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình máy tính phục vụ cơng tác thống kê. SPSS được sử dụng rộng rãi trong cơng tác thống kê xã hội. 1.Khái quát về phân tích dữ liệu 2. Khái niệm về phân tích dữ liệu 2.1 Kiểm tra dữ liệu (Data Screening) 2.2 Thống kê mô tả (Descriptive Statistics) 2.3 Kiểm nghiệm các so sánh trung bình mẫu (Tests for Comparing Means) Trong phân tích thống kê người ta thường sử dụng các phép kiểm nghiệm kiểm nghiệm các giả thuyết về giá trị trung bình của các biến định lượng, và thống kê cung cấp cho ta các công cụ như kiểm nghiệm t (T-Test) hay kiểm nghiệm Z (Z-test) ƒ Kiểm nghiệm t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập Ta có ba dạng kiểm nghiệm t cho việc so sánh các giá trị trung bình của mẫu. Việc sử dụng dạng nào tùy thuộc vào vấn đề ta đang tiến hành so sánh vấn đề gì - Sử dụng kiểm nghiệm t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) là phương pháp nhằm mục đích kiểm nghiệm so sánh giá trị trung bình của một biến riêng biệt theo một nhóm có khác biệt hay không đối với giá trị trung bình của biến riêng biệt đó theo một nhóm khác. Với giả thuyết ban đầu H0 cho rằng giá trị trung bình của hai nhóm này là bằng nhau. Ví dụ ta kiểm nghiệm thu nhập trung bình (biến thu nhập) theo hai nhóm giới tinh là nam và giới tính là nữ (biến giới tính sử dụng để chia các giá trị quan sát trong biến thu nhập thành hai nhóm) - Công cụ kiểm nghiệm t cho cặp mẫu (Paired-Samples T Test) được sử dụng để kiểm nghiệm có hay không giá trị trung bình của các khác biệt giữa các cặp quan Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 6 sát là khác giá trị 0. Với giả thuyết ban đầu H0 cho rằng giá trị trung bình các khác biệt này là bằng 0. Ví dụ như kiểm nghiệm sự khác biệt về điểm thi môn học của hai nhóm sinh viên có tham gia và không có tham gia chương trình phụ đạo ngoài giờ. - Công cụ kiểm nghiệm t một mẫu (One-Sample T Test) để kiểm nghiệm có hay không giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước. Với giả thuyết ban đầu H0 cho rằng giá trị trung bình kiểm nghiệm là bằng với giá trị giả thuyết đưa ra ƒ Phân tích phương sai một chiều (One-Way ANOVA) Phân tích phương sai là một dạng mở rộng của phương pháp kiểm nghiệm t hai mẫu ngẫu nhiên độc lập (Independent-Samples T Test), và được sử dụng để kiểm nghiệm cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi nhóm. Với giả thuyết ban đầu H0 cho rằng các giá trị trung bình này là bằng nhau. 2.4 Kiểm nghiệm các mối quan hệ (Testing Relationships) Kiểm nghiệm mối quan hệ giữa hai biến và kiểm nghiệm mối tương quan với cường độ tương quan và chiều của tương quan giữa các biến trong cơ sờ dữ liệu II. Một số khái niệm và thao tác trên SPSS: 1.1 1.Các khái niệm cơ bản: 1.2 Các cửa sổ trong SPSS: Data Editor: Cửa sổ này thể hiện nội dung của file dữ liệu. Bạn có thể lập một file dữ liệu mới hoặc hiệu chỉnh thay đổi một file đã có sẵn với cửa sổ Data Editor. Cửa sổ Data Editor tự động mở ra khi bạn kích hoạt/khởi động SPSS (không thể mở hơn một file dữ liệu vào cùng một thời điểm). Viewer: Mọi kết quả thống kê, bảng, biểu đồ được thể hiện trong cửa sổ Viewer. Bạn có thể hiệu đính kết xuất và lưu nó để sử dụng sau này. Draft Viewer: Bạn có thể trình bày kết xuất như là các văn bản bình thường (thay vì các bảng trụ) trong cửa sổ Draft Viewer. Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 7 Pivot Table Editor: Kết xuất được trình bày trong các bảng trụ có thể được chỉnh sửa bằng nhiều cách với cửa sổ Pivot Table Editor. Chart Editor. Bạn có thể chỉnh sửa các đồ thị chất lượng cao trong các cửa sổ chart editor. Bạn có thể thay đổi màu, chọn loại phông hoặc cỡ chữ, chuyển đổi trục tung với trục hoành, xoay các đồ thị ba chiều, và thậm chí thay cả loại đồ thị. Text Output Editor. Các kết xuất dạng văn bản không được thể hiện trong các bảng trụ có thể được chỉnh sửa với cửa sổ Text Output Editor. Bạn có thể hiệu đính kết xuất và thay các thuộc tính của phông chữ (dạng, loại, màu, cỡ). Syntax Editor. Bạn có thể dán các lựa chọn trong các hộp thoại vào một cửa sổ syntax, nơi mà các lựa chọn của bạn xuất hiện dưới dạng các cú pháp lệnh. Bạn có thể hiệu đính các cú pháp lệnh để tận dụng các đặc tính đặc biệt của SPSS không có sẵn trong các hộp thoại. Bạn cũng có thể lưu các mã lệnh này trong một file để sử dụng cho những công việc tiếp theo của SPSS. Script Editor. Kỹ thuật tự động OLE cho phép bạn tuỳ biến và tự động hoá nhiều nhiệm vụ trong SPSS. Sử dụng cửa sổ Script Editor để lập và hiệu đính các trình nhỏ cơ bản. 1.3 Hộp thoại (Dialogue box) Hầu hết các lựa chọn menu mở ra các hộp thoại. Bạn sử dụng hộp thoại để lựa chọn các biến và các tuỳ chọn cho phân tích Danh sách biến nguồn. Một danh sách các biến trong file dữ liệu làm việc. Chỉ có các loại biến được phép bởi các thủ tục được chọn mới được thể hiện trong danh sách nguồn. Việc ding các biến chuỗi dạng ngắn hay dài bị hạn chế bởi rất nhiều thủ tục. Danh sách (hoặc các danh sách) biến đích. Một hoặc một vài danh sách thể hiện các biến bạn vừa chọn cho phân tích, chẳng hạn như danh sách biến độc lập và phụ thuộc. Nút ấn điều khiển {Command pushbutton}. Các nút chỉ dẫn chương trình thực hiện một tác vụ, chẳng hạn như chạy một thủ tục, thể hiện phần thông tin Trợ giúp, hoặc mở ra một hộp thoại con để tiến hành các lựa chọn cụ thể bổ sung. Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 8 Để có được thông tin về các nút điều khiển trong một hộp thoại, nhắp chuột phải lên nút đó. Các bộ phận điều khiển hộp thoại Các nút trong hộp thoại Có 5 nút nhấn tiêu chuẩn trong hầu hết các hộp thoại: ƒ OK. Chạy thủ tục. Sau khi bạn chọn các biến nghiên cứu và chọn bất kỳ các tuỳ chọn bổ sung nào, nhắp OK để chạy thủ tục. Điều này cũng đồng thời đóng hộp thoại lại. ƒ Paste. Tạo cú pháp câu lệnh từ các lựa chọn trong hộp thoại và dán cú pháp vào một cửa sổ cú pháp. Sau đó bạn có tuỳ biến các câu lệnh với các đặc tính bổ sung không có sẵn trong hộp thoại. ƒ Reset. Bỏ chọn bất kỳ biến nào trong danh sách các biến được chọn và thiết lập mặc định cho mọi tuỳ chọn trong hộp thoại và bất kỳ hộp thoại phụ nào. ƒ Cancel. Xoá bỏ bất kỳ thay đổi nào trong thiết lập hộp thoại kể từ lần cuối nó được mở ra và đóng hộp thoại lại. Trong mỗi lần làm việc với SPSS các thiết lập trong hộp thoại là luôn tồn tại cho đến khi bạn thoát khỏi SPSS. Một hộp thoại duy trì mọi thiết lập mà bạn chọn cho đến khi bạn thiết lập lại. . ƒ Help. Núm này cho bạn cửa sổ trợ giúp dạng chuẩn của hãng Microsoft bao gồm các thông tin về hộp thoại hiện tại. Để có được thông tin về một biến trong một danh sách trong một hộp thoại  Nhắp chuột trái lên một biến trong một danh sách để chọn nó Các núm nhấn hộp thoại phụ Các núm nhấn câu lệnh Danh sách biến đích Danh sách biến nguồn Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 9  Nhắp chuột phải bất kể nơi nào trong danh sách  Chọn Variable Information trong menu pop-up Hình: Xem thông tin về biến dùng phím chuột phải Để nhận được thông tin về núm điều khiển trong hộp thoại  Nhắp chuột trái lên núm bạn muốn biết  Chọn What’s This? Trong menu pop-up. Một cửa sổ pop-up thể hiện thông tin về núm điều khiển. Hình : Trợ giúp dạng “What’s This?”pop-up bằng cách nhắp phím phải chuột 1.4 2. Thao tác trên SPSS: 1.5 2.1 Khởi động SPSS 1.6 Trên màn hình desktop của Widows nhắp vàop biểu tượng Hoặc mở phím Start, All programs, SPSS for WIndows, SPSS 12.0.1 for Windows Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 10 Sẽ xuất hiện cửa sổ SPSS Data Editor và một hộp thoại như sau: € Run the tutorial: Chạy chương trình trợ giúp € Type in data: Nhập dữ liệu mới € Run an existing query: Chạy một truy vấn dữ liệu đã có sẵn € Create new query using Database Wizard: Lập một truy vấn dữ liệu sử dụng Database Wizard € Open an existing data source: Mở file dữ liệu đã có sẵn (Chú ý: Hộp thoại này chỉ xuất hiện một lần khi bạn khởi động SPSS) 1.7 Mở một file ƒ Nếu đã có sẵn một file dữ liệu, bạn có thể mở nó bằng lựa chọn € Open an existing data source và nhăp vào More Files; ƒ Nếu đang ở trong cửa sổ SPSS Data Editor: Từ thanh menu chọn File -> Open -> Data…  Trong hộp thoại Open File, chọn file mà bạn muốn mở  Nhắp Open Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 11 Bên cạnh các file được lưu dưới định dạng của SPSS, bạn có thể mở các file có định dạng của Excel, Lotus, dBASE, tab-deliminated mà không cần phải chuyển đổi chúng sang một định dạng trung gian hoặc nhập các thông tin định nghĩa dữ liệu Để mở một tệp tin {file} Excel Tại cửa sổ SPSS Data Editor, từ thanh menu chọn File -> Open -> Data…  Trong hộp thoại Open File, chọn file mà bạn muốn mở  Nhắp Open  Trong hộp thoại Open File, chọn nnơi lưu giữ file (Look in); chọn loại file (Files of type) và sau đó chọn tên file (File name) Hộp thoại Opening Excel Data Source xuất hiện Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 12 Hãy chọn Worksheet mà bạn định mở (đối với file có nhiều hơn một worksheet). Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 13 2.2 Thao tác với cửa sổ Data Editor: Cửa sổ Data Editor cung cấp một phương pháp giống như bảng tính, thuận tiện để lập và hiệu đính các file dữ liệu. Cửa sổ Data Editor tự động mở khi bạn khởi động SPSS. Cửa sổ Data Editor cung cấp hai loại bảng xem dữ liệu: Data view. Thể hiện trị số dữ liệu thực hoặc các nhãn trị số được xác định Variable view. Thể hiện các thông tin định nghĩa về biến, bao gồm các nhãn biến và nhãn trị số biến được xác định. Trong cả hai bảng, bạn có thể bổ sung, và xoá các thông tin được lưu chứa trong file dữ liệu. 1.8 Data View Data view Sự khác biệt giữa Data View và Excel: ƒ Các hàng là các bản ghi/đối tượng/trường hợp. Từng hàng địa diện cho một đối tượng hoặc một quan sát. Ví dụ từng người trả lời đối với một bảng hỏi/phiếu điều tra là một đối tượng. ƒ Các cột là các biến. Từng cột đại diện cho một biến hoặc thuộc tính được đo đạc. Ví dụ từng mục trong một bảng hỏi là một biến. ƒ Các ô chứa các trị số. Từng ô chứa một trị số của một biến cho một đối tượng. Ô là sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến không chứa công thức. Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 14 ƒ File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số lượng các đối tượng và số lượng các biến. Variable View Cửa sổ Variable View Bảng Variable View chứa đựng các thông tin về các thuộc tính của từng biến trong file dữ liệu. Trong một bảng Data view: ƒ Các hàng là các biến. ƒ Các cột là các thuộc tính của biến Bạn có thể bổ sung hoặc xoá các biến và thay đổi thuộc tính của các biến, bao gồm: ƒ Tên biến {Name} ƒ Loại dữ liệu {Type} ƒ Số lượng con số hoặc chữ {With} ƒ Số lượng chữ số thập phân {Decimals} ƒ Mô tả biến/nhãn biến {Lable} và nhãn trị số biến {Values} ƒ Các trị số khuyết thiếu do người sử dụng thiết lập {Missing} ƒ Độ rộng của cột {Width} ƒ Căn lề {Align} ƒ Thang đo {Measure} Để thể hiện hoặc định nghĩa các thuộc tính của biến  Làm cho cửa sổ Data Editor trở thành cửa sổ hoạt động Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 15  Nhắp đúp một tên biến ở đỉnh của cột trong bảng Data View, hoặc nhắp bảng Variable View.  Để định nghĩa một biến mới, nhập một tên biến trong bất kỳ hàng rỗng nào  Chọn thuộc tính mà bạn muốn định nghĩa hoặc hiệu chỉnh. 1.8.1 Tên biến Các qui tắc dưới đây được áp dụng cho tên biến: ƒ Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $. ƒ Tên biến không được kết thúc bằng một dấu chấm. ƒ Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung đột với các biến được tự động lập bởi một vài thủ tục) ƒ Độ dài của tên biến không vượt quá 8 ký tự. ƒ Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng ƒ Tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp. Không được dùng chữ hoa đặt tên biến. Các tên NEWVAR, NewVar, và newvar được xem là giống nhau. 1.8.2 Các thang đo ƒ Bạn có thể xác định thang đo dưới dạng tỷ lệ (dữ liệu dạng số trên một thang đó khoảng hoặc thang đo tỷ lệ), thứ bậc hoặc định danh. Dữ liệu định danh hoặc thứ bậc có thể có dạng chuỗi (chữ a, b, c…) hoặc dạng số. 1.8.3 Loại biến Variable Type xác định loại dữ liệu đối với từng biến. Theo mặc định, mọi biến mới được giả sử là dạng số. Bạn sử dụng Define Variable để thay đổi loại dữ liệu. Nội dung của hộp thoại Variable Type phụ thuộc vào loại dữ liệu đã được thu thập. Đối với một số loại dữ liệu, có những ô cho độ rộng và số thập phân (Xem ví dụ Hình 5-4); đối với loại khác bạn chỉ đơn giản chọn một định dạng từ một danh sách cuốn (xem ví dụ hình 5.4b) các loại dữ liệu cho trước. Hộp thoại Variable Type Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu” 16 Để định nghĩa loại dữ liệu  Nhắp núm trong ô Type đối với biến bạn muốn định nghĩa  Chọn loại dữ liệu trong hộp thoại Data Type. 1.8.4 Nhãn biến (Variable Labels) Do tên biến chỉ có thể dài 8 ký tự, các nhãn biến có thể dài đến 256 ký tự, và những nhãn mô tả này được thể hiện trong các kết xuất. 1.8.5 Nhãn trị số của biến (Value Labels) Bạn có thể chỉ định các nhãn mô tả đối với từng trị số của biến. Điều này cực kỳ hữu ích nếu dữ liệu của bạn sử dụng các mã dạng số để đại diện cho các nhóm/tổ không phải dạng số (ví dụ mã 1 và 2 cho nam và nữ). Nhã trị số của biến có thể dài đến 60 ký tự. Nhãn trị số c