Phân tích phương sai là một dạng mở rộng của phương pháp kiểm nghiệm t hai mẫu
ngẫu nhiên độc lập (Independent-Samples T Test), và được sử dụng để kiểm nghiệm
cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các
trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi
nhóm. Với giả thuyết ban đầu H0cho rằng các giá trị trung bình này là bằng nhau
44 trang |
Chia sẻ: lvbuiluyen | Lượt xem: 2094 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Ban tổ chức các hoạt động hỗ trợ nghiên cứu khoa học sinh viên 2011, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
***
BAN TỔ CHỨC CÁC HOẠT ĐỘNG
HỖ TRỢ NGHIÊN CỨU KHOA HỌC SINH VIÊN 2011
TÀI LIỆU THAM KHẢO
Chuyên đề 1: “Kỹ năng xử lý và phân tích số liệu”
LƯU HÀNH NỘI BỘ
TP.HCM – T3/2011
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
2
MỤC LỤC
A.KHÁI QUÁT VỀ QUI TRÌNH NGHIÊN CỨU–XỬ LÝ THÔNG TIN 3
I. Qui trình của một cuộc nghiên cứu ......................................................... 3
II. Xử lý thông tin trong nghiên cứu ........................................................... 3
III. Qui trình xử lý số liệu ............................................................................3
B. GIỚI THIỆU VỀ PHẦN MỀM SPSS VÀ THAO TÁC CƠ BẢN ........5
I. Khái quát về SPSS .................................................................................. 5
II. Một số khái niệm và thao tác trên SPSS ............................................... 6
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
3
A. KHÁI QUÁT VỀ QUI TRÌNH
NGHIÊN CỨU – XỬ LÝ THÔNG TIN
I. Qui trình của một cuộc nghiên cứu
Thông thường một qui trình nghiên cứu bao gồm 8 bước:
- Bước 1: Xác định vấn đề cần nghiên cứu
- Bước 2: Xác định loại thông tin cần thu thập và nguồn cung cấp thông tin
- Bước 3: Chọn mẫu nghiên cứu
- Bước 4: Thiết kế nghiên cứu và xác định phương pháp thu thập thông tin.
- Bước 5: Thiết kế bảng câu hỏi
- Bước 6: Thu thập dữ liệu
- Bước 7: Xử lý, phân tích và diễn giải các dữ liệu đã được xử lý
- Bước 8: Trình bày và báo cáo kết quả
II. Xử lý thông tin trong nghiên cứu
Có hai dạng thông tin nghiên cứu cần thu thập:
- Thông tin thứ cấp là những thông tin đã hiện hữu trên các nguồn tài liệu đã được
đăng tải, được tổ chức thành bảng biểu, đồ thị. Loại thông tin này người nghiên cứu
chỉ việc sử dụng và diễn giải theo nhu cầu nghiên cứu của mình mà không cần quá
trình xử lý đòi hỏi sự hỗ trợ của các phần mềm phân tích chuyên dụng.
- Thông tin sơ cấp là thông tin chưa hiện hữu, muốn có thông tin này đòi hỏi các nhà
nghiên cứu phải thực hiện một qui trình nghiên cứu với nhiều bước. Trong nghiên cứu
thu thập thông tin sơ cấp tồn tại hai dạng nghiên cứu chính yếu nghiên cứu định tính
và nghiên cứu định lượng. Nhiệm vụ tổng quát của việc xử lý – phân tích dữ liệu là
chuyển những mẫu dữ liệu quan sát thô mà ta đã tiến hành mã hóa và kiểm tra thành
những con số thống kê có ý nghĩa cho việc diễn giải kết quả nghiên cứu. Toàn bộ
công việc xử lý – phân tích phức tạp này đòi hỏi cần phải có máy tính và các phần
mềm chuyên dụng hỗ trợ.
III. Qui trình xử lý số liệu
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
4
Việc xử lý dữ liệu bắt đầu từ khi ta nhận được bảng câu hỏi đã được phỏng vấn, bao gồm
các bước sau:
- Bước 1: Kiểm tra, hiệu chỉnh các trả lời trên bảng câu hỏi
- Bước 2: Mã hóa các câu trả lời trên bảng câu hỏi
- Bước 3: Nhập dữ liệu đã được mã hóa vào máy tính
- Bước 4: Xác định các lỗi trong cơ sở dữ liệu và làm sạch dữ liệu
- Bước 5: Tạo bảng cho dữ liệu và tiến hành các phân tích thống kê
Hai giai đoạn đầu tiên là những bước chuẩn bị cho việc phân tích bằng máy tính sau này.
Giai đoạn 3 là nhập các dữ liệu đã được mã hóa vào máy tính. Quá trình nhập liệu này
có thể dẫn đến những sai xót do đó một bước kế tiếp phải được thực hiện trước khi tiến
hành phân tích dữ liệu là phải làm sạch dữ liệu đã được nhập vào trong máy.
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
5
B. GIỚI THIỆU VỀ PHẦN MỀM SPSS
VÀ THAO TÁC CƠ BẢN
I. Khái quát về SPSS: SPSS (viết tắt của Statistical Package for the Social Sciences) là
một chương trình máy tính phục vụ cơng tác thống kê. SPSS được sử dụng rộng rãi trong
cơng tác thống kê xã hội.
1.Khái quát về phân tích dữ liệu
2. Khái niệm về phân tích dữ liệu
2.1 Kiểm tra dữ liệu (Data Screening)
2.2 Thống kê mô tả (Descriptive Statistics)
2.3 Kiểm nghiệm các so sánh trung bình mẫu (Tests for Comparing Means)
Trong phân tích thống kê người ta thường sử dụng các phép kiểm nghiệm kiểm nghiệm
các giả thuyết về giá trị trung bình của các biến định lượng, và thống kê cung cấp cho ta
các công cụ như kiểm nghiệm t (T-Test) hay kiểm nghiệm Z (Z-test)
Kiểm nghiệm t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập
Ta có ba dạng kiểm nghiệm t cho việc so sánh các giá trị trung bình của mẫu. Việc sử
dụng dạng nào tùy thuộc vào vấn đề ta đang tiến hành so sánh vấn đề gì
- Sử dụng kiểm nghiệm t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T
Test) là phương pháp nhằm mục đích kiểm nghiệm so sánh giá trị trung bình của
một biến riêng biệt theo một nhóm có khác biệt hay không đối với giá trị trung
bình của biến riêng biệt đó theo một nhóm khác. Với giả thuyết ban đầu H0 cho
rằng giá trị trung bình của hai nhóm này là bằng nhau. Ví dụ ta kiểm nghiệm thu
nhập trung bình (biến thu nhập) theo hai nhóm giới tinh là nam và giới tính là nữ
(biến giới tính sử dụng để chia các giá trị quan sát trong biến thu nhập thành hai
nhóm)
- Công cụ kiểm nghiệm t cho cặp mẫu (Paired-Samples T Test) được sử dụng để
kiểm nghiệm có hay không giá trị trung bình của các khác biệt giữa các cặp quan
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
6
sát là khác giá trị 0. Với giả thuyết ban đầu H0 cho rằng giá trị trung bình các
khác biệt này là bằng 0. Ví dụ như kiểm nghiệm sự khác biệt về điểm thi môn
học của hai nhóm sinh viên có tham gia và không có tham gia chương trình phụ
đạo ngoài giờ.
- Công cụ kiểm nghiệm t một mẫu (One-Sample T Test) để kiểm nghiệm có hay
không giá trị trung bình của một biến là khác biệt với một giá trị giả định từ trước.
Với giả thuyết ban đầu H0 cho rằng giá trị trung bình kiểm nghiệm là bằng với giá
trị giả thuyết đưa ra
Phân tích phương sai một chiều (One-Way ANOVA)
Phân tích phương sai là một dạng mở rộng của phương pháp kiểm nghiệm t hai mẫu
ngẫu nhiên độc lập (Independent-Samples T Test), và được sử dụng để kiểm nghiệm
cho nhiều hơn hai nhóm. Phương pháp phân tích này khảo sát sự biến thiên giữa các
trung bình mẫu trong mối liên hệ với sự phân táng của các quan sát trong từng mỗi
nhóm. Với giả thuyết ban đầu H0 cho rằng các giá trị trung bình này là bằng nhau.
2.4 Kiểm nghiệm các mối quan hệ (Testing Relationships)
Kiểm nghiệm mối quan hệ giữa hai biến và kiểm nghiệm mối tương quan với cường độ
tương quan và chiều của tương quan giữa các biến trong cơ sờ dữ liệu
II. Một số khái niệm và thao tác trên SPSS:
1.1 1.Các khái niệm cơ bản:
1.2 Các cửa sổ trong SPSS:
Data Editor: Cửa sổ này thể hiện nội dung của file dữ liệu. Bạn có thể lập một file
dữ liệu mới hoặc hiệu chỉnh thay đổi một file đã có sẵn với cửa sổ Data Editor. Cửa
sổ Data Editor tự động mở ra khi bạn kích hoạt/khởi động SPSS (không thể mở hơn
một file dữ liệu vào cùng một thời điểm).
Viewer: Mọi kết quả thống kê, bảng, biểu đồ được thể hiện trong cửa sổ Viewer.
Bạn có thể hiệu đính kết xuất và lưu nó để sử dụng sau này.
Draft Viewer: Bạn có thể trình bày kết xuất như là các văn bản bình thường (thay vì
các bảng trụ) trong cửa sổ Draft Viewer.
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
7
Pivot Table Editor: Kết xuất được trình bày trong các bảng trụ có thể được chỉnh sửa
bằng nhiều cách với cửa sổ Pivot Table Editor.
Chart Editor. Bạn có thể chỉnh sửa các đồ thị chất lượng cao trong các cửa sổ chart
editor. Bạn có thể thay đổi màu, chọn loại phông hoặc cỡ chữ, chuyển đổi trục tung
với trục hoành, xoay các đồ thị ba chiều, và thậm chí thay cả loại đồ thị.
Text Output Editor. Các kết xuất dạng văn bản không được thể hiện trong các bảng
trụ có thể được chỉnh sửa với cửa sổ Text Output Editor. Bạn có thể hiệu đính kết
xuất và thay các thuộc tính của phông chữ (dạng, loại, màu, cỡ).
Syntax Editor. Bạn có thể dán các lựa chọn trong các hộp thoại vào một cửa sổ
syntax, nơi mà các lựa chọn của bạn xuất hiện dưới dạng các cú pháp lệnh. Bạn có
thể hiệu đính các cú pháp lệnh để tận dụng các đặc tính đặc biệt của SPSS không có
sẵn trong các hộp thoại. Bạn cũng có thể lưu các mã lệnh này trong một file để sử
dụng cho những công việc tiếp theo của SPSS.
Script Editor. Kỹ thuật tự động OLE cho phép bạn tuỳ biến và tự động hoá nhiều
nhiệm vụ trong SPSS. Sử dụng cửa sổ Script Editor để lập và hiệu đính các trình nhỏ
cơ bản.
1.3 Hộp thoại (Dialogue box)
Hầu hết các lựa chọn menu mở ra các hộp thoại. Bạn sử dụng hộp thoại để lựa chọn
các biến và các tuỳ chọn cho phân tích
Danh sách biến nguồn. Một danh sách các biến trong file dữ liệu làm việc. Chỉ có
các loại biến được phép bởi các thủ tục được chọn mới được thể hiện trong danh sách
nguồn. Việc ding các biến chuỗi dạng ngắn hay dài bị hạn chế bởi rất nhiều thủ tục.
Danh sách (hoặc các danh sách) biến đích. Một hoặc một vài danh sách thể hiện
các biến bạn vừa chọn cho phân tích, chẳng hạn như danh sách biến độc lập và phụ
thuộc.
Nút ấn điều khiển {Command pushbutton}. Các nút chỉ dẫn chương trình thực hiện
một tác vụ, chẳng hạn như chạy một thủ tục, thể hiện phần thông tin Trợ giúp, hoặc
mở ra một hộp thoại con để tiến hành các lựa chọn cụ thể bổ sung.
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
8
Để có được thông tin về các nút điều khiển trong một hộp thoại, nhắp chuột phải lên
nút đó.
Các bộ phận điều khiển hộp thoại
Các nút trong hộp thoại
Có 5 nút nhấn tiêu chuẩn trong hầu hết các hộp thoại:
OK. Chạy thủ tục. Sau khi bạn chọn các biến nghiên cứu và chọn bất kỳ các tuỳ
chọn bổ sung nào, nhắp OK để chạy thủ tục. Điều này cũng đồng thời đóng hộp
thoại lại.
Paste. Tạo cú pháp câu lệnh từ các lựa chọn trong hộp thoại và dán cú pháp vào
một cửa sổ cú pháp. Sau đó bạn có tuỳ biến các câu lệnh với các đặc tính bổ sung
không có sẵn trong hộp thoại.
Reset. Bỏ chọn bất kỳ biến nào trong danh sách các biến được chọn và thiết lập
mặc định cho mọi tuỳ chọn trong hộp thoại và bất kỳ hộp thoại phụ nào.
Cancel. Xoá bỏ bất kỳ thay đổi nào trong thiết lập hộp thoại kể từ lần cuối nó
được mở ra và đóng hộp thoại lại. Trong mỗi lần làm việc với SPSS các thiết lập
trong hộp thoại là luôn tồn tại cho đến khi bạn thoát khỏi SPSS. Một hộp thoại
duy trì mọi thiết lập mà bạn chọn cho đến khi bạn thiết lập lại. .
Help. Núm này cho bạn cửa sổ trợ giúp dạng chuẩn của hãng Microsoft bao gồm
các thông tin về hộp thoại hiện tại.
Để có được thông tin về một biến trong một danh sách trong một hộp thoại
Nhắp chuột trái lên một biến trong một danh sách để chọn nó
Các núm
nhấn hộp
thoại phụ
Các núm
nhấn câu
lệnh
Danh sách
biến đích Danh sách biến
nguồn
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
9
Nhắp chuột phải bất kể nơi nào trong danh sách
Chọn Variable Information trong menu pop-up
Hình: Xem thông tin về biến dùng phím chuột phải
Để nhận được thông tin về núm điều khiển trong hộp thoại
Nhắp chuột trái lên núm bạn muốn biết
Chọn What’s This? Trong menu pop-up.
Một cửa sổ pop-up thể hiện thông tin về núm điều khiển.
Hình : Trợ giúp dạng “What’s This?”pop-up bằng cách nhắp phím phải chuột
1.4 2. Thao tác trên SPSS:
1.5 2.1 Khởi động SPSS
1.6 Trên màn hình desktop của Widows nhắp vàop biểu tượng
Hoặc mở phím Start, All programs, SPSS for WIndows, SPSS
12.0.1 for Windows
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
10
Sẽ xuất hiện cửa sổ SPSS Data Editor
và một hộp thoại như sau:
Run the tutorial: Chạy chương trình trợ
giúp
Type in data: Nhập dữ liệu mới
Run an existing query: Chạy một truy
vấn dữ liệu đã có sẵn
Create new query using Database
Wizard: Lập một truy vấn dữ liệu sử dụng
Database Wizard
Open an existing data source: Mở file
dữ liệu đã có sẵn
(Chú ý: Hộp thoại này chỉ xuất hiện một lần khi bạn khởi động SPSS)
1.7 Mở một file
Nếu đã có sẵn một file dữ liệu, bạn có thể mở nó bằng lựa chọn Open an
existing data source và nhăp vào More Files;
Nếu đang ở trong cửa sổ SPSS Data Editor:
Từ thanh menu chọn
File -> Open -> Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
11
Bên cạnh các file được lưu dưới định dạng của SPSS, bạn có thể mở các file có định
dạng của Excel, Lotus, dBASE, tab-deliminated mà không cần phải chuyển đổi
chúng sang một định dạng trung gian hoặc nhập các thông tin định nghĩa dữ liệu
Để mở một tệp tin {file} Excel
Tại cửa sổ SPSS Data Editor, từ thanh menu chọn
File -> Open -> Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Trong hộp thoại Open File, chọn nnơi lưu giữ file (Look in); chọn loại file (Files
of type) và sau đó chọn tên file (File name)
Hộp thoại Opening Excel Data Source xuất hiện
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
12
Hãy chọn Worksheet mà
bạn định mở (đối với file có
nhiều hơn một worksheet).
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
13
2.2 Thao tác với cửa sổ Data Editor:
Cửa sổ Data Editor cung cấp một phương pháp giống như bảng tính, thuận tiện để lập
và hiệu đính các file dữ liệu. Cửa sổ Data Editor tự động mở khi bạn khởi động SPSS.
Cửa sổ Data Editor cung cấp hai loại bảng xem dữ liệu:
Data view. Thể hiện trị số dữ liệu thực hoặc các nhãn trị số được xác định
Variable view. Thể hiện các thông tin định nghĩa về biến, bao gồm các nhãn biến và
nhãn trị số biến được xác định. Trong cả hai bảng, bạn có thể bổ sung, và xoá các thông
tin được lưu chứa trong file dữ liệu.
1.8 Data View
Data view
Sự khác biệt giữa Data View và Excel:
Các hàng là các bản ghi/đối tượng/trường hợp. Từng hàng địa diện cho một đối
tượng hoặc một quan sát. Ví dụ từng người trả lời đối với một bảng hỏi/phiếu điều
tra là một đối tượng.
Các cột là các biến. Từng cột đại diện cho một biến hoặc thuộc tính được đo đạc. Ví
dụ từng mục trong một bảng hỏi là một biến.
Các ô chứa các trị số. Từng ô chứa một trị số của một biến cho một đối tượng. Ô là
sự kết hợp của đối tượng và biến. Các ô chỉ chứa các trị số biến không chứa công
thức.
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
14
File dữ liệu có hình chữ nhật. Hai hướng của file dữ liệu được xác định bởi số lượng
các đối tượng và số lượng các biến. Variable View
Cửa sổ Variable View
Bảng Variable View chứa đựng các thông tin về các thuộc tính của từng biến trong file
dữ liệu. Trong một bảng Data view:
Các hàng là các biến.
Các cột là các thuộc tính của biến
Bạn có thể bổ sung hoặc xoá các biến và thay đổi thuộc tính của các biến, bao gồm:
Tên biến {Name}
Loại dữ liệu {Type}
Số lượng con số hoặc chữ {With}
Số lượng chữ số thập phân {Decimals}
Mô tả biến/nhãn biến {Lable} và nhãn trị số biến {Values}
Các trị số khuyết thiếu do người sử dụng thiết lập {Missing}
Độ rộng của cột {Width}
Căn lề {Align}
Thang đo {Measure}
Để thể hiện hoặc định nghĩa các thuộc tính của biến
Làm cho cửa sổ Data Editor trở thành cửa sổ hoạt động
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
15
Nhắp đúp một tên biến ở đỉnh của cột trong bảng Data View, hoặc nhắp bảng
Variable View.
Để định nghĩa một biến mới, nhập một tên biến trong bất kỳ hàng rỗng nào
Chọn thuộc tính mà bạn muốn định nghĩa hoặc hiệu chỉnh.
1.8.1 Tên biến
Các qui tắc dưới đây được áp dụng cho tên biến:
Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ chữ nào, bất kỳ
số nào, hoặc các biểu tượng như @, #, _, hoặc $.
Tên biến không được kết thúc bằng một dấu chấm.
Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần (để tránh xung đột
với các biến được tự động lập bởi một vài thủ tục)
Độ dài của tên biến không vượt quá 8 ký tự.
Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được sử dụng
Tên biến phải đơn chiếc/duy nhất; không được phép trùng lặp. Không được dùng
chữ hoa đặt tên biến. Các tên NEWVAR, NewVar, và newvar được xem là giống
nhau.
1.8.2 Các thang đo
Bạn có thể xác định thang đo dưới dạng tỷ lệ (dữ liệu dạng số trên một thang đó
khoảng hoặc thang đo tỷ lệ), thứ bậc hoặc định danh. Dữ liệu định danh hoặc thứ
bậc có thể có dạng chuỗi (chữ a, b, c…) hoặc dạng số.
1.8.3 Loại biến
Variable Type xác định loại dữ liệu đối với từng biến. Theo mặc định, mọi biến mới
được giả sử là dạng số. Bạn sử dụng Define Variable để thay đổi loại dữ liệu. Nội dung
của hộp thoại Variable Type phụ thuộc vào loại dữ liệu đã được thu thập. Đối với một
số loại dữ liệu, có những ô cho độ rộng và số thập phân (Xem ví dụ Hình 5-4); đối với
loại khác bạn chỉ đơn giản chọn một định dạng từ một danh sách cuốn (xem ví dụ hình
5.4b) các loại dữ liệu cho trước.
Hộp thoại Variable Type
Chuyên đề bổ trợ NCKH: “Kỹ năng xử lý và phân tích số liệu”
16
Để định nghĩa loại dữ liệu
Nhắp núm trong ô Type đối với biến bạn muốn định nghĩa
Chọn loại dữ liệu trong hộp thoại Data Type.
1.8.4 Nhãn biến (Variable Labels)
Do tên biến chỉ có thể dài 8 ký tự, các nhãn biến có thể dài đến 256 ký tự, và những
nhãn mô tả này được thể hiện trong các kết xuất.
1.8.5 Nhãn trị số của biến (Value Labels)
Bạn có thể chỉ định các nhãn mô tả đối với từng trị số của biến. Điều này cực kỳ hữu
ích nếu dữ liệu của bạn sử dụng các mã dạng số để đại diện cho các nhóm/tổ không
phải dạng số (ví dụ mã 1 và 2 cho nam và nữ). Nhã trị số của biến có thể dài đến 60 ký
tự. Nhãn trị số c