Thế kỷ XXI với những thay đổi to lớn mở đầu cho một kỷ nguyên mới- kỷ nguyên của một nền kinh tế tri thức, một xã hội thông tin. Chính vì thế, giáo dục đào tạo được coi là yếu tố quyết định thúc đẩy đất nước đi nhanh vào nền kinh tế tri thức - một xu hướng phát triển mới của thế giới.
Hiện nay, nhiều hình thức kiểm tra được áp dụng từ kiểm tra miệng, kiểm tra vấn đáp, kiểm tra viết, kiểm tra trắc nghiệm, bài tập lớn, tiểu luận, luận văn. Trong đó hình thức kiểm tra trắc nghiệm khách quan đang được sử dụng rất rộng rãi do những nguyên nhân sau :
• Có thể tiến hành kiểm tra đánh giá trên diện rộng trong một khoảng thời gian ngắn.
• Chấm bài nhanh, chính xác và khách quan.
• Bài kiểm tra có rất nhiều câu hỏi nên có thể kiểm tra được một cách hệ thống và toàn diện kiến thức và kĩ năng của thí sinh, tránh được tình trạng học tủ, dạy tủ.
• Sự phân phối điểm trải trên một phổ rất rộng nên có thể phân biệt được rõ ràng các trình độ của thí sinh.
Tháng 06/2007, Bộ Giáo dục và Đào tạo đã chính thức chuyển một số môn thi của các kỳ thi cấp Quốc gia như thi tốt nghiệp Trung học phổ thông và thi tuyển sinh vào các trường Cao đẳng, Đại học từ hình thức tự luận sang trắc nghiệm. Tuy nhiên, việc áp dụng các phương tiện kỹ thuật hiện đại cũng gây ra nhiều khó khăn, thách thức. Đối với thí sinh, không những phải tô đậm, chính xác điểm cần tô mà còn phải giữ giấy thi phẳng, ngay ngắn và sạch sẽ. Chỉ một vài thay đổi nhỏ như giấy bị nhàu nát cũng có thể gây ra sự không chính xác trong việc đánh giá kết quả. Bên cạnh đó, các hệ thống tự động chấm thi trắc nghiệm chủ yếu được nhập từ nước ngoài với giá thành rất cao, có cấu trúc cồng kềnh nên việc di chuyển kém linh hoạt và gặp nhiều khó khăn. Hơn nữa, các máy chấm tự động chỉ được sử dụng trong các kỳ thi lớn. Còn ở các kỳ thi nhỏ hơn như thi học kỳ, các bài kiểm tra 1 tiết ở các cấp bậc khác như phổ thông thì đa số vẫn dùng hình thức chấm bằng tay hoặc dùng bằng bìa đục lỗ; nếu chấm bài với một số lượng lớn thì người chấm sẽ tốn nhiều thời gian, dễ xảy ra nhầm lẫn sai sót.
Trước thực tiễn đó, tôi đã quyết định chọn đề tài: “Xây dựng hệ thống chấm điểm trắc nghiệm sử dụng camera” với yêu cầu đặt ra là cấu trúc phần cứng nhỏ gọn, xử lý nhanh, chi phí thấp mà vẫn có khả năng đạt được hiệu quảnhư mong muốn. Hệ thống này phảicó khả năng ứng dụng cao trong các kỳ thi ở mọi cấp bậc, kỳ thi tuyển sinh đại học, các kỳ thi tiếng Anh quốc tế, giảm thiểu đáng kể những chi phí không cần thiết cho việc chấm thi thủ công hoặc sử dụng những thiết bị được nhập về như hiện nay.
68 trang |
Chia sẻ: tuandn | Lượt xem: 2572 | Lượt tải: 4
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng hệ thống chấm điểm trắc nghiệm sử dụng camera, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------
TRẦN NGUYỄN MINH TOÀN
XÂY DỰNG HỆ THỐNG CHẤM ĐIỂM
TRẮC NGHIỆM SỬ DỤNG CAMERA
Chuyên ngành: Kỹ thuật truyền thông
LUẬN VĂN THẠC SĨ KỸ THUẬT
Người hướng dẫn: PGS. TS. Nguyễn Tiến Dũng
Hà Nội, 5-2013
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác.
Tác giả
Trần Nguyễn Minh Toàn
MỤC LỤC
DANH SÁCH HÌNH VẼ
Hình 1.1 Các dạng mẫu điểm ảnh 20
Hình 1.2 Quá trình lượng tử hóa 20
Hình 1.3 Khuông lượng tử theo L mức xám 21
Hình 1.4 Lấy mẫu và lượng tử hóa 21
Hình 1.5 Kéo dãn độ tương phản 22
Hình 1.6 Tách nhiễu và phân ngưỡng 23
Hình 1.7 Lấy ngưỡng 23
Hình 1.8 Ảnh trước và sau bộ lọc Median 28
Hình 1.9 Phép điền đầy 30
Hình 1.10 Phép ăn mòn 30
Hình 1.11 Phép mở 30
Hình 1.12 Phép đóng 31
Hình 1.13 Mặt nạ 8 hướng theo 34
Hình 2.1 Sơ đồ khối hệ thống chấm thi trắc nghiệm 37
Hình 2.2 Tổ chức thư viện OpenCV 39
Hình 2.3 Lưu đồ thuật toán tìm phiếu thi 41
Hình 2.4 Thực hiện phép biến đổi phối cảnh để chuẩn hóa phiếu thi 42
Hình 2.5 Lưu đồ thuật toán tìm các vùng thông tin trên phiếu thi 43
Hình 2.6 Đặc điểm của các vùng chứa thông tin trên phiếu thi 45
Hình 2.7 Lưu đồ thuật toán nhận dạng thông tin 46
Hình 2.8 Xác định nội dung thông tin vùng số báo danh và mã đề 47
Hình 2.9 Xác định nội dung thông tin vùng trả lời 47
Hình 3.1 Giao diện chính của chương trình 49
Hình 3.2 Giao diện module quản lý kỳ thi 50
Hình 3.3 Các chức năng thêm, sửa, xóa kỳ thi 50
Hình 3.4 Các chức năng thêm, sửa, xóa môn thi 50
Hình 3.5 Chức năng thêm đề thi 51
Hình 3.6 Chức năng sửa đề thi - đáp án 51
Hình 3.7 Cấu trúc file kythi.xml 52
Hình 3.8 Giao diện module “Chấm điểm từ file” 52
Hình 3.9 Giao diện hiển thị các bài thi không nhận dạng được 53
Hình 3.10 Cấu trúc file excel 53
Hình 3.11 Ứng dụng IP WebCam 54
Hình 3.12 Cấu trúc file config.xml 54
Hình 3.13 Giao diện module chấm điểm trực tiếp từ camera 55
Hình 3.14 Mẫu không nhận dạng được vùng phiếu thi 58
Hình 3.15 Ảnh gốc và ảnh nhị phân 58
Hình 3.16 Biên và 4 góc của phiếu thi 59
Hình 3.17 Ảnh đầu ra của thuật tìm phiếu thi 59
Hình 3.18 Ảnh phiếu thi sau khi chuyển mức xám và lọc nhiễu 60
Hình 3.19 Ảnh phiếu thi sau khi tăng độ sáng 60
Hình 3.20 Ảnh phiếu thi sau khi thực hiện phép mở 61
Hình 3.21 Các vùng chứa thông tin trên phiếu thi 61
Hình 3.22 Vùng số báo danh và vùng mã đề 62
Hình 3.23 Các vùng trả lời 62
Hình 3.24 Kết quả nhận dạng thông tin vùng số báo danh 63
Hình 3.25 Kết quả nhận dạng thông tin vùng mã đề 63
Hình 3.26 Kết quả nhận dạng thông tin vùng trả lời 64
Hình 3.27 Kết quả chấm thi trên các mẫu đã chuẩn bị 65
DANH SÁCH CÁC BẢNG BIỂU
Bảng 3.1 Dữ liệu bài thi 57
DANH SÁCH TỪ VIẾT TẮT
OMR
Optical Mark Recognition
ADF
Automatic Document Feeder
PTLTN
Phiếu trả lời trắc nghiệm
CCD
Charge Coupled Device
CSDL
Cơ sở dữ liệu
CV
Computer vision
MỞ ĐẦU
1. Thực tiễn của đề tài
Thế kỷ XXI với những thay đổi to lớn mở đầu cho một kỷ nguyên mới- kỷ nguyên của một nền kinh tế tri thức, một xã hội thông tin. Chính vì thế, giáo dục đào tạo được coi là yếu tố quyết định thúc đẩy đất nước đi nhanh vào nền kinh tế tri thức - một xu hướng phát triển mới của thế giới.
Hiện nay, nhiều hình thức kiểm tra được áp dụng từ kiểm tra miệng, kiểm tra vấn đáp, kiểm tra viết, kiểm tra trắc nghiệm, bài tập lớn, tiểu luận, luận văn... Trong đó hình thức kiểm tra trắc nghiệm khách quan đang được sử dụng rất rộng rãi do những nguyên nhân sau :
Có thể tiến hành kiểm tra đánh giá trên diện rộng trong một khoảng thời gian ngắn.
Chấm bài nhanh, chính xác và khách quan.
Bài kiểm tra có rất nhiều câu hỏi nên có thể kiểm tra được một cách hệ thống và toàn diện kiến thức và kĩ năng của thí sinh, tránh được tình trạng học tủ, dạy tủ.
Sự phân phối điểm trải trên một phổ rất rộng nên có thể phân biệt được rõ ràng các trình độ của thí sinh.
Tháng 06/2007, Bộ Giáo dục và Đào tạo đã chính thức chuyển một số môn thi của các kỳ thi cấp Quốc gia như thi tốt nghiệp Trung học phổ thông và thi tuyển sinh vào các trường Cao đẳng, Đại học từ hình thức tự luận sang trắc nghiệm. Tuy nhiên, việc áp dụng các phương tiện kỹ thuật hiện đại cũng gây ra nhiều khó khăn, thách thức. Đối với thí sinh, không những phải tô đậm, chính xác điểm cần tô mà còn phải giữ giấy thi phẳng, ngay ngắn và sạch sẽ. Chỉ một vài thay đổi nhỏ như giấy bị nhàu nát cũng có thể gây ra sự không chính xác trong việc đánh giá kết quả. Bên cạnh đó, các hệ thống tự động chấm thi trắc nghiệm chủ yếu được nhập từ nước ngoài với giá thành rất cao, có cấu trúc cồng kềnh nên việc di chuyển kém linh hoạt và gặp nhiều khó khăn. Hơn nữa, các máy chấm tự động chỉ được sử dụng trong các kỳ thi lớn. Còn ở các kỳ thi nhỏ hơn như thi học kỳ, các bài kiểm tra 1 tiết ở các cấp bậc khác như phổ thông thì đa số vẫn dùng hình thức chấm bằng tay hoặc dùng bằng bìa đục lỗ; nếu chấm bài với một số lượng lớn thì người chấm sẽ tốn nhiều thời gian, dễ xảy ra nhầm lẫn sai sót.
Trước thực tiễn đó, tôi đã quyết định chọn đề tài: “Xây dựng hệ thống chấm điểm trắc nghiệm sử dụng camera” với yêu cầu đặt ra là cấu trúc phần cứng nhỏ gọn, xử lý nhanh, chi phí thấp mà vẫn có khả năng đạt được hiệu quảnhư mong muốn. Hệ thống này phảicó khả năng ứng dụng cao trong các kỳ thi ở mọi cấp bậc, kỳ thi tuyển sinh đại học, các kỳ thi tiếng Anh quốc tế, giảm thiểu đáng kể những chi phí không cần thiết cho việc chấm thi thủ công hoặc sử dụng những thiết bị được nhập về như hiện nay.
2. Những hệ thống chấm thi trắc nghiệm trên giấy hiện nay
2.1 Máy OMR
Máy chấm thi trắc nghiệm chuyên dụng, hay còn gọi là Optical Mark Recognition (OMR) Machine là một loại máy được thiết kế ra để chấm điểm thi trắc nghiệm một cách nhanh và chính xác. Máy OMR thường được sử dụng để đánh giá kết quả thi thông qua hình thức trắc nghiệm với số lượng lớn.
Phương thức mà máy OMR dùng để nhận dạng và xác định nội dung của phiếu thi là sử dụng hàng loạt cảm biến để nhận dạng vùng tô bằng chì của sinh viên (ô tròn được quy định tô bằng bút chì 2B trở lên. Thường thì cảm biến này là cảm biến hồng ngoại loại phản chiếu, dựa trên tính chất phản xạ hay hấp thụ ánh sáng của vật thể. Tuỳ theo mức độ phản xạ của vật thể mà chùm tia phản xạ có thể mạnh hay yếu, từ đó xác định được vùng nào là phần thí sinh tô đen, phần nào là phần nền giấy thi. Ưu điểm của loại máy này là tính ổn định, độ chính xác, độ tin cậy cao. Tuy nhiên lại có nhiều nhược điểm:
Giá thành cao, thường chỉ được sử dụng ở những tổ chức giáo dục lớn
Giấy làm bài thi trắc nghiệm phải là giấy trắng tiêu chuẩn.
Bài thi trắc nghiệm phải làm trên mẫu giấy thống nhất, tuân thủ nghiêm ngặt những quy định khi in ấn
Tính ổn định và độ chính xác cao của hệ thống làm cho máy OMR có được độ tin cậy cao và thường được sử dụng ở những tổ chức giáo dục và đánh giá lớn. Nhưng những tính năng này cũng tạo nên giá thành cao của hệ thống và cản trở việc phổ biến máy OMR trên thị trường. Không những giá thành của chúng rất đắt mà chi phí vận hành phải đi đôi với việc tiêu thụ rất nhiều giấy chuyên dụng. Do đó, những tổ chức giáo dục vừa và nhỏ, những trường học muốn tổ chức những kỳ thi trắc nghiệm riêng của họ để tiến hành đánh giá học sinh, sinh viên định kỳ lại không đủ chi phí mua cũng như duy trì những chiếc máy như thế này.
2.2 Phần mềm OMR
Trong khi những chiếc máy OMR làm chủ công nghệ và thị trường phục vụ nhu cầu đánh giá kỳ thi trắc nghiệm thì vẫn tồn tại những nhu cầu về một thiết bị nhỏ gọn hơn mà thỏa mãn được những yêu cầu về độ ổn định và độ chính xác cao.
Phần mềm OMR được phát triển nhanh chóng nhằm lấp đầy những nhu cầu trên. Sự ra đời của phần mềm OMR kết hợp với máy scan thực sự đã là một giải pháp thay thế cho việc chấm thi trắc nghiệm tự động. Đây là một giải pháp phần mềm, để thực hiện chấm thi được cần phải kết hợp với một hệ thống máy tính và máy scan.
Máy scan là một loại thiết bị văn phòng phổ biến và sẵn có với đa dạng chủng loại cùng giá thành trên thị trường. Có hai loại máy scan cơ bản mà chúng ta cần chú ý khi kết hợp với phần mềm OMR.
Máy scan ép phẳng (flatbed scanner) dùng để quét những tài liệu nhỏ lẻ hoặc những mẫu đơn rời. Nhược điểm của loại máy scan này là người sử dụng phải thao tác bằng tay khi họ muốn scan tài liệu. Điều này đồng nghĩa với tính tự động và tốc độ của hệ thống chấm thi sử dụng máy scan ép phẳng sẽ rất thấp.
Máy scan tời giấy tự động (automatic document feeder – ADF) là dòng máy scan chuyên nghiệp hơn. Máy ADF có thêm khay tời giấy tự động có thể đựng đuợc 50 tới 200 tờ giấy và scan lần lượt theo thời gian định sẵn. Khi kết hợp ADF với phần mềm OMR sẽ tạo nên một hệ thống chấm thi khá khả quan. Tuy nhiên giá thành cho cả hệ thống bao gồm phần mềm OMR, máy tính, và máy scan ADF rất đắt. Chính vì vậy nên rất nhiều trường trung học phổ thông, đại học và các tổ chức giáo dục vừa và nhỏ đã không chọn phần mềm OMR kết hợp với máy scan làm công cụ chấm thi trắc nghiệm tự động.
3. Mục tiêu và nội dung thực hiện của đề tài
Với những hạn chế của các loại máy chấm trắc nghiệm trên, mục tiêu của đề tài “Xây dựng hệ thống chấm điểm trắc nghiệm sử dụng camera” là đề xuất xây dựng hệ thống chấm điểm trắc nghiệm khắc phục được những hạn chế nói trên:
Tốc độ lấy mẫu thông qua máy tời giấy nhanh, tính tự động cao, giá thành rẻ.
Thuật toán xử lý, nhận dạng nội dung phiếu thi phải nhanh,đảm bảo được độ chính xác, tin cậy cao. Thuật toán này phải nhận dạng được cả các phiếu thi in trên các loại giấy thông dụng, yêu cầu về độ chính xác khi in ấn không cần quá cao.
Do hạn chế về mặt thời gian nên đề tài này tập trung giải quyết các vấn đề sau:
Thực hiện giao tiếp giữa máy tính và camera, hiển thị hình ảnh ghi được từ camera lên máy tính
Nghiên cứu, đề xuất hệ thống, thuật toán nhận dạng vùng ảnhvà xử lý thông tin của phiếu thi
Thiết kế, xây dựng dữ liệu quản lý tham số bài thi phục vụ công tác chuẩn bị trước khi chấm thi và lưu trữ thông tin sau khi chấm thi
Dựa trên các nội dung đó, luận văn này được chia thành 3 chương với các nội dụng chính như sau:
Chương 1: Cơ sở lý thuyết
Giới thiệu tổng quan các khái niệm cơ bản về ảnh số, các thuật toán xử lý ảnh số sẽ áp dụng để thực hiện đề tài.
Chương 2: Phân tích và thiết kế hệ thống chấm thi trắc nghiệm bằng camera
Đề xuất và thiết kế hệ thống chấm thi trắc nghiệm bằng camera. Phân tích thuật toán chấm thi trắc nghiệm đã đề xuất.
Chương 3: Đánh giá kết quả thực hiện
Thực nghiệm và đánh giá kết quả đạt được với thuật toán đã đề xuất bằng phần mềm được lập trình theo thiết kế ở chương 2.
4. Kết quả đạt được
Bằng phương pháp thực nghiệm, phần mềm chấm điểm trắc nghiệm bằng camera đã hoàn thành và đáp ứng các các yêu cầu đặt ra:
Module quản lý kỳ thi nhỏ, gọn, trực quan.
Hiển thị hình ảnh từ camera và chấm điểm.
Chấm điểm với nhiều file ảnh phiếu thi chụp từ trước.
Thực nghiệm cho thấy thuật toán đã đề ra đạt độ chính xác 100% với các mẫu phiếu thi đã chuẩn bị, thời gian chấm thi nhanh.
Để có thể thực hiện và hoàn thành đề tài này, tôi xin được chân thành cảm ơn PGS.TS. Nguyễn Tiến Dũng đã tận tình hướng dẫn và giúp đỡ trong suốt quá trình thực hiện đề tài.
Mặc dù đã cố gắng và nỗ lực hết mình để hoàn thành luận văn, song chắc chắn không thể tránh khỏi những sai sót và hạn chế. Vì vậy, tôi rất mong sẽ nhận được sự đóng góp ý kiến để đề tài này được hoàn thiện hơn. Xin chân thành cảm ơn.
Học viên
TRẦN NGUYỄN MINH TOÀN
CƠ SỞ LÝ THUYẾT
Những khái niệm cơ bản về ảnh số
Pixel
Một bức ảnh hay một bức tranh ta nhìn thấy bằng mắt thường là một sự liên tục về không gian cũng như độ sáng. Khi kỹ thuật số được ứng dụng vào lĩnh vực nhiếp ảnh, rất nhiều khái niệm mới đã được ra đời.
Kỹ thuật số là một kỹ thuật xử lý rời rạc trên máy tính, kỹ thuật này chỉ áp dụng đối với các bit (các con số), chính về vậy các bức ảnh liên tục về không gian và độ sáng cần phải được “số hóa”. Số hoá ảnh thực chất là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm rời rạc phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữa chúng. Chính vì vậy, khi chúng ta nhìn một bức tranh là tập hợp của rất nhiều điểm rời rạc, chúng ta sẽ có cảm giác đó là một bức ảnh liên tục. Mỗi một điểm như vậy gọi là một điểm ảnh (Picture Element hay gọi tắt là pixel). Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật.
Độ xám
Mỗi một điểm ảnh sẽ được đặc trưng bởi hai tham số chính về không gian và độ xám. Trong khuôn khổ ảnh hai chiều, tham số không gian được xác định bởi tọa độ Descartes (x,y) của điểm ảnh đó. Tham số độ xám được xác định là giá trị cường độ sáng tại điểm đó. Máy tính thường sử dụng đơn vị byte (8bit) để biểu diễn giá trị số. Chính vì vậy, giá trị lớn nhất của độ xám thường được sử dụng rộng rãi nhất là 28 = 256 tương đương với việc cường độ sáng của các điểm sẽ nằm trong dải từ 0 đến 255, khi đó, máy tính sẽ dùng 8bit = 1byte để biểu diễn giá trị cường độ sáng. Ngoài ra, còn có các giá trị cường độ sáng lớn nhất khác: 16, 32, 64, 128,…
Thông thường, ta sẽ làm quen với 3 loại ảnh sau dựa vào cấu trúc cũng như độ xám điểm ảnh:
Ảnh màu: là ảnh mà màu của các điểm ảnh được tạo nên bởi sự pha trộn 3 màu cơ bản (hệ màu RBG: Red Blue Green) với các tỉ lệ cường độ sáng khác nhau. Với mỗi một màu cơ bản, người ta sẽ sử dụng một byte để biểu diễn cường độ sáng, chính vì vậy cần 3byte (24bit) để biểu diễn một điểm ảnh. Khi đó giá trị màu sẽ nhận giá trị từ 0 cho đến 224 (vào khoảng ≈16,7 triệu màu).
Ảnh đen trắng (ảnh xám): là ảnh mà mỗi điểm ảnh chỉ có hai màu đen, trắng (không chứa màu khác) với cường độ sáng (mức xám) ở các điểm ảnh có thể sử dụng nhiều bit để biểu diễn các giá trị khác nhau.
Ảnh nhị phân: là ảnh chỉ có hai màu đen, trắng (không chứa màu khác) với cường độ sáng chỉ có 2 giá trị duy nhất 0 và 255. Người ta dùng duy nhất 2 bit để biểu diễn độ xám, bit “1” tương ứng điểm ảnh đen (0), bit “0” tương ứng điểm ảnh trắng (255).
Nhiễu ảnh
Trước khi xem xét chi tiết các kỹ thuật xử lý ảnh cơ bản, chúng ta cần phân biệt các loại nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại nhiễu, tuy nhiên người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:
Nhiễu cộng
Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:
Xqs = Xgốc + η
Nhiễu nhân
Nhiễu nhân cũng thường phân bố khắp ảnh. Nếu gọi ảnh quan sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:
Xqs = Xgốc * η
Nhiễu xung
Khác với nhiễu nhân và nhiễu cộng, nhiễu xung thường chỉ gây đột biến tại một số điểm ảnh. Nhiễu xung là một loại nhiễu khá đặc biệt có thể sinh ra bởi nhiều lý do khác nhau chẳng hạn: lỗi truyền tín hiệu, lỗi bộ nhớ, hay lỗi định thời trong quá trình lượng tử hóa.
Những kỹ thuật xử lý ảnh cơ bản
Lấy mẫu và lượng tử hóa
Lấy mẫu
Lấy mẫu (sampling) là một quá trình, qua đó ảnh được tạo nên trên một vùng có tính liên tục được chuyển thành các giá trị rời rạc theo tọa độ nguyên. Quá trình này gồm 2 lựa chọn:
Một là: khoảng lấy mẫu.
Hai là: cách thể hiện dạng mẫu.
Lựa chọn thứ nhất được đảm bảo nhờ lý thuyết lấy mẫu của Shannon. Lựa chọn thứ hai liên quan đến độ đo (Metric) được dùng trong miền rời rạc.
Khoảng lấy mẫu (Sampling Interval)
Ảnh lấy mẫu có thể được mô tả như việc lựa chọn một tập các vị trí lấy mẫu trong không gian hai chiều liên tục. Đầu tiên mô tả qua quá trình lấy mẫu một chiều với việc sử dụng hàm
δx-x0= 0 khi &x # 0∞ khi&x=0
-∞∞δx-x0dx=x0-x0+δx-x0dx=1
Tiếp theo chúng ta định nghĩa hàm răng lược với các khoảng Δx như sau:
Combx=r=-∞∞δx-r∆x
với r là số nguyên, Δx : khoảng lấy mẫu
Như vậy, hàm răng lược là chuỗi các xung răng lược từ (-∞ đến +∞). Giả sử hàm một chiều g(x) được mô tả (gần đúng) bằng g(r Δx ) tức là:
g( x ) ≈ g ( r Δ x )
Khi đó tín hiệu lấy mẫu được mô hình hoá
gsx=gxCombx=g(x)r=-∞∞δx-r∆x
hoặc tương đương
gsx=r=-∞∞g(r∆x)δx-r∆x
Trong thực tế, r không thể tính được trong khoảng vô hạn (từ − ∞ đến +∞) mà là một số lượng NΔx mẫu lớn cụ thể. Như vậy, để đơn giản có thể nói hàm liên tục g(x) có thể biểu diễn trên một miền với độ dài NΔx mẫu thành chuỗi như sau:
g(x) ≈ {g(0), g(Δx), g(2Δx),..., g((N −1)Δx) }
Chú ý 1: Khoảng lấy mẫu (Sampling Interval) Δx là một tham số cần phải được chọn đủ nhỏ, thích hợp, nếu không tín hiệu thật không thể khôi phục lại được từ tín hiệu lấy mẫu.
Chú ý 2: Từ lý thuyết về xử lý tín hiệu số [1], (2-6) là tích chập trong miền không gian x.Mặt khác, phương trình trên tương đương với tích chập trong miền tần số ω tức là biến đổi Fourier của gs(x) là
Gsωx=1∆xk=-∞∞G(ωx-k∆x)
Trong đó ωx là giá trị tần số ứng với giá trị x trong miền không gian.
Điều kiện khôi phục ảnh lấy mẫu về ảnh thật được phát biểu từ định lý lẫy mẫu của Shannon.
Định lý lấy mẫu của Shannon[2]
Giả sử g(x) là một hàm giới hạn dải (Band Limited Function) và biến đổi Fourier của nó là G(ωx) = 0 đối với các giá trị ωx>Wx. Khi đó g(x) có thể được khôi phục lại từ các mẫu được tạo tại các khoảng Δx đều đặn. Tức là:
∆x ≤12ωx
Định lý lẫy mẫu của Shannon có thể mở rộng cho không gian hai chiều. Hàm răng lược hai chiều khi đó được xác định:
Combx,y=n=-∞∞m=-∞∞δx-n∆xy-m∆y
Hàm lấy mẫu hai chiều thu được:
gsx,y=gx,yCombx,y=g(x,y)n=-∞∞m=-∞∞(x-n∆x,y-m∆y)
và Δx, Δy được chọn thoả mãn các điều kiện tương ứng theo định lý lấy mẫu của Shannon khi đó:
∆x ≤12ωx
∆y ≤12ωy
Tương tự như không gian một chiều, một tín hiệu ảnh hai chiều g(x,y) có thể xấp xỉ trong khoảng [N, M] có thể được ước lượng như sau :
g(x,y)≈g(n∆x,m∆y)
={g(0,0),g(0,1),…,g(0,M-1),g(1,0),g(1,1),…,g(1,M-1,),g(N-1,M-1)}
Các dạng lấy mẫu (Tesselation)
Dạng lẫy mẫu (Tesselation) điểm ảnh là cách bài trí các điểm mẫu trong không gian hai chiều. Một số dạng mẫu điểm ảnh được cho là dạng chữ nhật, tam giác, lục giác. Mỗi một mẫu, ngoài việc thể hiện hình dáng còn cho biết đặc điểm liên thông của chúng. Ví dụ, mẫu chữ nhật có liên thông 4 hoặc 8 (nói về các mẫu liền kề); mẫu lục giác có liên thông 6; mẫu tam giác có liên thông 3 hoặc 6.
Hình 1.1 Các dạng mẫu điểm ảnh
Lượng tử hóa
Lượng tử hoá (quantization) là một quá trình lượng hoá tín hiệu thật dùng chung cho các loại xử lý tín hiệu trên cơ sở máy tính. Vấn đề này đã được nghiên cứu kỹ lưỡng và có nhiều lời giải lý thuyết dưới nhiều giả định của các nhà nghiên cứu như Panter và Dite (1951), Max (1960), Panter (1965).
Các giá trị lấy mẫu Z là một tập các số thực từ giá trị Zminđến lớn nhất Zmax. Mỗi một số trong các giá trị mẫu Z cần phải biến đổi thành một tập hữu hạn số bit để máy tính lưu trữ hoặc xử lý.
Hình 1.2 Quá trình lượng tử hóa
Định nghĩa: Lượng tử hoá là ánh xạ từ các số thực mô tả giá trị lấy mẫu thành một giải hữu hạn các số thực. Nói cách khác, đó là quá trình số hoá biên độ.
Hình 1.3 Khuông lượng tử theo L mức xám
Giả sử Z là một giá trị lấy mẫu (số thực) tại vị trí nào đó của mặt phẳng ảnh, và Zmin<=Z’<=Zmaxvà giả sử chúng ta muốn lượng hoá giá trị đó thành một trong các mức rời rạc: l1, l2,…ln tương ứng với Zmin đến Zmax (hình 1.3). Khi đó, quá trình lượng hoá có thể thực hiện bằng cách chia toàn bộ miền vào (Zmax - Zmin) thành L khoảng, mỗi khoảng là Δl và khoảng thứ i được đặt tại điểm giữa các khoảng liền kề li. họ các giá trị z được thực hiện và mô tả bằng li theo quá trình trên đây, khi đó sai số của quá trình lấy mẫu có thể được xác định theo:
eq=li – Z
Hình 1.4 Lấy mẫu và lượng tử hóa
Xứ lý và nâng cao chất lượng ảnh
Nâng cao chất lượng ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh. Mục đích chính là nhằm làm nổi bật một số đặc