Trước sự phát triển như vũ bão của khoa học kỹ thuật, ngành điều khiển học và tự động hóa đã có những bước tiến lớn. Điều khiển học và tự động hóa ngày càng đóng vai trò quan trọng trong việc tăng năng xuất lao động, giảm giá thành, tăng sự ổn định chất lượng của sản phẩm. Thêm vào đó, môi trường làm việc được cải thiện đặt biệt trong một số ngành nghề có tính chất độc hại nguy hiểm cho tính mạng con người: dò bom mìn, thao tác trong các nhà máy điện hạt nhân hoặc các khu vực có độ phóng xạ cao, thám hiểm mặt trăng sao hỏa, thám hiểm đáy biển sâu
Trong xã hội công nghiệp ngày nay, việc ứng dụng các robot tự hành, các cánh tay máy, có khả năng hoạt động độc lập ngày càng phổ biến. Để có khả năng thông minh đó, chúng phải có khả năng nhìn, nhận dạng các tình huống, xử lý tình huống như như con người Đáp ứng nhu cầu đó, xử lý ảnh đã tham gia vào điều khiển học và tự động hóa. Dữ liệu về hình ảnh có lượng thông tin lớn và chính xác hơn các loại dữ liệu từ các cảm biến khác. Điều này giúp cho việc giải quyết các vấn đề trong lĩnh vực điều khiển tự động dễ dàng hơn.
Một trong những bài toán về xử lý ảnh phổ biến hiện nay là nhận dạng khuôn mặt người. Hơn một thập kỷ qua có rất nhiều công trình nghiên cứu về bài toán nhận dạng khuôn mặt người từ ảnh đen trắng, xám đến ảnh màu như ngày hôm nay. Các nghiên cứu đi từ bài toán đơn giản, mỗi ảnh chỉ có một khuôn mặt người nhìn thẳng vào thiết bị thu hình và đầu ở tư thế thẳng đứng trong ảnh đen trắng. Cho đến ngày hôm nay bài toán mở rộng cho ảnh màu, có nhiều khuôn mặt trong cùng một ảnh, có nhiều tư thế thay đổi trong ảnh. Không những vậy mà còn mở rộng cả phạm vi từ môi trường xung quanh khá đơn giản (trong phòng thí nghiệm) cho đến môi trường xung quanh rất phức tạp (như trong tự nhiên) nhằm đáp ứng nhu cầu thật sự và rất nhiều của con người.
Góp phần tìm hiểu về vấn đề này tôi thực hiện đề tài “Nhận dạng mặt người bằng ICA” trên tập ảnh tĩnh, đơn gồm các ảnh mặt người với độ sáng tối và góc chụp khác nhau.
Xin chân thành cảm ơn các thầy cô đã truyền đạt cho tôi những kiến thức quý báu trong thời gian qua; đặc biệt thầy Phạm Thành Danh, người đã tận tình giúp đỡ, hướng dẫn tôi trong quá trình thực hiện đề tài này.
Do thời gian và kiến thức còn nhiều hạn chế đề tài còn nhiều thiếu sót, kính mong quý thầy cô đóng góp ý kiến để đề tài hoàn thiện hơn.
4 trang |
Chia sẻ: ngtr9097 | Lượt xem: 3529 | Lượt tải: 5
Bạn đang xem nội dung tài liệu Đồ án Nhận dạng mặt người dùng ICA, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Tên đề tài luận văn:NHẬN DẠNG MẶT NGƯỜI DÙNG SVM VÀ MẠNG NƠRONHọc viên thực hiện:NGUYỄN THÀNH THÁI lớp Cao học khóa 1 , mã số : CH0301064Giảng viên hướng dẫn:TS LÊ HOÀNG THÁI, Đại học Khoa học Tự nhiên tp HCM1. Mục tiêu và ý nghĩa của đề tài:
Đề tài tập trung nghiên cứu hai phương pháp phân lớp ảnh SVM và mạng Nơron và áp dụng cho bài toán nhận dạng mặt người. Từ đó đưa ra một ứng dụng thực tế là xác định một đối tượng có phải là học sinh của trường THPT Nguyễn Hữu Cầu hay không, để minh họa cho tính khả thi của hai phương pháp nêu trên.2. Vấn đề giải quyết trong luận văn:
Dùng hai phương pháp SVM và mạng Nơron để xác định một đối tượng có phải là học sinh của trường THPT Nguyễn Hữu Cầu hay không.3. Cách thức giải quyết:
Đối với phương pháp SVM: gồm hai giai đoạn là huấn luyện và nhận dạng
Giai đoạn huấn luyện :Các ảnh mẫu được véc tơ hóa x={x1, . .,x900} rồi dùng phương pháp PCA để rút trích đặc trưng thành véc tơ y={y1, . .,y100} rồi đưa vào bộ huấn luyện SVM .
Giai đoạn nhận dạng: Mẫu cần nhận dạng được cũng được véc tơ hóa và rút trích như trên sau đó đưa vào bộ nhận dạng SVM để xác định lớp cho mẫu . Tuy nhiên SVM là phương pháp phân lớp rất nhanh nhưng SVM có thể phân một đối tượng nhầm lớp nên tôi đề nghị dùng thêm phương pháp mạng Nơron để so sánh.
Đối với phương pháp mạng Nơron:gồm hai giai đoạn là huấn luyện và nhận dạng như sau :
Giai đoạn huấn luyện: Tập mẫu huấn luyện được véc tơ hóa dùng phương pháp chia lưới để tính trung bình mức xám của cửa sổ con kích thước 4x4, như vây với ảnh mẫu kích thước 100x100 sẽ được biến đổi thành véc tơ kích thước là {x1, …,x625} , các véc tơ này làm đầu vào cho bộ huấn luyện mạng Nơron. Mỗi đối tượng sẽ được huấn luyện với các tư thế khuôn mặt như nhìn thẳng, sang trái 300 và sang phải 300 trong một mạng Nơron riêng rẽ tạm gọi là chủ nhân của mạng này với ngõ ra mong muốn của đối tương chủ nhân là 1, các đối tượng không phải chủ nhân sẽ có ngõ ra là 0. Đây là đề xuất của tôi trong luận văn này và tạm gọi là mô hình liên kết các mạng nơron để chứng thực từng đối tượng. Mô hình này đã cải tiến được yếu điểm của SVM.
Giai đoạn nhận dạng: Ảnh cần nhận dạng cũng được véc tơ hóa như giai đoạn huấn luyện và là đầu vào của từng mạng nơron để xác định chủ nhân của mạng. Nếu không xác định được thì hệ thống thông báo là đối tượng này không có trong cơ sở dữ liệu
4. Các đóng góp chính của tác giả luận văn:
Luận văn đã đạt được các kết quả sau :
Tìm hiểu phương pháp phân lớp SVM và các ưu khuyết điểm của nó cho bài toán nhận dạng.
Tìm hiểu phương pháp phân lớp mạng Nơron, từ đó đề xuất một mô hình liên kết các mạng Nơron để chứng thực từng đối tượng.
Ứng dụng mô hình đề xuất vào hệ thống xác minh một đối tượng có phải là học sinh của trường THPT Nguyễn Hữu Cầu hay không.Kết quả đạt được cho thấy tính khả thi của mô hình đề xuất .5. Các cài đặt hoặc thực nghiệm đã tiến hành có liên quan đến đề tài:
Cài đặt chưong trình thử nghiệm phương pháp SVM và chạy thử nghiệm từ 10 đến 22 lớp học sinh (mỗi lớp khoảng 3 mẫu thẳng, sang trái, sang phải)
Cài đặt chương trình thử nghiệm với phương pháp mạng Nơron và cũng chạy thử từ 10 đến 22 lớp để so sánh kết quả .
6. Tài liệu tham khảo:
[1] Lê Hoàng Thái (2004) “Xây dựng, phát triển, ứng dụng một số mô hình kết hợp giữa mạng nơron (NN), logic mờ (FL) và thuật giải di truyền (GA)”, Luận án tiến sĩ toán học, ĐH KHTN TPHCM. Phụ lục C,D trang 1-17
[2] Lê Hoàng Thái, Lê Minh Trí, Nguyễn Thúy Hằng (6/2006)”Đề xuất phương pháp trích chọn đặc trưng mới cho bài toán nhận dạng mặt người”, Hội thảo Công nghệ thông tin quốc gia lần thứ IX, Đà lạt, 15-17/6/2006 , trang 2-5
[3] Lê Minh Trí, Nguyễn Thúy Hằng (2006) “Phương pháp trích chọn đặc trưng cho nhận dạng mặt người và ứng dụng”,Luận văn tốt nghiệp cử nhân CNTT, ĐH KHTN TPHCM., trang 10-16
[4]Lu Boun Vinh,Hoàng Phương Anh (2004) ,”Nghiên cứu và xây dựng hệ thống nhận dạng mặt người dưa trên FSVM và Adaboost”, Luận văn tốt nghiệp cử nhân CNTT, ĐH KHTN TPHCM.
[5]Đỗ Tấn Việt , Lê Đình Huy (2006),”Xây dựng hệ thống tự động thống kê mật độ xe ô tô bằng tính toán thông minh”, Luận văn tố nghiệp cử nhân CNTT, ĐH KHTN TPHCM.
[6]Ngô Quốc Tạo, Ngô Phương Đông, Nguyễn Thanh Hòa, Phạm Việt Bình (2003), Báo cáo “Nhận dạng mặt người trong môi trường độ sáng không đồng nhất”, Hội thảo Công nghệ thông tin quốc gia lần thứ VIII, Thái Nguyên, 29-31/8/2003.
[7] Burce A. Draper, Kyungim Baek, Marian Stewart Bartlett, J. Ross Beveridge,”Recognizing Faces with PCA and ICA”.
[8] Christopher J.C. Burges (1998),” A tutorial on Support Vector Machines for Pattern Recognition”.Data Mining and Knowledge Discovery.
[9] Chih-Wei Hsu, Chih-Chung Chang, and Chih-jen Lin, “A Practical Guide to Support Vector Classification”, Department of Computer Science and Information Engineering National Taiwan University Taipei 106 Taiwan.
[10]Stan Z. Li , Anil K. Jain (12/2006) ,”Handbook of Face Recognition”.
[11]IEEE Computer Society, 17-19/5/2004,”Automatic face and gesture recognition”.
[12] Wenyi Zhao, Arvindh Krishnaswamy, Rama Chellappa, Danie L.Swets, John Weng, “Discriminant Analysis of Principal Components for Face Recognition”, Centrer for Automation Research, University of Maryland (page 73) of Face Recognition from Theory and Applications.
[13] Massimo Tistaelli và Enrico Grosso, “Active Vision-base Face Recognition: Issues”, Application and Techniques, University of Genoa, Department of Communication, Computer and System Science (DIST), Computer Vision Laboratory, Via Opera Pia 13-16145 Genoa, Italy (page 262) of Face Recognition from Theory and Applications.
[14] Jeffrey Huang, Chengjun Liu, và Harry Wechsler, “Eye Detection and Face Recognition Using Evolutionary Computation”, Department of Computer Science, George Mason University, (page 348) of Face Recognition from Theory and Applications.
[15] Daniel Bgraham và Nigel M Allinson, “Characterising Virtual Eigensignatures for General Purpose Face Recognition”, Image Engineering and Neural Computing Group, Department of Electrical Engineering and Electronics, University of Manchester Institute of Science and Technology. Manchester M60 1QD, UK (page 446) of Face Recognition from Theory and Applications.