Báo cáo Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân

Nghiên cứu này trình bày phương pháp mới cho nhận dạng khuôn mặt dựa vào mẫu nhị phân cục bộ (LBP). Mẫu nhị phân cục bộ xem xét các điểm xung quanh điểm trung tâm trong vùng nhị phân cục bộ để tính toán các đặc trưng và đặc điểm riêng biệt trên khuôn mặt, nhưng bị ảnh hưởng bởi nhiễu, độ lệch và điều kiện ánh sáng. Trong nghiên cứu này, đề xuất phương pháp mẫu nhị phân bền vững (RLBP) nhằm mở rộng, xem xét nhiều điểm ảnh khác nhau để tính vector đặc trưng, đồng thời xét thêm điểm trung tâm so với trung bình các điểm trong vùng cục bộ. Nhờ việc giảm cường độ điểm ảnh và xem xét giá trị điểm trung tâm nên phương pháp được đề xuất loại bỏ nhiễu tốt, không bị ảnh hưởng bởi điều kiện ánh sáng. Phương pháp đề xuất được thử nghiệm trên hai bộ dữ liệu: ORL [1], YaleB [2]. Qua thực nghiệm cho thấy, phương pháp đề xuất trong đề tài này đạt độ đo chính xác tốt hơn các phương pháp khác.

pdf80 trang | Chia sẻ: Trịnh Thiết | Ngày: 05/04/2024 | Lượt xem: 67 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Báo cáo Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN --------------------------- Lê Bùi Phương An Nguyễn Lê Huy Phất KỸ THUẬT ĐỊNH DANH KHUÔN MẶT DỰA VÀO MẪU NHỊ PHÂN BÁO CÁO NGHIÊN CỨU KHOA HỌC Ngành: Khoa học máy tính TP. HỒ CHÍ MINH, tháng 5 năm 2021 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN --------------------------- VÕ ANH TIẾN KỸ THUẬT ĐỊNG DANH KHUÔN MẶT DỰA VÀO MẪU NHỊ PHÂN BÁO CÁO NGHIÊN CỨU KHOA HỌC Ngành: Khoa học máy tính CÁN BỘ HƯỚNG DẪN KHOA HỌC: TS. VĂN THIÊN HOÀNG TP. HỒ CHÍ MINH, tháng 5 năm 2021 CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC QUỐC TẾ SÀI GÒN Giảng viên hướng dẫn khoa học: ThS. Võ Anh Tiến (Ghi rõ họ, tên, học hàm, học vị và chữ ký) Đề tài được bảo vệ tại t r ư ờ n g Đại học Quốc tế Sài Gòn ngày tháng năm Thành phần Hội đồng đánh giá đề tài gồm: TT Họ và tên Chức danh Hội đồng 1 Chủ tịch 2 Phản biện 1 3 Phản biện 2 4 Ủy viên 5 Ủy viên, Thư ký Xác nhận của Chủ tịch Hội đồng đánh giá đề tài sau khi đề tài đã được sửa chữa (nếu có). Chủ tịch Hội đồng đánh giá đề tài TRƯỜNG ĐH QUỐC TẾ SÀI GÒN KHOA CÔNG NGHỆ THÔNG TIN CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập – Tự do – Hạnh phúc TP. HCM, ngày.. tháng.. năm 20.. NHIỆM VỤ ĐỀ TÀI Họ tên học viên: Giới tính: Ngày, tháng, năm sinh: Nơi sinh: Ngành: Khoa học máy tính MSSV: I- Tên đề tài: Kỹ thuật định danh khuôn mặt dựa vào mẫu nhị phân. ................................................................................................................................................. ................................................................................................................................................. II- Nhiệm vụ và nội dung: Nhiệm vụ tổng quát của đề tài là: Đề xuất được phương pháp mới để định danh khuôn mặt dựa vào mẫu nhị phân, trên cơ sở nghiên cứu các hướng tiếp cận mẫu nhị phân liên quan nhằm đạt độ chính xác nhận dạng khuôn mặt cao (so với phương pháp của Kra'l và các đồng sự). III- Ngày giao nhiệm vụ: IV- Ngày hoàn thành nhiệm vụ: V- Giảng viên hướng dẫn: ThS. Võ Anh Tiến ................................................................................................................................................. ................................................................................................................................................. GIẢNG VIÊN HƯỚNG DẪN KHOA QUẢN LÝ (Họ tên và chữ ký) (Họ tên và chữ ký) i LỜI CAM ĐOAN Chúng tôi xin cam đoan đây là công trình nghiên cứu của riêng chúng tôi. Các số liệu, kết quả nêu trong đề tài là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Chúng tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện đề tài này đã được cảm ơn và các thông tin trích dẫn trong đề tài đã được chỉ rõ nguồn gốc. Sinh viên thực hiện ii LỜI CẢM ƠN Để hoàn thành đề tài này, chúng em xin tỏ lòng biết ơn sâu sắc nhất đến ThS. Võ Anh Tiến, người đã tận tình hướng dẫn trong suốt quá trình viết luận văn. Tôi cũng xin chân thành cảm ơn quý Thầy, Cô trong khoa Công nghệ thông tin, trường Đại học Quốc tế Sài Gòn đã tận tình truyền đạt kiến thức. Với vốn kiến thức được tiếp thu trong quá trình học không chỉ là nền tảng cho quá trình nghiên cứu mà còn là hành trang quý báu để chúng em có thể bước vào đời một cách vững chắc và tự tin. Cuối cùng, tôi xin kính chúc quý Thầy, Cô dồi dào sức khỏe và thành công trong sự nghiệp, đạt được nhiều thành công tốt đẹp trong công việc và cuộc sống. Sinh viên thực hiện iii TÓM TẮT Nghiên cứu này trình bày phương pháp mới cho nhận dạng khuôn mặt dựa vào mẫu nhị phân cục bộ (LBP). Mẫu nhị phân cục bộ xem xét các điểm xung quanh điểm trung tâm trong vùng nhị phân cục bộ để tính toán các đặc trưng và đặc điểm riêng biệt trên khuôn mặt, nhưng bị ảnh hưởng bởi nhiễu, độ lệch và điều kiện ánh sáng. Trong nghiên cứu này, đề xuất phương pháp mẫu nhị phân bền vững (RLBP) nhằm mở rộng, xem xét nhiều điểm ảnh khác nhau để tính vector đặc trưng, đồng thời xét thêm điểm trung tâm so với trung bình các điểm trong vùng cục bộ. Nhờ việc giảm cường độ điểm ảnh và xem xét giá trị điểm trung tâm nên phương pháp được đề xuất loại bỏ nhiễu tốt, không bị ảnh hưởng bởi điều kiện ánh sáng. Phương pháp đề xuất được thử nghiệm trên hai bộ dữ liệu: ORL [1], YaleB [2]. Qua thực nghiệm cho thấy, phương pháp đề xuất trong đề tài này đạt độ đo chính xác tốt hơn các phương pháp khác. iv ABSTRACT This paper presents a new method for face recognition based on local binary pattern (LBP). Local binary samples look at points around the central point in the binary locality to calculate specific facial features and characteristics, but are affected by noise, deviation, and light conditions. In this study, a robust binary sample (RLBP) model was proposed to expand, considering various pixels for vector specificity, while adding a central point to the average of points in the lump area. By reducing the pixel intensity and considering the center point value, the proposed method eliminates interference, which is not affected by lighting conditions. The proposed method was tested on three sets of data: ORL [1], YaleB [2]. Experimental results show that the method proposed in this thesis has better accuracy than other methods. v MỤC LỤC LỜI CAM ĐOAN .......................................................................................................... i LỜI CẢM ƠN ...............................................................................................................ii TÓM TẮT .................................................................................................................. iii ABSTRACT ................................................................................................................ iv MỤC LỤC ................................................................................................................... v DANH MỤC TỪ VIẾT TẮT VÀ TỪ KHÓA ...........................................................viii DANH MỤC BẢNG .................................................................................................... x DANH MỤC HÌNH VẼ .............................................................................................. xi CHƯƠNG 1. TỔNG QUAN .................................................................................... 1 1.1 Giới thiệu ........................................................................................................ 1 1.2 Hệ thống nhận dạng khuôn mặt ....................................................................... 5 1.3 Mục tiêu của đề tài .......................................................................................... 7 1.4 Bố cục luận văn ............................................................................................... 7 CHƯƠNG 2. CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN ........................... 9 2.1 Các hướng tiếp cận rút trích đặc trưng mặt người ............................................ 9 2.1.1 Hướng tiếp cận biểu diễn đặc trưng không gian ........................................ 9 2.1.2 Biểu diễn đặc trưng dựa vào không gian – thời gian ................................ 16 2.1.3 Hướng tiếp cận rút trích đặc trưng dựa vào giảm chiều ........................... 22 2.2 Các hướng tiếp cận liên quan đến phương pháp nghiên cứu của đề tài ........... 24 2.2.1 Đặc trưng mẫu nhị phân cục bộ ............................................................... 24 vi 2.2.2 Đặc trưng mẫu nhị phân bất biến ............................................................ 27 2.2.3 Đặc trưng mẫu nhị phân cải tiến.............................................................. 28 2.2.4 Đặc trưng mẫu tam phân cục bộ .............................................................. 29 2.2.5 Đặc trưng mẫu nhị phân cục bộ chuẩn hóa .............................................. 30 2.2.6 Đặc trưng mẫu nhị phân tăng cường ....................................................... 30 2.3 Kết luận ......................................................................................................... 32 CHƯƠNG 3. PHƯƠNG PHÁP RÚT TRÍCH ĐẶC TRƯNG ĐỀ XUẤT ............... 33 3.1 Ý tưởng thuật toán ......................................................................................... 33 3.2 Ví dụ minh họa .............................................................................................. 36 3.3 Kết luận ......................................................................................................... 37 CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM ............................................................ 38 4.1 Môi trường và cơ sở dữ liệu thực nghiệm ...................................................... 38 4.2 Kết quả thực nghiệm trên cơ sở dữ liệu ORL ................................................. 38 4.2.1 Thống kê vét lân cận cạn......................................................................... 40 4.2.2 Thống kê vét lân cận sâu ......................................................................... 44 4.2.3 Phương pháp thống kê ............................................................................ 45 4.2.4 Nhận xét ................................................................................................. 45 4.3 Kết quả thực nghiệm trên cơ sở dữ liệu yaleB ............................................... 46 4.3.1 Thống kê lân cận cạn .............................................................................. 48 4.3.2 Thống kê lân cận sâu .............................................................................. 51 4.3.3 Phương pháp thống kê ............................................................................ 52 4.3.4 Nhận xét ................................................................................................. 53 vii 4.4 Thời gian thực hiện ....................................................................................... 53 CHƯƠNG 5. KẾT LUẬN...................................................................................... 55 5.1 Kết quả làm được .......................................................................................... 55 5.2 Hướng phát triển ........................................................................................... 55 TÀI LIỆU THAM KHẢO .......................................................................................... 55 viii DANH MỤC TỪ VIẾT TẮT VÀ TỪ KHÓA STT Từ viết tắt Tiếng Anh Ý nghĩa tiếng Việt 1 LBP Local binary patterns Mẫu nhị phân cục bộ 2 PCA Principal Components Analysis Phân tích thành phần chính 3 LDA Linear Discriminant Analysis Phân tích tách lớp tuyến tính 4 DFD Discriminant face descriptor Phân biệt bộ mô tả khuôn mặt 5 BoW Bag of Words Đặc trưng túi từ 6 LQP Local quantized pattern Mẫu lượng tử cục bộ 7 HOG Histogram of Oriented Gradient Biểu đồ mật độ lệch mức xám theo hướng 8 LPQ Local Phase Quantization Định lượng đoạn cục bộ 9 NMF Nonnegative Matrix Factorization Hệ số ma trận không âm 10 SIFT Scale Invariant Feature Transform Phép biến đổi đặc trưng bất biến về tỉ lệ. 11 AU Action Units Đơn vị hành động 12 2D-PCA Two-dimensional Principle Component Analysis Kỹ thuật phân tích thành phần chính hai chiều 13 2DLDA Two-dimensional Linear Discriminant Analysis Kỹ thuật phân tích tách lớp tuyến tính hai chiều 14 VAR-LBP Variance Local Binary Patterns Mẫu nhị phân bất biến 15 ILBP Improve Local Binary Patterns Cải tiến mẫu nhị phân cục bộ 16 NILBP Neighbors Local Binary Patterns Mẫu nhị phân chuẩn hóa ix 17 EN-LBP Enhanced Local Binary Patterns Mẫu nhị phân tăng cường 18 LTP Local Ternary Patterns Mẫu tam phân cục bộ 19 RLBP Robust Local Binary Patterns Mẫu nhị phân bền vững x DANH MỤC BẢNG Bảng 4.1: Liệt kê độ chính xác đạt được của thuật toán RLBP8,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL. ...................................................................... 41 Bảng 4.2: Liệt kê độ đo chính xác (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL. ......................................................... 42 Bảng 4.3: Liệt kê tổng hợp độ đo chính xác (%) thống kê vét lân cận cạn. .................. 43 Bảng 4.4: Liệt kê độ đo chính xác (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu ORL. ......................................................... 44 Bảng 4.5: Liệt kê độ chính xác đạt được của thuật toán RLBP8,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB..................................................................... 48 Bảng 4.6: Liệt kê độ đo chính xác (%) đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB. ....................................................... 49 Bảng 4.7: Liệt kê tổng hợp độ đo chính xác (%) thống kê vét lân cận cạn. .................. 50 Bảng 4.8: Liệt kê độ đo phần trăm đạt được của thuật toán RLBP16,1 được đề xuất so với các thuật toán khác trên cơ sở dữ liệu YaleB. ............................................................. 51 Bảng 4.13 : So sánh thời gian thực hiện rút trích đặc trưng của các phương pháp trên tổng số ảnh mẫu của một người cho từng cơ sở dữ liệu được tính bằng ( mini giây). .. 53 xi DANH MỤC HÌNH VẼ Hình 1.1: Các dạng sinh trắc học phổ biến. ................................................................... 1 Hình 1.2: Hệ thống nhận dạng khuôn mặt. .................................................................... 5 Hình 1.3: Minh họa bài toán định danh (a) và xác thực (b). .......................................... 6 Hình 2.1: Đặc trưng hình học [29]. ............................................................................... 9 Hình 2.2: Biểu đồ đặc trưng mật độ cấp thấp ((a) LBP, (b) LPQ, (c) HoG) [29]. ........ 10 Hình 2.3: Biễu diển đặc trưng dựa vào bộ lọc Gabor [29]. .......................................... 12 Hình 2.4: Biểu diễn đặc trưng túi từ BoW [29]. .......................................................... 13 Hình 2.5: Đặc trưng GP-NMF [29]. ............................................................................ 13 Hình 2.6: Đặc trưng mã hóa phân rã [29]. ................................................................... 14 Hình 2.7: Đặc trưng thành phần dựa vào (a) SIFT và dựa vào (b) NMF [29]. ............ 15 Hình 2.8: Đặc trưng không gian-thời gian sử dụng đặc trưng hình học từ các điểm mặt [29]............................................................................................................................. 17 Hình 2.9: Đặc trưng không gian thời-gian (a) LBP-TOP và (b) LPQ-TOP [29]. ......... 17 Hình 2.10: Bộ lọc làm trơn IC [29]. ............................................................................ 18 Hình 2.11: Đặc trưng Haar động (a), và đặc trưng tương tự (b) [29]. .......................... 19 Hình 2.12: Biểu diễn biến đổi tự do [29]. .................................................................... 20 Hình 2.13: Đặc trưng BoW theo thời gian [29]. .......................................................... 21 Hình 2.14: Ví dụ LBP và độ tương phản cục bộ C. ..................................................... 24 Hình 2.15: Tập hợp các điểm xung quang Ptt. ............................................................. 25 Hình 2.16: Các biến thể của LBP. ............................................................................... 26 Hình 2.17: Bảng thống kê các mẫu của uniform LBP. ................................................ 27 Hình 2.18: Thể hiện trọng số của ILBP8,1 và ILBP4,1 ................................................... 29 Hình 2.19: Ví dụ minh họa LTP cơ bản ...................................................................... 30 Hình 2.20: Biểu đồ thể hiện thủ tục EN_LBP. ............................................................ 31 Hình 3.1: Minh họa ý tưởng thuật toán đề xuất. .......................................................... 34 Hình 3.2: Biểu đồ thể hiện thủ tục. ............................................................................. 34 xii Hình 3.3: Ví dụ RLBP. ............................................................................................... 37 Hình 4.1: Minh họa các tư thế khuôn mặt một người trong cơ sở dữ liệu ORL. ......... 38 Hình 4.2: Minh họa hình ảnh đặc trưng khuôn mặt với các thuật toán liên quan và thuật toán đề xuất RLBP trên cơ sở dữ liệu ORL. ................................................................ 39 Hình 4.3: Biểu đồ so sánh Thuật toán RLBP8,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL. .............................................................................................................. 41 Hình 4.4: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL. .......................................................................................................... 42 Hình 4.5: Biểu đồ so sánh thống kê vét lân cận cạn tổng hợp trên cơ sở dữ liệu ORL. 43 Hình 4.6: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu ORL. .......................................................................................................... 44 Hình 4.7: Minh họa các kiểu biểu hiện khuôn mặt trong cơ sở dữ liệu YaleB. ............ 46 Hình 4.8: Minh họa hình ảnh đặc trưng với các thuật toán liên quan và thuật toán đề xuất RLBP trên cơ sở dữ liệu YaleB. ................................................................................. 47 Hình 4.9: Biểu đồ so sánh Thuật toán RLBP8,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB. ............................................................................................................ 49 Hình 4.10: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB. ........................................................................................................ 50 Hình 4.11: Biểu đồ so sánh thống kê vét lân cận cạn tổng hợp trên cơ sở dữ liệu YaleB. ................................................................................................................................... 51 Hình 4.12: Biểu đồ so sánh Thuật toán RLBP16,1 đề xuất với các thuật toán khác trên cơ sở dữ liệu YaleB. ........................................................................................................ 52 1 CHƯƠNG 1. TỔNG QUAN 1.1 Giới thiệu Sinh trắc học hay còn gọi là Công nghệ sinh trắc học (Biometric) là công nghệ sử dụng những thuộc tính vật lý, đặc điểm sinh học đặc trưng riêng của mỗi cá nhân như vân tay, mống mắt, khuôn mặt, giọng nói, dáng đi,.. để nhận dạng. Sinh trắc học được xem là công cụ xác thực cá nhân hữu hiệu nhất hiện nay. Sinh trắc học được phát triển lâu dài, đã được nghiên cứu và ứng dụng trong các lĩnh vực anh ninh, quốc phòng, thương mại. Trong những năm gần đây, công nghệ này đã đáp ứng được những yếu tố và nhu cầu cần thiết về chi phí, sự vận hành và khả năng xác thực cho độ chính xác cao. Vì vậy trong tương lai sinh trắc học sẽ hiện hữu và được ứng dụng mạnh mẽ hơn. Một số loại sinh trắc học phổ biến hiện nay như: Dấu vân tay ( Finger print), lồng bàn tay ( Palm print), khuôn mặt ( Face), hành vi ( Behavioral), nhịp tim ( Cardiac Rhythm), võng mạc ( Retiane),... Những đáp ứng nhu cầu thực tế vô cùng hữu hiệu của các loại sinh trắc học trên, đã thôi thúc các nhà nghiên cứu không ngừng tìm hiểu và phát triển ngành công nghệ này lên tầm cao mới. Và nhận dạng khuôn mặt trở thành chủ đề tiềm năng trong nghiên cứu thị giác máy tính [3]. Hình 1.1: Các dạng si