Hiện nay, cùng với sự phát triển của xã hội, vấn đề an ninh bảo mật đang được yêu cầu khắt khe tại mọi quốc gia trên thế giới. Các hệ thống nhận dạng mặt người được ra đời với độ tin cậy ngày càng cao. Một trong những bài toán nhận dạng mặt người đang rất được quan tâm hiện nay là nhận dạng khuôn mặt. Bên cạnh đó, năm 2011 được coi là năm phát triển vô cùng mạnh mẽ của các thiết bị di động như: smartphone, tablet và còn hứa hẹn phát triển rất nhiều và đa dạng trong các năm tiếp theo, và các thiết bị đó dần trở thành không thể thiếu của mỗi người, và có thể đảm nhiệm được những công việc của những chiếc máy tính để bàn hay laptop thời nay. Do đó, cần các cơ chế để bảo vệ việc truy cập các thiết bị đó, và nhận dạng khuôn mặt cũng là một cách thức đảm bảo an toàn hơn rất nhiều cho việc truy cập thiết bị, so với các cách thức thông thường khác.
15 trang |
Chia sẻ: tuandn | Lượt xem: 3465 | Lượt tải: 1
Bạn đang xem nội dung tài liệu Đề tài Một số phương pháp trích chọn đặc trưng khuôn mặt và ứng dựng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
MỘT SỐ PHƯƠNG PHÁP
TRÍCH CHỌN ĐẶC TRƯNG KHUÔN MẶT VÀ ỨNG DỰNG
Tác Giả: Tạ Tiến Thành- Quách Thu Thảo
Lớp K36 tin
Tóm tắt bài báo: Vấn đề an ninh và bảo mật ngày nay đang được quan tâm và chú ý đến, các phương pháp trích chọn đặc trưng và khuôn mặt giúp chúng ta nhận dạng mặt người, tìm kiếm thông tin… và được ứng dụng rất nhiều trên các lĩnh vực.
Từ Khóa: “Trích trọn đặc trưng khuôn mặt”
Mở đầu
Hiện nay, cùng với sự phát triển của xã hội, vấn đề an ninh bảo mật đang được yêu cầu khắt khe tại mọi quốc gia trên thế giới. Các hệ thống nhận dạng mặt người được ra đời với độ tin cậy ngày càng cao. Một trong những bài toán nhận dạng mặt người đang rất được quan tâm hiện nay là nhận dạng khuôn mặt. Bên cạnh đó, năm 2011 được coi là năm phát triển vô cùng mạnh mẽ của các thiết bị di động như: smartphone, tablet…và còn hứa hẹn phát triển rất nhiều và đa dạng trong các năm tiếp theo, và các thiết bị đó dần trở thành không thể thiếu của mỗi người, và có thể đảm nhiệm được những công việc của những chiếc máy tính để bàn hay laptop thời nay. Do đó, cần các cơ chế để bảo vệ việc truy cập các thiết bị đó, và nhận dạng khuôn mặt cũng là một cách thức đảm bảo an toàn hơn rất nhiều cho việc truy cập thiết bị, so với các cách thức thông thường khác. Do vậy, chúng em đã lựa chọn đề tài: “các phương pháp trích chọn đặc trưng khuôn mặt và ứng dụng”.
Một số phương pháp trích chọn đặc trưng khuôn mặt và ứng dụng
Phương pháp trích chọn đặc trưng hình học
Đặc trưng hình học là hướng tiếp cận dựa vào các bức ảnh trực diện khuôn mặt lấy từ khâu phát hiện khuôn mặt, trích chọn đặc trưng về hình học biểu diễn hình dáng, vị trí các phần của khuôn mặt như mắt, mũi, miệng, lông mày. Cụ thể xác định một số các điểm đặc trưng trên khuôn mặt: 2 mống mắt, điểm chính giữa miệng, khóe miệng, một số các điểm khác ở vùng trán, mắt,…
Xác định các điểm đặc trưng trên khuôn mặt
Yang đã phát triển một hệ thống thời gian thực để xác định các điểm đặc trưng như mống mắt, khóe miệng hay lỗ mũi. Phương pháp tìm kiếm 2 vùng mắt là 2 vùng tối nhất và sử dụng các điều kiện về hình học như vị trí bên trong mặt, kích thước và hình dáng để xác định. Phương pháp dùng phép lặp lấy ngưỡng để phát hiện ra vùng tối nhất với điều kiện ánh sáng thay đổi. Xác định lỗ mũi cũng tương tự như xác định 2 mống mắt.
k0=30 k1=32 k2=34
Hình 1: Lặp để xác định ngưỡng trên cửa sổ tìm kiếm
Để xác định khóe môi, xác định vị trí theo chiều dọc sử dụng phép chiếu toàn bộ theo trục x. Vị trí theo trục x được xác định bằng phép chiếu toàn bộ trên ảnh của cạnh miệng.
Hình 2: Phép chiếu toàn bộ
Để dò tìm khóe miệng sử dụng hai phương pháp:
+ Tìm điểm ảnh có độ xám lớn nhất trong các vùng dự kiến sau đó tìm xác định điểm khóe miệng sẽ nằm trên đường giữa 2 môi.
+ Tìm phần có giá trị điểm ảnh tối nhất trên đường giữa hai môi, chắc chắn khoảng cách giữa 2 vùng đảm bảo điều kiện thỏa mãn về khoảng cách giữa 2 khóe miệng trên thực tế và chọn vị trí có độ tương phản là cao nhất.
Phương pháp trên có một số những ưu điểm như thỏa mãn điều kiện thực thi với thời gian thực. Một số phương pháp có thể áp dụng với những độ phân giải khác nhau (với cả độ phân giải thấp), tuy nhiên vẫn có trường hợp phát hiện ra lông mày thay vì mắt. Tian đã giải quyết vấn đề bằng cách phát hiện cả vùng mắt và lông mày. Bằng cách đó, không chỉ trích chọn được thêm đặc trưng mà tỷ lệ chính xác còn được tăng lên. Đối với xác định khóe miệng, trường hợp sai là khi miệng không ở trạng thái bình thường và phương pháp áp dụng đối với mặt trực diện hoặc gần trực diện. Vukadinovic và Pantic sử dụng Gabor – wavalets và Gentle – Boost để xây dựng hệ thống nhận dạng tự động 20 điểm đặc trưng. Trong phương pháp, họ chia khuôn mặt thành 20 vùng nhỏ và mỗi vùng ứng với một điểm đặc trưng. Mỗi một vector đặc trưng ứng với vùng ảnh kích thước 13x13 pixel, có độ lớn là 13x13x(18+1) = 8281. Những vector đặc trưng được sử dụng để xây dựng một mô hình và dự đoán một điểm có là điểm đặc trưng hay không. Trong khi huấn luyện, mô hình đặc trưng Gentle – boost sử dụng các vector đặc trưng trích chọn từ các ví dụ huấn luyện. Trong khi kiểm tra, một của sổ kích thước 13x13 pixel được quét trên toàn bộ vùng quan tâm. Với mỗi một vị trí của cửa sổ trượt, so sánh sự giống nhau giữa giá trị của cửa sổ trượt và mô hình mẫu. Sau khi quét hết vùng quan tâm thì điểm có độ lệch với mẫu là nhỏ nhất sẽ được chọn.
Hình 3: Sơ đồ hệ thống tự động xác định điểm đặc trưng
Phát hiện hình dáng các bộ phận trên khuôn mặt
Tian phát triển phương pháp nhiều trạng thái để trích chọn đặc trưng hình học trong hình Hình 4. Một mô hình môi 3 trạng thái miêu tả trạng thái của môi: mở, đóng, ngậm chặt. Mô hình 2 trạng thái được dùng cho mỗi mắt, mô hình một trạng thái cho má và lông mày. Một số đặc trưng diện mạo sử dụng mô hình 2 trạng thái: có thể hiện và vắng mặt. Đường viền của các đặc trưng và thành phần được điều chỉnh bằng tay trong bước khởi tạo. Sau khi khởi tạo, tất cả các thay đổi của đặc trưng sẽ được dò tìm và phát hiện trong chuỗi ảnh. Thuật toán sử dụng các trạng thái dò tìm khác nhau là cải tiến của thuật toán Lucas-Kanade. Tuy nhiên có giới hạn là chuyển động của đầu. Phương pháp có thể phát hiện 16 Aus với độ chính xác là 95.5% trên bộ cơ sở dữ liệu Cohn – Kanade.
Hình 4: Mô hình nhiều trạng thái với mặt trực diện
Phương pháp trích chọn đặc trưng diện mạo
Đặc trưng diện mạo là hướng tiếp cận dựa vào cấu trúc phân bổ của cường độ sáng của điểm ảnh trên bề mặt của bức ảnh để trích chọn các đặc trưng. Một dạng khác của trích chọn đặc trưng là trích trọn đặc trưng diện mạo để xác định những thay đổi trên khuôn mặt. Một số phương pháp tiêu biểu như: Principle Component Analsys (PCA), Gabor Wavelet Analysis và Local Binary Pattern và được áp dụng trên toàn bộ bề mặt bức ảnh hoặc một phần để trích ra các đặc trưng và phát hiện sự thay đổi của khuôn mặt.
Mã LBP
LBP (Local Binary Pattern) là mẫu nhị phân địa phương được Ojala trình bày vào năm 1996 như là một đơn vị đo độ tương phản cục bộ của ảnh. Giá trị LBP được xác định bằng cách nhân các giá trị ngưỡng với trọng số ứng với mỗi điểm ảnh sau đó cộng tổng lại. Hình dưới minh họa cách tính độ tương phản trực giao (C) là hiệu cấp độ xám trung bình của các điểm ảnh lớn hơn hoặc bằng ngưỡng với các điểm ảnh thấp hơn ngưỡng. Phân phối hai chiều của mã LBP và độ tương phản cục bộ được lấy làm đặc trưng gọi là LBP/C.
Hình 5: Ví dụ về LBP và độ tương phản cục bộ C
Nguồn gốc: Dãy LBP được Ojala trình bày vào năm 2002. Định nghĩa một cấu trúc điểm ảnh T là một phân phối đại số của cấp độ xám của P +1 (P > 0) điểm ảnh.
T = t(gc,g0,…,gp-1)
Với gc ứng với cấp độ xám của điểm ảnh trung tâm Ptt , gp (p = 0,…,1) tương ứng với P điểm ảnh xung quanh, P điểm ảnh này nằm trên đường tròn bán kính R và tâm là Ptt .
P=8, R=1.0
P=16, R=4.0
P=12, R=2.5
Hình 6: Tập hợp các điểm xung quanh Ptt
Không mất thông tin, có thể trừ gp đi một lượng là gc
T = t(gc,g0 – gc ,…,gp – gc)
Giả sử sự sai số giữa gp và gc là độc lập với gc, ta có thể nhân tử hóa gc như sau:
T = t(gc)t(g0- gc,…,gp-1- gc)
t(gc) biểu thị xu hướng độ sáng tối của cả bức ảnh nên không liên quan đến kết cấu của ảnh cục bộ do đó có thể bỏ qua
T~t((g0 – gc),…,(gp-1 – gc))
Mặc dù tính bất biến ngược với độ thay đổi tỷ lệ xám của điểm ảnh, sự khác biệt ảnh hưởng bởi tỷ lệ. Để thu được đặc điểm bất biến với bất kỳ một sự thay đổi nào của ảnh đen trắng (gray scale) chỉ quan tâm đến dấu của độ lệch:
T~t(s(g0 – gc),…,s(gp-1 – gc))
Với s là hàm dấu s(x) = 1 x≥00 x<0
Trọng số 2p được dùng cho các hàm dấu s(gp – gc) để chuyển sự khác biệt giữa các điểm ảnh bên cạnh về một giá trị duy nhất.
LBPP,R = p=0p-1s(gp – gc)*2p
Theo Eq.2 cứ P pixel thì có 2p giá trị LBPP,R trong khoảng [0,2p – 1] nhưng để đơn giản ta có thể chọn một số giá trị trong 2p giá trị ký hiệu là 𝐿𝐵𝑃𝑃,𝑅
Nguyên lý phân lớp không tham biến: Trong phân lớp, sự khác biệt giữa mẫu và mô hình phân phối LBP được đánh giả bởi kiểm tra thống kê không tham biến. Phương pháp tiếp cận này có ưu điểm là không cần phải có những giả thiết về phân phối của các đặc trưng. Thông thường, những kiểm tra thống kê được chọn cho mục đích là nguyên lý cross- entropy được giới thiệu bởi Kullback (1968). Sau đó, Sokal và Rohlf (1969) gọi cách đo này là thống kê G.
G(S,M) = 2* b=1BSb logSbMb=2b=1B[Sb*logSb-Sb*logMb]
Với S,M kí hiệu phân phối mẫu và mô hình mong muốn. Sb và Mb là xác suất để b thuộc vào phân phối mẫu hoặc mô hình . B là số phần tử trong phân phối. Thống kê G sử dụng trong phân lớp có thể viết lại như sau:
L(S,M) = − b=1BSb log Mb
Kiến trúc mô hình có thể xem như xử lý ngẫu nhiên có đặc tính có thể xác định bởi phân phối LBP. Trong một phân lớp đơn giản , mỗi lớp được biểu diễn bởi một mô hình phân phối đơn giản Mi. Tương tự , một kiến trúc mẫu không xác định có thể miêu tả bởi phân phối S. L là một giả ma trận đo khả năng mẫu S có thể thuộc lớp i.
Lớp C của một mẫu không xác định có thể được xác định bởi luật “hàng xóm gần nhất”:
C = argminiL(S,Mi)
Bên cạnh đó, một thống kê log- likelihood có thể xem như đơn vị đo sự khác biệt và có thể sử dụng để liên kết nhiều bộ phân lớp giống như bộ phân lớp k-NN hoặc self-oganizing map (SOM). Log-likelihood đúng trong một số trường hợp nhưng không ổn định khi mà cỡ mẫu nhỏ.Trong trường hợp này Chi-square- distance thường cho kết quả tốt hơn :
𝑋2(S,M) = b=1B(Sb- Mb)2(Sb+Mb)
Để đạt được độ chính xác cao sử dụng giao histogram
H(S,M) = b=1Bmin(Sb,Mb)
Phép quay bất biến :Để không bị ảnh hưởng bởi sự quay, mỗi giá trị LBP cần quay ngược lại về vị trí ban đầu, cách tốt nhất là tạo ra tất cả các trường hợp quay của một mẫu, sự quay có thể định nghĩa như sau:
𝐿𝐵𝑃riR,I= min { ROR(LBPP,R,i) i=0,1,…,P-1}
Trong đó ri là viết tắt của rotation invariant ( quay bất biến), ROR(x,i) dịch vòng tròn số nhị phân P - bit (x) i lần theo chiều kim đồng hồ.
Độ tương phản và kết cấu mẫu: Kết cấu có thể được coi là một hiện tượng hai chiều được đặc trưng bởi hai đặc tính trực giao: cấu trúc không gian (mô hình) và độ tương phản (độ mạnh của mô hình). Quay bất biến tương phản địa phương có thể được đo trong một hình tròn đối xứng xung quanh giống như LBP:
VARP,R = 1Pp=0P-1(gp – μ)2
Trong đó 𝜇 = 1Pp=0P-1gp
Tổng hợp lại ta có : 𝐿𝐵𝑃riP1,R1 / VARP2,R2
Bộ lọc Gabor
Bộ lọc Gabor thực ra là một bộ lọc tuyến tính được sử dụng như là một phương pháp phát hiện cạnh trong xử lý ảnh. Tần suất và hướng dùng để biểu diễn bộ lọc Gabor tương tự như hệ thống thị giác của con người và nó được tìm ra như một cách tiếp cận đặc biệt cho biểu diễn cấu trúc và sự phân biệt. Trong miền không gian, bộ lọc Gabor 2 chiều là một hàm nhân Gauss được điều chỉnh bởi một mặt phẳng sóng sin. Các bộ lọc Gabor tương tự nhau và tất cả bộ lọc được sinh ra từ Gabor- wavelet bởi sự co giãn và xoay.
Hình 7: Phần thực của bộ lọc Gabor
Một bộ lọc Gabor được định nghĩa như sau :
ω2σ22
x'2+y'22π2
ω2σ22
𝛾 (𝑥,y, ω, 𝜃) = 12πσ2 e [eiωx' - e ]
𝑥′= 𝑥𝑐𝑜𝑠𝜃+𝑦𝑠𝑖𝑛𝜃 , 𝑦′= −𝑥𝑠𝑖𝑛𝜃+𝑦𝑐𝑜𝑠𝜃
Trong đó (x,y) là vị trí điểm ảnh trong không gian, 𝜔 tần số góc , 𝜃 hướng của bộ lọc Gabor, 𝜎 độ lệch chuẩn của hàm Gauss giữa trục x và y.
ω2σ22
Thành phần thứ 2 của bộ lọc Gabor e bù cho giá trị DC bởi thành phần cos khác 0 có nghĩa giá trị sin có thể bằng 0. Đặt 𝜎= 𝜋/𝜔 thể hiện mối quan hệ giữa 𝜎 và 𝜔. Hầu hết các trường hợp của bộ lọc Gabor đều sử dụng với 5 tần suất và 8 hướng để trích chọn đặc trưng cho biểu diễn khuôn mặt.
Chọn tần suất cực đại :
𝜔𝑚𝑎𝑥= 𝜋/2 , 𝜔𝑚= 𝜔𝑚𝑎𝑥∗𝜆−(𝑚−1)
m = 1,2,3,4,5; 𝜆= 2 ; 𝜃𝑛= (𝑛−1)𝜋/8; n = 1,2,3,…,8
Biểu diễn đặc trưng Gabor
Biểu diễn đặc trưng Gabor của một bức ảnh I (x,y) được xác định bằng cách nhân xoắn bức ảnh với Gabor- filter bank 𝛾(𝑥,𝑦,𝜔,𝜃) như sau:
𝑂𝑚,n(𝑥,y) = 𝐼 (𝑥,y) ∗𝛾(𝑥,𝑦,𝜔,𝜃)
Trong đó * ký hiệu toán tử nhân xoắn. Cường độ bức ảnh của kết quả nhân xoắn ứng với những bộ lọc Gabor được chỉ ra trong hình trên.
Hình 8: Một ví dụ về ảnh sau khi nhân xoắn với 48 bộ lọc Gabor
Phương pháp trích chọn đặc trưng bằng PCA
Giới thiệu chung về thuật toán PCA
PCA (Principle Components Analysic) là một thuật toán được sử dụng để tạo ra một ảnh mới từ ảnh ban đầu. Ảnh mới này có kích thước nhỏ hơn nhiều so với ảnh ban đầu nhưng vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng. PCA không cần quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhận dạng và mối quan hệ giữa các đặc điểm đó. Tất cả các chi tiết đó đều được thể hiện ở ảnh mới được tạo ra từ PCA. Về bản chất, PCA tìm ra một không gian mới theo hướng biến thiên mạnh nhất của một tập hợp các vector trong không gian cho trước. Trong không gian mới, người ta hi vọng rằng việc phân loại sẽ mang lại kết quả tốt hơn so với không gian ban đầu.
Ưu điểm của phương pháp PCA :
+ Tìm được các đặc tính tiêu biểu của đối tượng cần nhận dạng mà không cần phải xác định các thành phần và mối quan hệ giữa các thành phần đó.
+ Thuật toán có thể thực hiện tốt với các cảnh có độ phân giải cao, do PCA sẽ thu gọn ảnh thành một ảnh có kích thước nhỏ hơn.
+ PCA có thể kết hợp với các phương pháp khác như mạng Nơron, Support Vector Machinge… để mạng lại hiệu quả nhận dạng cao hơn.
Nhược điểm của PCA :
+ PCA phân loại theo chiều lớn nhất của tập vector. Tuy nhiên, chiều phân bố lớn nhất không phải lúc nào cũng mang lại hiệu quả tốt nhất cho bài toán nhận dạng. Đây là nhược điểm cơ bản của PCA.
+ PCA rất nhạy với nhiễu.
Nội dung thuật toán PCA
Không gian mới được tạo bởi PCA được cấu thành từ k vector đơn vị có chiều là N. Mỗi vector được gọi là một Eigenface.
Phép biến đổi :
A=a1a2⋮an à W = w1w2⋮wk với K<<N
W=T.A
Với T là ma trận chuyển đổi, T có kích thước K x N.
Gọi M là số ảnh đầu vào, mỗi ảnh được chuyển thành vector N chiều. Ta có tập hợp đầu vào
X={x1, x2,…,xM} (xi ∈ RN)
Trung bình của các vector đầu vào
Xtb = 1M i=1Mxi
Sai lệch so với tâm:
Φi = xi - xtb
Gọi A=[ Φ1, Φ2,… ,ΦM ] ta có ma trận tương quan của A là :
C=1M i=1MΦiΦjT = A.AT
Gọi các giá trị riêng của C là : λ1, λ2,…, λn sắp xếp theo thứ tự giảm dần, tương ứng với N vector riêng u1, u2,…, uN. Các vector riêng này trực giao từng đôi một, riêng ui được gọi là một eigenface. Tập hợp các vector ban đầu được biểu diễn trong không gian tạo bởi n eigenface theo mô tả :
x-xtb = w1u1+ w2u2+…+ wNuN = i=1Nwiui
Chọn lấy K vector riêng u tương ứng với K giá trị riêng λ lớn nhất, ta có :
x-xtb = w1u1+ w2u2+…+ wNuN=i=1Kwiui với K<<N
Vector các hệ số khai triển [w1, w2,…, wk] chính là biểu diễn mới của ảnh được tạo ra trong không gian PCA. Ảnh mới vẫn giữ được các đặc điểm chính của ảnh đầu vào.
Vector [w1, w2,…, wK] được tính theo công thức :
w1w2⋮wk= u1Tu2T⋮uKT(x-xtb) = UT.(x-xtb)
Vấn đề cần giải quyết ở đây là ma trận tương quan C=A.AT có kích thước N2.
Với N=180x200=36000, khối lượng tính toán sẽ rất lớn. Do đó, để tính được các eigenface mà không cần tính cả ma trận C, người ta đưa ra phương pháp tính nhanh dựa vào vector riêng và giá trị riêng của ma trận L=AT.A có kích thước MxM với M là số ảnh đầu vào.
Cách tính như sau :
Gọi vi , μi lần lượt là vector riêng và giá trị riêng của ma trận L :
AT.A.vi = μi. vi
Nhân cả 2 vế với A, ta có :
A.AT.A.vi = μi. A . vi
Ta thấy A.vi chính là vector riêng của C=A.AT ứng với giá trị riêng μi.
Nhận dạng khuôn mặt dựa trên PCA
Bước đầu tiên trong nhận dạng khuôn mặt dựa trên PCA là trích chọn vector đặc tính. Một bức ảnh về khuôn mặt được coi như một vector, nếu bức ảnh có kích thước là w*h pixels thì không gian chứa vector này có số chiều là N=w*h. Mỗi pixel sẽ được mã hóa bởi một thành phần của vector.
Khâu quan trọng nhất trong bài toán nhận dạng đó là trích chọn vector đặc tính. Các bước trích chọn bao gồm :
+ Tạo một tập X gồm M ảnh (ảnh học), mỗi ảnh có kích thước N, các ảnh được chuyển thành vector N chiều.
X = {x1, x2, …,xM }
+ Tính trung bình của tập trên :
Xtb = 1M i=1Mxi
+ Tính sai lệch của ảnh đầu vào với giá trị trung bình trên:
Φi = xi - xtb
+ Tìm một tập M vector trực giao u biểu diễn phân bố mạnh nhất của tập dữ liệu X. Tập các vector u được gọi là eigenface của tập dữ liệu học.
+ Xây dựng các ảnh mới vi theo M vector u :
vi = uitΦi
Ω=[v1, v2,… ,vM]T
Trong đó, vi = uitΦi là vector đặc tính của ảnh thứ I trong không gian mới. Ω ở đây là tập các eigenface, các thành phần cơ bản cho bức ảnh cần nhận dạng.
Sau khi trích chọn được các vector đặc tính, cần đối chiếu vector này với cơ sở dữ liệu, từ đó đưa ra kết quả nhận dạng. Trong bài toán, kết quả nhận dạng sẽ là nhận biết được hoặc chưa nhận biết được.
Để thực hiện phân loại có rất nhiều phương pháp như khoảng cách Euclid, mạng Noron… trong đó khoảng cách Euclid là phương pháp đơn giản nhất. Nó cho kết quả tốt đối với trường hợp đối tượng đã được tạo thành các nhóm cách xa nhau. Vector đặc tính của đối tượng được tạo thành các nhóm cách xa nhau.
Vector đặc tính của đối tượng cần nhận dạng sẽ được so sánh lần lượt với vector đặc tính của từng ảnh mẫu trong tập các ảnh học. Các khoảng cách ngắn nhất sẽ được lưu lại:
εk= || Ω- Ωk || với k=1,..,M
Ở đây Ωk là vector của khuôn mặt thứ k trong CSDL. Nếu εk nhỏ hơn một số được xác định trước thì bức ảnh được nhận dạng là khuôn mặt thứ k trong CSDL.
Ứng dụng của một số phương pháp trích chọn đặc trưng bằng khuôn mặt
+ Hệ thống tương tác giữa người và máy: giúp những người bị tật hoặc khiếm khuyết có thể trao đổi. Những người dùng ngôn ngữ tay có thể giao tiếp với những người bình thường. Những người bị bại liệt thông qua một số ký hiệu nháy mắt có thể biểu lộ những gì họ muốn. + Nhận dạng người A có phải là tội phạm truy nã hay không? Giúp cơ quan an ninh quản lý tốt con người. Công việc nhận dạng có thể ở trong môi trường bình thường cũng như trong bóng tối (sử dụng camera hồng ngoại).
+ Hệ thống quan sát, theo dõi và bảo vệ.
+ Lưu trữ (rút tiền ATM, để biết ai rút tiềnvào thời điểm đó
+ Thẻ căn cước, chứng minh nhân dân.
+ Điều khiển vào ra: văn phòng, công ty, trụ sở, máy tính,…
+ An ninh sân bay, xuất nhập cảnh
+ Tương lai sẽ phát triển các loại thẻ thông minh có tích hợp sẵn đặc trưng của người dùng trên đó, khi bất cứ người dùng khác dùng để truy cập hay xử lý tại các hệ thống sẽ được yêu cầu kiểm tra các đặc trưng khuôn mặt so với thẻ để biết nay có phải là chủ thẻ hay không.
+ Tìm kiếm và tổ chức dữ liệu liên quan đến con người thông qua khuôn mặt người trên nhiều hệ cơ sở dữ liệu lưu trữ thật lớn, như internet, các hãng truyền hình.
+ Hiện nay có nhiều hướng tiếp cận để xác định một ảnh có phải là ảnh khỏa thân hay không?
+ Ứng dụng trong video phone.
+ Phân loại trong lưu trữ hình ảnh trong điện thoại di động.
+ Kiểm tra trạng thái người lái xe có ngủ gật, mất tập trung hay không, và hỗ trợ thông báo khi cần thiết.
+ Phân tích cảm xúc trên khuôn mặt.
+ Trong lãnh vực thiết kế điều khiển robot.
Kết luận
Trong bài viết này chúng em đã tìm hiểu, phân tích một số phương pháp trích chọn đặc trưng khuôn mặt: Phương pháp trích chọn đặc trưng hình học, diện mạo và phương pháp trích chọn đặc trưng khuôn mặt bằng PCA. Đồng thời đưa ra được các ứng dụng thực tế đối với một số phương pháp trích chọn đặc trưng khuôn mặt. Trong thời gian học tập và nghiên cứu tại trường chúng em sẽ mở rộng nghiên cứu để đề tài có thể được phát triển thành một phần mềm nhận dạng mặt người tốt hơn, bằng cách kết hợp với một số thuật toán nhận dạng và xử lý ảnh hiện đại hơn. Cho ra kết quả chính xác hơn.
LỜI CẢM ƠN
Qua thời gian học tập và tiếp thu kiến thức tại trường. Với sự cố gắng, nỗ lực của mình và sự giúp đỡ của các thầy cô và các bạn chúng em đã hoàn thành bài báo của mình. Do kiến thức và thời gian còn hạn chế nên bài báo không tránh khỏi những thiếu sót, chúng em rất mong được sự đóng góp ý kiến của các thầy cô và các bạn để bài báo cáo được hoàn thiện hơn.
Chúng em xin cảm ơn cô Lưu Thị Bích Hương đã tạo điều kiện cho chúng em được học tập, trau rồi kiến thức và thực hiện ý tưởng để chúng em hoàn thành bài báo một cách đúng thời hạn.
TÀI LIỆU THAM KHẢO
Bài tập lớn xử lý ảnh- Đại Học Bách Khoa Hà Nội
Bài tập lớn phương ph