Đồ án Nhận dạng biển chỉ dẫn dịch sang tiếng việt bằng PCA

Nhận dạng ký tự là bài toán đang thu hút đƣợc nhiều sự quan tâm và nghiên cứu. Qua đó em cũng muốn tham gia nghiên cứu về bài toán nhận dạng ký tự bằng phƣơng pháp phân tích thành phần chính gọi tắt là PCA và phát triển sâu hơn khi tham gia xây dựng ứng dụng “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt” trơng đợt làm luận văn này. Đề tài tập trung vào việc nhận dạng các từ trên biển chỉ dẫn rồi dịch sang tiếng việt. Ứng dụng một phần nào đó góp phần nào đó vào việc tách ký tự ra khỏi vùng ảnh, nhận dạng ảnh ký tự, rồi cuối cùng mang đi dịch nghĩa. Cái đích cuối cùng là một quá trình nghiên cứu với mục đích mang lại cho ngƣời dùng nhanh chóng dịch đƣợc nghĩa của từ (cụ thể là từ tiếng anh) nằm trên bất ký biển chỉ dẫn nào.

pdf16 trang | Chia sẻ: lecuong1825 | Lượt xem: 1928 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Đồ án Nhận dạng biển chỉ dẫn dịch sang tiếng việt bằng PCA, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
i TÓM TẮT ĐỒ ÁN TỐT NGHIỆP 1. Tên đề tài Nhận dạng biển chỉ dẫn dịch sang tiếng việt bằng PCA. 2. Mô tả bải toán Ứng dụng nhận dạng biển chỉ dẫn cũng nhƣ tất cả các loại biển phục vụ trong đời sống của con ngƣời là đề tài thu hút nhiều sự quan tâm nghiên cứu và phát triển. Ứng dụng này không chỉ dừng ở nhận dạng ra các ký tự mà còn dịch từ tiếng anh ra tiếng việt. Góp phần xây dựng nên từ điển Anh Việt, nghĩa là nó dịch nghĩa từ hình ảnh. 3. Đóng góp của tác giả Xây dựng phƣơng pháp trích thông tin trên biển chỉ dẫn (cụ thể là từ ngữ trên đó). Xây dựng phƣơng pháp áp dụng PCA cho ký tự và nêu ra đƣợc ƣu nhƣợc điểm của phƣơng pháp PCA cho việc nhận dạng ký tự Xây dựng bộ từ điển Anh – Việt về chủ đề biển chỉ dẫn. 4. chức năng chính ii Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa. iii MỤC LỤC LỜI CẢM ƠN ............................................................... Error! Bookmark not defined. LỜI CAM ĐOAN .......................................................... Error! Bookmark not defined. NHẬN XÉT CỦA GIÁO VIÊN HƢỚNG DẪN .......... Error! Bookmark not defined. PHIẾU DUYỆT ĐỒ ÁN TỐT NGHIỆP ....................... Error! Bookmark not defined. TÓM TẮT ĐỒ ÁN TỐT NGHIỆP ..................................................................................i MỤC LỤC ............................................................................................................... iii DANH MỤC CÁC HÌNH VẼ ......................................................................................... v Chƣơng 1. TỔNG QUAN ĐỀ TÀI ............................................................................ 1 1.1 Giới thiệu đề tài .............................................................................................. 1 1.2 mục đích và ý nghĩa ........................................................................................ 1 1.2.1 Mục đích:................................................................................................ 1 1.2.2 Ý nghĩa: .................................................................................................. 1 1.3 Biển chỉ dẫn .................................................................................................... 2 1.3.1 Khái niệm ............................................................................................... 2 1.3.2 Ứng dụng ................................................................................................ 3 1.4 phƣơng pháp giải quyêt bài toán đặt ra .......................................................... 3 1.4.1 Một số hƣớng giải quyết bài toán nhận dạng biển chỉ dẫn .................... 4 1.4.2 Một số hƣớng giải quyết nhận dạng ký tự ............................................. 5 1.4.3 Một số hƣớng giải quyết dịch sang tiếng việt ........................................ 5 1.5 Hƣớng giải quyết của đề tài ............................................................................ 6 1.5.1 Đặc điểm của bảng chỉ dẫn .................................................................... 6 1.5.2 Các bƣớc thực hiện ................................................................................. 6 1.6 Mục tiêu và nhiệm vụ ..................................................................................... 7 1.6.1 Mục tiêu.................................................................................................. 7 1.6.2 Nhiệm vụ ................................................................................................ 7 1.7 Bố cục luận văn .............................................................................................. 7 Chƣơng 2. NỀN TẢNG CÔNG NGHỆ ................... Error! Bookmark not defined. 2.1 Mô Hình Giải Quyết Bài toán ...................... Error! Bookmark not defined. 2.2 Lý Thuyết Xử Lý Ảnh .................................. Error! Bookmark not defined. 2.2.1 Tổng quan về xử lý ảnh ........................ Error! Bookmark not defined. 2.2.2 Nhận dạng ảnh ...................................... Error! Bookmark not defined. 2.2.3 Giới thiệu một số ứng dụng của xử lý ảnh .......... Error! Bookmark not defined. iv 2.3 Thƣ Viện Xử Lý Ảnh OPENCV .................. Error! Bookmark not defined. 2.3.1 Vài nét về Computer Vision ................. Error! Bookmark not defined. 2.3.2 Thƣ viện mã nguồn mở OpenCV của Intel ......... Error! Bookmark not defined. 2.4 Hệ Quản Trị Cơ Sở Dữ Liệu MYSQL ......... Error! Bookmark not defined. 2.4.1 Khái niệm: ............................................ Error! Bookmark not defined. 2.4.2 Tại sao dùng MYSQL .......................... Error! Bookmark not defined. 2.5 khái niệm Toán học trong pca (phân tích thành phần chính)Error! Bookmark not defined. 2.5.1 Độ lệch chuẩn ....................................... Error! Bookmark not defined. 2.5.2 Hiệp phƣơng sai ................................... Error! Bookmark not defined. 2.5.3 Ma trận hiệp phƣơng sai ....................... Error! Bookmark not defined. 2.5.4 Ma trận đại số ....................................... Error! Bookmark not defined. 2.5.5 Eigenvector (Vectơ riêng) .................... Error! Bookmark not defined. 2.5.6 Eigenvalue (Giá trị riêng) ..................... Error! Bookmark not defined. Chƣơng 3. ỨNG DỤNG VÀ THỰC NGHIỆM ...... Error! Bookmark not defined. 3.1 Môi trƣờng thực nghiệm ............................... Error! Bookmark not defined. 3.2 Dữ liệu đầu vào ............................................. Error! Bookmark not defined. 3.3 Quá trình xử lý để nhận dạng dịch nghĩa...... Error! Bookmark not defined. 3.3.1 Tổng quan quá trình thực hiện ............. Error! Bookmark not defined. 3.3.2 Tải ảnh .................................................. Error! Bookmark not defined. 3.3.3 Tách vùng từ có trên trên biển ............. Error! Bookmark not defined. 3.3.4 Chƣơng trình tách ký tự ....................... Error! Bookmark not defined. 3.3.5 Nhận dạng ký tự bằng PCA ................. Error! Bookmark not defined. 3.3.6 Dịch sang tiếng việt .............................. Error! Bookmark not defined. 3.4 Kết quả đạt đƣợc ........................................... Error! Bookmark not defined. 3.4.1 Giao diện chính chƣơng trình ............... Error! Bookmark not defined. 3.4.2 Mở ảnh ................................................. Error! Bookmark not defined. 3.4.3 Xem quá trình xử lý của chƣơng trình . Error! Bookmark not defined. 3.4.4 Nhận dạng và dịch ............................... Error! Bookmark not defined. Chƣơng 4. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ............................................... 9 4.1 Kết luận ........................................................................................................... 9 4.1.1 Kết quả đạt đƣợc .................................................................................... 9 4.1.2 Hạn chế ................................................................................................... 9 4.2 Hƣớng phát triển ........................................................................................... 10 DANH MỤC TÀI LIỆU THAM KHẢO ...................... Error! Bookmark not defined. v vi DANH MỤC CÁC HÌNH VẼ Hình 1. Chức năng load ảnh, nhận dạng, dịch nghĩa. ----------------------------------- ii Hình 2. Biển chỉ dẫn đƣờng. ---------------------------------------------------------------- 2 Hình 3. Biển chỉ dẫn cổng vào tòa nhà. --------------------------------------------------- 3 Hình 4. Biển chỉ dẫn phòng. ---------------------------------------------------------------- 3 Hình 5. Mô hình giải quyết bài toán. ----------------- Error! Bookmark not defined. Hình 6. Ví dụ về Computer Vision. ------------------ Error! Bookmark not defined. Hình 7. Tổ chức thƣ viện OpenCV.------------------- Error! Bookmark not defined. Hình 8. Tổng quan quá trình thực hiện. -------------- Error! Bookmark not defined. Hình 9. Quá trình mở ảnh. ----------------------------- Error! Bookmark not defined. Hình 10. Quá trình tách từ. ----------------------------- Error! Bookmark not defined. Hình 11. Biển chỉ dẫn đƣợc khoanh vùng chọn. ---- Error! Bookmark not defined. Hình 12. Sơ đồ tách ký tự. ----------------------------- Error! Bookmark not defined. Hình 13. ảnh đầu vào để tách hình chứa ký tự. ----- Error! Bookmark not defined. Hình 14. Kết quả nhị phân ảnh. ----------------------- Error! Bookmark not defined. Hình 15. Kết quả khoanh vùng đối tƣợng. ----------- Error! Bookmark not defined. Hình 16. Kết quả tách từ. ------------------------------- Error! Bookmark not defined. Hình 17. Kết quả lọc khi đã lọc nhiễu. --------------- Error! Bookmark not defined. Hình 18. Kết quả tách ký tự. --------------------------- Error! Bookmark not defined. Hình 19. Sơ đồ áp dụng PCA nhận dạng ký tự. ----- Error! Bookmark not defined. Hình 20. Sơ đồ cài đặt và xây dựng PCA. ----------- Error! Bookmark not defined. Hình 21. Giao diện chính của chƣơng trình. --------- Error! Bookmark not defined. Hình 22. Ảnh đƣợc mở và đƣợc hiển thị lên picture box. ---- Error! Bookmark not defined. Hình 23. Hiển thị kết quả quá trình xử lý. ----------- Error! Bookmark not defined. Hình 24. Kết quả nhận dạng và dịch. ----------------- Error! Bookmark not defined. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA Chƣơng 1. TỔNG QUAN ĐỀ TÀI 1.1 GIỚI THIỆU ĐỀ TÀI Nhận dạng ký tự là bài toán đang thu hút đƣợc nhiều sự quan tâm và nghiên cứu. Qua đó em cũng muốn tham gia nghiên cứu về bài toán nhận dạng ký tự bằng phƣơng pháp phân tích thành phần chính gọi tắt là PCA và phát triển sâu hơn khi tham gia xây dựng ứng dụng “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt” trơng đợt làm luận văn này. Đề tài tập trung vào việc nhận dạng các từ trên biển chỉ dẫn rồi dịch sang tiếng việt. Ứng dụng một phần nào đó góp phần nào đó vào việc tách ký tự ra khỏi vùng ảnh, nhận dạng ảnh ký tự, rồi cuối cùng mang đi dịch nghĩa. Cái đích cuối cùng là một quá trình nghiên cứu với mục đích mang lại cho ngƣời dùng nhanh chóng dịch đƣợc nghĩa của từ (cụ thể là từ tiếng anh) nằm trên bất ký biển chỉ dẫn nào. 1.2 MỤC ĐÍCH VÀ Ý NGHĨA 1.2.1 Mục đích: Với đề tài “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt” em xác định cho mình các mục đích cần đạt đƣợc cho quá trình thực hiện luận văn nhƣ sau:  Hiểu thêm đƣợc môn xử lý ảnh.  Biết đƣợc cách xây dựng thuật toán (cụ thể là thuật toán PCA xây dựng trong bài)  Tìm hiểu xây dựng ứng dụng winForm bằng ngôn ngữ C++.  Biết áp dụng thƣ viện OPENCV cho xử lý ảnh.  Nắm bắt chu trình để xây dựng và phát triển cho sản phẩm phần mềm.  Xây dựng đƣợc ứng dụng hoàn thiện, có khả năng ứng dụng vào thực tế. 1.2.2 Ý nghĩa: Với việc xử lý ảnh vẫn đang còn thu hút nhiều dự án nghiên cứu và phát triển, áp dụng nhiều giải pháp, nhiều kỹ thuật vì vậy với đề tài về xử lý và nhận dạng mang về cho em những ý nghĩa sau:  Tham gia nghiên cứu và phát triển thêm phƣơng pháp nhận dạng và xử lý ảnh. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA  Mang lại ứng dụng thiết thực cho ngƣời dùng.  Nhanh chóng nắm bắt đƣợc công nghệ trong tƣơng lai. 1.3 BIỂN CHỈ DẪN 1.3.1 Khái niệm Biển chỉ dẫn là biển chứa những thông tin hữu ích, nhằm hƣớng ta nhanh chóng nắm bắt hoặc hƣớng dẫn ta hiểu về một điều gì đó. Bảng chỉ dẫn là biển hiệu đƣợc đặt trên đƣờng, hành lang, khung viên, hoặc trong các tòa nhà lớn, có chứa thông tin bằng chữ hoặc ký hiệu liên quan đến lĩnh vực nào đó. Chẳng hạn nhƣ biển chỉ dẫn về lối đi, hoặc biển thông tin, biển chỉ dẫn về trò chơi ..v.v. Một số hình ảnh biển chỉ dẫn: Hình 2. Biển chỉ dẫn đƣờng. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA Hình 3. Biển chỉ dẫn cổng vào tòa nhà. Hình 4. Biển chỉ dẫn phòng. 1.3.2 Ứng dụng Hiện nay có rất nhiều biển chỉ dẫn thuộc nhiều lĩnh vực khác nhau trong đời sống. Mục đích chính của nó là để hƣớng dẫn con ngƣời hiểu và bắt kịp những gì cần thiết ngay tại thời điểm mong muốn đƣợc hƣớng dẫn về một cái gì đó. Chính vì nhu cầu trên em xây dựng phần mềm “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt”. Với Tiêu chí là góp một phần nào đó vào việc làm cho ngƣời hiểu đƣợc về bảng chỉ dẫn mà chƣa biết ngoại ngữ (cụ thể đó là biển chỉ dẫn về tiếng anh). 1.4 PHƢƠNG PHÁP GIẢI QUYÊT BÀI TOÁN ĐẶT RA Nhằm đạt đƣợc kết quả trông đợi nhƣ đã đề ra, và hoàn thành luận văn đúng thời hạn, em đã chuẩn bị kế hoạch thực hiện các công việc chi tiết nhƣ sau:  Liệt kê những yêu cầu lớn trong đề bài.  Đề ra phƣơng pháp giải quyết với mỗi yêu cầu trên. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA  Chọn ra phƣơng pháp giải quyết phù hợp với đề tài cho mỗi yêu cầu trên.  Đƣa ra kết luận và rút kinh nghiệm. 1.4.1 Một số hƣớng giải quyết bài toán nhận dạng biển chỉ dẫn 1.4.1.1 Hướng tiếp cận phát triển vùng Ý tƣởng của phƣơng pháp: Dễ áp dụng cho những biển có chứa màu đồng nhất, chẳng hạn một màu nhất định, và có diện tích nhất định. Phƣơng pháp phát triển vùng là dùng một khung chữ nhật di chuyển trong để tìm ra vùng có tính chất thỏa mãn biển chỉ dẫn rồi tiến hành nhận dạng Ƣu Điểm: Rất đơn giản, và xử lý nhanh đối với tập ảnh có chứa biển chỉ dẫn 1 màu nhất định và cùng kích thƣớc. Nhƣợc điểm: Bảng chỉ dẫn thƣờng chứa nhiều màu và nhiều màu sắc khác nhau kể cả kích thƣớc, Vì vậy Phƣơng pháp này áp dụng sẽ không tối ƣu cho bài luận. 1.4.1.2 Hướng tiếp cận dò biên và biến đổi Hough Ý tƣởng của phƣơng pháp: Biển chỉ dẫn thƣơng đƣợc bao quanh bằng các đƣờng dọc ngang. Do đó có thể dùng phƣơng pháp phát hiện biên, sau đó dùng Hough để trích các đoạn thẳng dọc ngang tồn tại trong ảnh. Giao điểm của những đoạn thẳng này chính là vùng chứa biển chỉ dẫn Ƣu điểm: độ chính xác tƣơng đối cao, đa phần hệ thống nhận dạng đều phát triển theo hƣớng tiếp cận này. Nhƣợc điểm: độ phức tạp tính toán cao. Khi ảnh thêm nhiều đối tƣợng khác thì khối lƣợng tính toán tăng lên khá nhiều. 1.4.1.3 Hướng tiếp cận phát hiện biên và Heuristic Ý tƣởng của phƣơng pháp: Áp dụng mặt nạ Sobel để dò tìm cạnh trong ảnh, , kết quả là ảnh chứa tập các cạnh , gọi là G(x, y). Sau đó, áp dụng một số heuristic về biển chỉ dẫn nhƣ kích thƣớc, tỉ lệ chiều cao/chiều rộng, hoặc sử dụng một cửa sổ di chuyển trên toàn bộ G(x, y) để tìm ra các vùng có số cạnh thoã điều kiện. Ƣu điểm: Không lệ thuộc vào ảnh đầu vào. Nhƣợc điểm: Chi phí tính toán cao nếu không giải quyết tốt giai đoạn tìm cạnh , và đòi hỏi những heuristic đƣa vào phải qua thƣc nghiệm kiểm chứng hoặc do các chuyên gia cung cấp. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA 1.4.1.4 Hướng tiếp cận thủ công Ý tƣởng chính của phƣơng pháp: Áp dụng thao tác của ngƣời dùng, vẽ khung trên ảnh, với điều kiện khung đó nằm trên biển chỉ dẫn. Ƣu điểm: Nhanh, gọn, thích hợp cho ứng dụng này khi ngƣời dùng cần dịch những chổ không hiểu, tránh nhập nhằng trong việc nhận dạng bảng chỉ dẫn, chi phí tính toán không cao. Nhƣợc điểm: Ngƣời dùng vẽ không chính xác vùng biển hoặc biển có độ nghiêng và độ lệch cao. 1.4.2 Một số hƣớng giải quyết nhận dạng ký tự Với tên đề tài là “Nhận dạng biển chỉ dẫn và dịch sang tiếng việt bằng PCA” thì cũng đã biết đề tài hƣớng nhận dạng chính của bài luận là dùng giải thuật PCA (phân tích thành phần chính). Thuật toán PCA cùng với nhận dạng bằng phƣơng pháp nơron, máy học SVN đƣợc dùng nhiều trong kỹ thuật nhận dạng. Kỹ thuật PCA đƣợc nhắc nhiều nhất trong nhận dạng khuôn mặt. Với đề tài này sẽ tìm hiểu sâu hơn kỹ thuật PCA trong vấn đề nhận dạng ký tự. Cũng nhƣ đƣa ra đƣợc ƣu và nhƣợc điểm của kỹ thuật PCA trong việc nhận dạng ký tự. 1.4.3 Một số hƣớng giải quyết dịch sang tiếng việt 1.4.3.1 Hướng giải quyết đọc dữ liệu từ file text Ý tƣởng của phƣơng pháp này: Lần đầu tiên chạy chƣơng trình ta load tất cả các dữ liệu từ file text lên lƣu vào một mảng. Sau quá trình nhận dạng ra từ rồi ta dùng vòng lặp để đối chiếu thông tin dữ liệu có trong mảng. Ƣu điểm: Dễ thực hiện. Nhƣợc điểm: Bƣớc đầu chạy chƣơng trình phải load lên hết các dữ liệu từ file. Nếu file chứa dữ liệu lớn thì làm ảnh hƣởng tới chƣơng trình. Làm cho chƣơng trình chạy chậm. Vì đọc file phải dùng vòng lặp và lƣu dữ liệu vào một biến mảng nào đó. Tới giai đoạn dịch thì một lần nữa ta lại sử dụng vòng lặp for để đối chiếu dẫn tới tình trạng chƣơng trình sẽ chạy lâu. Dữ liệu trong file không đúng cú pháp dẫn tới chƣơng trình đọc bị lỗi. 1.4.3.2 Hướng giải quyết kết nối cơ sỡ dữ liệu và thực hiện truy vấn. Ý tƣởng của phƣơng pháp này: Phƣơng pháp này đƣợc sử dụng sau khi đã nhận dạng đƣợc các ký tự, rồi ta thực hiện truy vấn cơ sở dữ liệu để lấy dữ liệu về. Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA Ƣu điểm: Đạt hiệu quả cao, không tốn bộ nhiều bộ nhớ để lƣu hết dữ liệu nhƣ ở đọc dữ liệu từ file. Nhƣợc điểm: Khó thực hiện. Có thể xuất hiện tình trạng mất kết nối tới cơ sở dữ liệu 1.5 HƢỚNG GIẢI QUYẾT CỦA ĐỀ TÀI 1.5.1 Đặc điểm của bảng chỉ dẫn Đƣợc xem qua những bảng chỉ dẫn trên từ hình 2,3,4 chúng ta thấy về kích thƣớc các biển không đồng nhất, không cùng loại. Và cả nền và màu nền và màu sắc của các ký tự trên bảng cũng khác nhau. Với đặc điểm đó ta áp dụng tiếp cận 3 phƣớng pháp tiếp cần vùng, dò biên Hough và phát hiên biên – Heuristic là khó khăn Còn phƣơng pháp cuối là phƣơng pháp bằng phƣơng pháp thủ công, Cũng may là phƣơng pháp này cũng thuận lợi cho việc ngƣời dùng chỉ trích những chổ họ muốn trích từ bảng chỉ dẫn rồi dịch sang đoạn tiếng việt. Phƣơng pháp này rất tối ƣu khi xây dựng trên nền tảng di động. Do bƣớc đầu thực hiện đề tài liên quan đến xử lý và nhận dạng nên chọn làm trên windown application để dễ thực hiện và điều tra độ phức tạp trƣớc khi làm trên ứng dụng di động. 1.5.2 Các bƣớc thực hiện Để nhận dạng bảng chỉ dẫn và dịch sang tiếng việc thì trong báo cáo ta trình bày các bƣớc hƣớng đề tài thực hiện các bƣớc theo thứ tự sau: Bƣớc 1: Ảnh truyền vào máy tính, gọi ảnh đầu vào là F(x,y). Bƣớc 2: Từ ảnh đầu vào ta sử dụng phƣơng pháp hƣớng tiếp cận thủ công để trích từ cần dịch có trên biển chỉ dẫn. Để sử dụng phƣơng pháp này ta dùng chuột để để khoanh vùng cần trích. Bƣớc 3: Tiến hành tách ảnh ký tự trong vùng đã khoanh đƣợc đêm lƣu vào mảng. Tạm gọi mảng đó là mảng A. Để sử dụng phƣơng pháp này ta dùng thƣ viện mã nguồn mở OPENCV và sử dụng hàm của nó và 1 ít đặc điểm của ký tự vào để dễ dàng tách ký tự hơn. Bƣớc 4: Mang từng ảnh ký tự đó thực hiện nhận dạng bằng thuật toán. Thật toán để giải quyết: có rất nhiều thuật toán để giải quyết vấn đề này, nhƣ thuật toán nơron, máy học SVN. Nhƣng bài luận này chủ yếu để nghiên cứu về thuật toán PCA (Phân tích thành phần chính). Ta sẽ tiến hành nhận dạng bằng Đồ án tốt nghiệp Nhận diện bảng chỉ dẫn và dịch sang tiếng việt dùng PCA phƣơng pháp này và nghiên cứu sâu hơn về ƣu điểm và nhƣợc điểm của nó trong nhận dạng ký tự. Bƣớc 5: Ghép các ký tự lại để có đƣợc một từ hoàn chỉnh. Sau khi đã có kết quả từ nhận dạng qua thuật toán PCA đối với từng ký tự ta tiến hành ghép chúng lại để có một từ oàn chỉnh. Bƣớc 6: Thực hiện truy vấn cơ sỡ dữ liệu để dịch nghĩa. Với đặc điểm gọn nhẹ Mysql so với các loại cơ sỡ dữ liệu khác. Với bài này ta chỉ thực hiện trên một bảng nên sử dụng cơ sỡ Mysql là thích hợp nhất. 1.6 MỤC TIÊU VÀ NHIỆM VỤ 1.6.1 Mục tiêu  Xây dựng đƣợc ứng dụng trên visual studio, lập trình với C++.  Xây dựng demo đơn giản về xử lý ảnh.  Cài đặt thuật toán PCA.  Kết nối đƣợc cơ sở dữ liệu.  Tách đƣợc ký tự để mang đi nhận dạng. 1.6.2 Nhiệm vụ  Tìm hiểu về ngôn ngữ lập trình C++.  Tìm hiểu về xử lý ảnh.  Tìm hiểu thuật toán PCA và từng bƣớc cài đặt.  Tìm hiể