Tóm tắt luận án Phát triển kỹ thuật dò biên, phát hiện biên và ứng dụng

Một trong những vấn đềtrọng tâm nghiên cứu của lĩnh vực thịgiác máy là biên và các thaotác trên nó vì các kỹthuật phân đoạn ảnh chủyếu dựa vào biên. Nhìn chung vềmặt toán học, người ta coi điểm biên của ảnh là điểm có sựthay đổi đột ngột về độxám. Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh. Ví dụ, trong một ảnh nhịphân, một điểm có thể gọi là biên nếu đó là điểm đen và có ít nhất một điểm trắng bên cạnh. Việc nhận dạng đối tượng phụthuộc nhiều vào các đặc trưng trích chọn và các đặc trưng này chủyếu được trích chọn từbiên. Đây là một đềtài vẫn đang được quan tâm và phát triển. Nhất là, ởViệt Nam hiện nay, chưa có nhiều nghiên cứu vềvấn đềnhận dạng các đối tượng ảnh, mặc dù những ứng dụng thực tế đang đòi hỏi có những cách giải quyết cụthể, chẳng hạn như phần mềm nhận dạng các đối tượng địa lý, các biểu tượng trên bản đồ, phần mềm phát hiện và đếm các đối tượng chuyển động.

pdf14 trang | Chia sẻ: tuandn | Lượt xem: 2213 | Lượt tải: 3download
Bạn đang xem nội dung tài liệu Tóm tắt luận án Phát triển kỹ thuật dò biên, phát hiện biên và ứng dụng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Chương 3: Ứng dụng 3.1. TÌM XƯƠNG DỰA TRÊN LÀM MẢNH Thực chất của quá trình làm mảnh là việc xoá dần các biên theo một thứ tự và một điều kiện xoá nào đó để thu được xương của đối tượng. Hình 3.1: Minh hoạ quá trình làm mảnh Thuật toán làm mảnh tổng quát bao gồm các bước cơ bản sau: Bước 1: Dò biên theo thuật toán dò biên cải tiến trên. Bước 2: Với mỗi đường biên. Kiểm tra điểm biên nếu thỏa mãn điều kiện xoá thì xóa đi. Bước 3: Nếu không còn điểm biên nào được đánh dấu xoá thì dừng, ngược lại thì quay lại bước 1. a) Ảnh gốc b) Ảnh xương (sau làm mảnh) Hình 3.2: Một số đặc tính không mong muốn của xương Sự khác biệt của thuật toán chính là điều kiện xóa, với điều kiện xóa khác nhau sẽ cho ta các thuật toán làm mảnh khác nhau. Hình 3.2 minh họa ảnh xương khá tốt nhưng vẫn có một số đặc điểm không mong muốn khi sử dụng một thuật toán cụ thể. Trên cơ sở nghiên cứu một số ngoại lệ của các thuật toán làm mảnh với mục đích sử dụng được những ưu điểm của thuật toán làm mảnh cụ thể nào đó và khắc phục những nhược điểm của nó. Chúng tôi đề nghị bổ sung thêm phần thông tin khai báo trước cho mỗi thuật toán cần đảm bảo và bổ sung thêm điều kiện xóa cho thuật toán khi cài đặt. Thuật toán làm mảnh gồm các bước sau: Bước 1: Dò biên theo thuật toán dò biên đã được cải tiến trong mục 2.1 nhằm phát hiện tất cả các đường biên của đối tượng. Bước 2: Với mỗi đường biên. Kiểm tra tính thỏa mãn của điểm biên theo các thông tin khai báo trước và kiểm tra điều kiện xoá của thuật toán nếu thỏa mãn thì điểm biên được xóa đi. Bước 3: Nếu không còn điểm biên nào được đánh dấu xoá thì dừng, ngược lại thì quay lại Bước 1. *Một số thông tin khai báo trước cơ bản a) Điều kiện đảm bảo tính liên thông Ta đã biết một điểm ảnh là điểm liên thông khi ít nhất 2 điểm nền không gần nhau trong 8-láng giềng. Hình 3.3: Điểm đảm bảo liên thông Thuật toán gặp phải một ngoại lệ đó là khi độ dầy của đối tượng là 2 trên một đường biên. Khi đó, điều kiện liên thông bị phá vỡ, 2 điểm biên sẽ bị xoá, làm cho đối tượng không còn liên thông nữa. Để giải quyết ngoại lệ này cần kiểm tra khi nào đối tượng có độ dầy 2 thì xoá luôn điểm đang xét. a) Độ dầy 2 phải-trái b) Độ dầy 2 trên-dưới Hình 3.4: Độ đầy 2 của đối tượng b) Điều kiện đảm bảo xương có dạng mảnh Một điểm biên được gọi là điểm xương dạng mảnh nếu thoả mãn: • Điểm cuối góc là điểm cuối và chỉ có 1 láng giềng 8. • Điểm cô lập là điểm không có láng giềng nào. ; • Điểm cuối của đường thẳng là điểm cuối và chỉ có 1 láng giềng 4. • Điểm liên kết là điểm mà khi ta bỏ nó đi thì mất tính liên thông. 1 Áp dụng tiêu chuẩn này kết hợp với thuật toán tìm xương dựa trên làm mảnh theo điều kiện xoá của các thuật toán đã biết để thu được xương có dạng mảnh mà vẫn đảm bảo tính liên thông. Kết quả thực nghiệm cho thấy chất lượng làm mảnh tốt, đặc biệt là không bỏ đi những đối tượng có kính thước đều, thông thường sẽ bị làm mảnh thành một điểm và bị xóa đi. a) Ảnh gốc b) Làm mảnh không có thông tin khai báo trước c) Làm mảnh với thông tin khai báo trước Hình 3.5: Xương dạng mảnh đảm bảo một số tiêu chuẩn đề ra Hình 3.5a là ảnh gốc. Hình 3.5b là ảnh làm mảnh thông thường, các đường chấm nét bị làm mảnh thành một điểm và bị xóa đi. Hình 3.5c là ảnh kết quả thực hiện việc làm mảnh với thông tin khai báo ràng buộc trước, các đường nét chấm được làm mảnh và vẫn giữ được các chấm điểm. 3.2. PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN DỰA VÀO CHU TUYẾN Hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán phát hiện góc nghiêng như một bước đầu tiên và tất yếu. Dựa vào tính chất mỗi đối tượng ảnh có duy nhất một chu tuyến ngoài và quan niệm con người nhận ra độ nghiêng của văn bản dựa vào cỡ chữ chiếm chủ đạo trong văn bản. Việc xác định góc nghiêng văn bản được xác định nhờ phép biến đổi Hough cho những điểm giữa đáy của hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh cho các đối tượng ảnh có kích thước chủ đạo. 3.2.1. Tính toán kích thước chủ đạo của các đối tượng ảnh Áp dụng biến đổi Hough cho những điểm giữa đáy của các hình chữ nhật ngoại tiếp các đối tượng có kích thước chủ đạo trong ảnh. Xác định được các hình chữ nhật ngoại tiếp các đối tượng hay nói cách khác là xác định biên các đối tượng. 2 Hình 3.6: Các hình chữ nhật ngoại tiếp đối tượng ảnh Ở đây, ta dùng thuật toán dò biên đã được cải tiến trong chương 2 để xác định biên cho các đối tượng trong ảnh văn bản. Hình chữ nhật ngoại tiếp đối tượng sẽ được xác định ngay sau khi dò được biên cho đối tượng đó. Dùng biến đổi Hough áp dụng lên đáy của các hình chữ nhật ngoại tiếp các đối tượng này và ước lượng góc nghiêng cho văn bản sau khi đã loại bớt đi một số đối tượng bằng các ngưỡng kích thước. 3 y x.cosϕ+y.sinϕ = r1 ϕ Hough[ϕ][r1] = 3 x 0 x.cosϕ+y.sinϕ = r2 Hough[ϕ][r1] = 4 Hình 3.7: Ví dụ về một ảnh văn bản nghiêng với nhiều loại đối tượng 3.2.2. Biến đổi Hough và phát hiện góc nghiêng văn bản 3.2.2.1. Đường thẳng Hough trong tọa độ cực Trong tọa độ cực, mỗi điểm (x,y) trong mặt phẳng được biểu diễn bởi cặp (r,ϕ), và mỗi đường thẳng trong mặt phẳng cách gốc tọa độ r và tạo với hoành độ góc ϕ được đặc trưng bởi một cặp (r,ϕ). Hình 3.8: Đường thẳng Hough trong toạ độ cực 3.2.2.2. Áp dụng biến đổi Hough trong phát hiện góc nghiêng văn bản Áp dụng biến đổi Hough trong phát hiện góc nghiêng văn bản bằng cách dùng một mảng tích luỹ đếm số điểm ảnh nằm trên một đường thẳng trong không gian ảnh. Sau đó tính tổng số điểm ảnh nằm trên những đường thẳng song song nhau theo các góc lệch thay đổi. Góc nghiêng văn bản tương ứng với góc có tổng giá trị mảng tích luỹ cực đại. Hình 3.9. Biến đổi Hough phát hiện góc nghiêng ϕ y 0 H x x.cosr ϕ+y.sinϕ=r 3.2.2.3. Thuật toán phát hiện và hiệu chỉnh góc nghiêng văn bản a) Xử lý ngoại lệ Sau giai đoạn tiền xử lý ảnh ta thu được ảnh trung gian TempImage. Thuật toán phát hiện góc nghiêng sẽ làm việc với ảnh trung gian này để tìm ra góc nghiêng cho văn bản và sau đó dùng thuật toán quay ảnh để quay ảnh ban đầu với góc nghiêng vừa tìm được. Ảnh có quá ít ký tự Hình 3.10: Ví dụ về một ảnh nghiêng có ít ký tự chữ cái Các đối tượng bao nhau Phải nhận ra được sự bao hàm giữa các đối tượng và tách, lấy được các đối tượng ký tự bị bao bởi các đối tượng lớn hơn. Hình 3.11: Ví dụ về văn bản nghiêng có các đối tượng chứa nhau b) Thuật toán phát hiện góc nghiêng văn bản dựa vào biên Giả sử ảnh đầu vào là ảnh màu Image. Thuật toán phát hiện và chỉnh sửa góc nghiêng văn bản được thực hiện theo các bước chính sau: Bước 1: Tiền xử lý ảnh màu Image được ảnh trung gian TempImage Bước 2: Xác định chu tuyến ngoài cho các đối tượng: Bước 3: Dùng mảng Rec[N] xác định các giá trị ngưỡng trung bình WidAvr, HeiAvr và PrmAvr. Bước 4: Ápdụng biến đổi Hough Bước 5: Dùng mảng kết quả Hough[360][Dis] ước lượng góc nghiêng ϕ. Bước 6: Quay lại ảnh Image với góc lệch ϕ vừa xác định được từ bước 5. Kết quả thử nghiệm đã chứng minh tính chính xác của thuật toán và khả năng làm việc với nhiều loại văn bản khác nhau có các góc lệch khác nhau. 4 a) Một ảnh văn bản nhiều màu và có góc nghiêng và ảnh kết quả sau khi sửa nghiêng b) Một ảnh bản đồ có ít ký tự nghiêng góc và ảnh kết quả sau khi sửa nghiêng Hình 3.12: Một số loại ảnh màu mà thuật toán thực hiện hiệu chỉnh 3.3. MỘT THUẬT TOÁN CẮT CHỮ IN DÍNH Ở MỨC TỪ DỰA VÀO CHU TUYẾN 3.3.1. Đặt vấn đề Điểm mấu chốt của vấn đề nhận dạng chữ in nói chung và chữ Việt in nói riêng là phải cô lập được chúng. Việc cô lập các chữ được tiến hành sau khi tiến hành phân tích trang để tách các khối, từ các khối tách ra các dòng, từ các dòng tách ra các từ và các từ tách ra các ký tự. Hình 3.13: Ví dụ về chữ Việt in bị dính và bị chèn Hình trên là một số ví dụ về kí tự chữ Việt in bị dính và bị chèn mà phần mềm VnDOCR(*) phiên bản 2.0 sử dụng phép cắt theo VPP nên phép cắt không chính xác. Nguyên do, vì đối với những chữ chất lượng xấu như thế này, những chỗ dính có diện tích tiếp xúc còn lớn hơn cả diện tích tiếp xúc của các phần của một chữ. Xuất phát từ hoàn cảnh đó trong mục này trình bày một kỹ thuật cắt chữ Việt in dính nhờ việc sử dụng các tính chất của chu tuyến và vị trí tương hỗ giữa chúng với đối tượng trực tiếp là các chữ in dính mà phần mềm VnDOCR2.0 sau khi sử dụng phương pháp cắt chữ VPP không cắt được. 3.3.2. Một số khái niệm cơ bản Cặp điểm thắt: Là cặp điểm nằm trên chu tuyến ngoài của một từ hay một cụm chữ dính mà khoảng cách giữa chúng nhỏ hơn nhiều so với khoảng cách dọc theo chu tuyến giữa chúng. (*) Phần mềm đoạt giải nhất “Sáng tạo khoa học kỹ thuật Việt Nam” (giải VIFOTECH trước đây) năm 1999. 5 Ng ng th t (L): Là t s kho ng cách t i a gi a 2 i m d c theo chu tuy n và kho ng cách gi a chúng trong c p i m thu c chu tuy n ang xét coi là c p i m th t. Ng ng quét (S): Là s i m cách i m ang xét v hai phía trên ng i ang xét. M t c t (M): Là kho ng cách t ng i gi a 2 c p i m th t li n nhau v 2 phía. Trong m t t có th có nhi u i m th t và các i m th t ó có th r t g n nhau (cách nhau kho ng 1,2,3,5,6 pixel) i u này làm cho nét c t s không m nh vì v y c n ph i có kho ng cách gi a các i m th t. Ví d : Khi M = 0 thì ch ng trình s nh n ra 1 lo t các i m th t và a ra các quy t nh c t nh trong hình 3.14.b Khi M= 5 thì ch ng trình a ra quy t nh c t nh trong hình 3.14.c c) a) M=5 ng c t M=0 T p ng c t b) Hình 3.14: Ví d v ng c t và m t c t 3.3.3. Thu t toán c t ch in dính d a vào chu tuy n 3.3.3.1. Phân tích bài toán Ý t ng chính v vi c c t ch in dính là “g n nhà, xa ngõ”, d a vào các c i m c a các c p i m th t ra quy t nh c t. V i m i m t t hay m t c m ch dính, tr c tiên ta ti n hành tách ra các chu tuy n, sau ó d a vào chu tuy n ngoài, tìm ra các c p i m th t. Trong các nghiên c u tr c các tác gi ã ch ra r ng m i i t ng nh, ây là m t t hay m t c m ch dính, t n t i duy nh t m t chu tuy n ngoài. Ch tr c khi dò biên Ch sau khi dò biên Chu tuy n trong Chu tuy n ngoài Quá trình tìm c p i m th t i m ang xét i m phân n a trên và n a d i chu tuy n ngoài Hình 3. 15. Quá trình tìm chu tuy n và c p i m xét duy t a) C m ch dính b) Các c p i m th t tìm c c) Các c p i m c t sau khi tính t i v trí t ng h c a chu tuy n trong Hình 3.16. Th c hi n c t ch in dính có tính n v trí t ng h c a chu tuy n trong N a chu tuy n d i N a chu tuy n trên 6 3.3.3.2. Thuật toán cắt chữ dính dựa vào chu tuyến Thuật toán cắt chữ in dính dựa vào chu tuyến được đặc tả bằng ngôn ngữ RAISE. Trong số gần 90 cụm từ mà VnDOCR không cắt được, chúng tôi đã cho áp dụng kỹ thuật cắt chữ này và đã cắt được hơn 80 cụm chữ dính. Điều đó mở ra khả năng tích hợp của kỹ thuật với các phương pháp VPP và VH truyền thống. 3.4. PHÁT HIỆN ĐỐI TƯỢNG CHUYỂN ĐỘNG 3.4.1. Phát hiện đối tượng chuyển động dựa theo hướng tiếp cận trừ khung hình liên kề Các khung hình được lấy từ tệp ảnh động video có dạng RGB 24 bit, và được chuyển sang ảnh cấp sáng 256 màu (8 bit). Chúng ta gọi khung hình hiện thời là Ic, khung hình liền trước Ip. Khung hình Igc, Igp cùng là ảnh xám 256 màu. Tiếp theo, Igc, Igp được trừ theo từng điểm ảnh, và được so sánh với ngưỡng. Nếu giá trị tuyệt đối nhỏ hơn giá trị ngưỡng thì coi là điểm giống nhau, ngược lại coi là khác nhau. Iwb là ảnh đen trắng thể hiện vùng khác nhau giữa 2 khung hình, những điểm khác nhau sẽ có màu trắng, ngược lại có màu đen. Các hình 3.17, hình 3.18, và hình 3.19 minh họa của kỹ thuật trừ ảnh liền kề với ngưỡng được đặt là 20, với những khung hình sai khác nhau ít sẽ làm cho ảnh Iwb có màu đen (Ic, Ip có độ giống nhau lớn), còn với những khung hình có độ khác nhau đáng kể, thì ngoài những đối tượng chuyển động, còn có nhiễu (do sự tương phản, thời tiết...). Vì vậy, với kỹ thuật trừ khung hình liền kề có thể làm cho quá trình bám đối tượng chuyển động bị mất đi (vì có thể có 2 khung hình có độ khác nhau không đáng kể). Với kỹ thuật trừ khung hình liền kề chúng ta có được nhận xét sau: • Chưa tối ưu được quá trình xử lý, vì phải xử lý tất cả khung hình có trong đoạn video mặc dù chúng không có sự thay đổi (các đối tượng không chuyển động). • Thu được những thay đổi nhỏ đối với những đối tượng có chuyển động chậm và có thể là không phân biệt được vì thay đổi ít, vì vậy mà khó có thể lấy được toàn bộ đối tượng chuyển động. • Chứa nhiều nhiễu, do thời tiết, độ tương phản, độ bóng làm thay đổi giá trị màu ở những vùng không chuyển động. Vì vậy, chúng ta sẽ không thực hiện trừ khung hình liền kề để phát hiện đối tượng. Dưới đây chúng ta sẽ xem xét một hướng tiếp cận kết hợp: kỹ thuật trừ khung hình, đo độ thay đổi, xét vị trí và kỹ thuật dò biên ảnh đa cấp xám để nâng cao hiệu quả phát hiện đối tượng chuyển động. 3.4.2. Phát hiện đối tượng chuyển động theo hướng tiếp cận kết hợp Đây cũng là một hướng tiếp cận dựa trên kỹ thuật trừ ảnh, độ đo tương tự, xét vị trí tương đối giữa các vùng thay đổi giá trị màu ở các khung hình, phát hiện biên ảnh đa cấp xám. 7 Dưới đây là bước thực hiện của thuật toán phát hiện đối tượng chuyển động theo hướng tiếp cận kết hợp. Bước 1 : Trừ ảnh và đánh dấu Iwb Bước 2 : Lọc nhiễu trên ảnh Iwb, phát hiện độ dịch chuyển Bước 3 : Phát hiện biên Igc Bước 4 : Kết hợp Igc với Iwb 3.4.2.1. Trừ ảnh và đánh dấu Iwb Đây là bước phát hiện vùng khác biệt dựa trên kỹ thuật trừ điểm ảnh, giá trị ngưỡng đặt bằng 20. Tiến hành trừ từng điểm ảnh của Igc với Igp. 3.4.2.2. Lọc nhiễu và phát hiện độ dịch chuyển Đây là bước để hạn chế được các vùng đốm dựa theo cửa sổ lọc nhiễu được chọn là 5x5, 3x3 và vị trí thay đổi của vùng ảnh. Một tập Iwb được xử lý để lấy được vị trí của vùng sáng. Nếu vị trí của vùng sáng thay đổi nhỏ hơn một giá trị ngưỡng thì được coi là nhiễu, và lập tức được dập tắt. Kết quả chúng ta có được ảnh đen trắng Iwb được lọc. Vùng sáng có độ lớn 1 điểm ảnh sẽ được dập tắt bởi cửa sổ 3x3. c) Ảnh chưa lọc nhiễu d) Ảnh đã lọc ễ a) Ip b) Ic Hình 3.20: a), b) là 2 khung hình có độ sai khác thỏa mãn ngưỡng, c) Ảnh Iwb chưa lọc nhiễu, d) là ảnh Iwb sau khi lọc nhiễu 3.4.2.3. Phát hiện biên ảnh cấp xám Igc Trong quá trình này, ảnh Igc được phát hiện biên dựa theo kỹ thuật phát hiện biên trình bày trong mục 2.2. 8 a) Ic b) Igc c) Iec Hình 3.21: a) Ảnh gốc, b) Ảnh cấp xám, c) Ảnh biên 3.4.2.4. Kết hợp ảnh Igc với Iwb Ảnh sau khi đã được phát hiện biên Iec được xếp chồng với ảnh đen trắng Iwb. Vùng đen trắng kết hợp với điểm biên sẽ cho ta được tập hợp các điểm bao quanh vùng chuyển động. Những điểm biên của Iec gần với vùng trắng của Iwb được đánh dấu lại trên Igc. Những điểm được lưu lại sẽ được xử lý để lấy được hình bao quanh đối tượng chuyển động đó. Và quá trình phát hiện được vùng biên của đối tượng chuyển động kết thúc. 3.3.3. Thử nghiệm Trong phần này, trình bày một số hình ảnh kết quả đạt theo hướng tiếp cận kết hợp. Đoạn băng video có dạng avi, được quay tại ngã ba Bắc Nam thành phố Thái Nguyên. Đoạn băng có độ lớn 14,01 MB. Dưới đây là một số hình ảnh thu được. 3.5. KẾT LUẬN VÀ VẤN ĐỀ NGHIÊN CỨU Chương này đã trình bày một số ứng dụng cơ bản dựa trên các thuật toán phát hiện biên được trình bày trong chương 2, cụ thể: • Trình bày một cách tiếp cận trong việc cài đặt thuật toán làm mảnh dựa theo biên thông qua việc bổ sung phần thông tin khai báo trước cho mỗi thuật toán. Nhờ đó có thể phát huy được những ưu điểm của các thuật toán đã có và hạn chế được những nhược điểm của nó. • Đề xuất thuật toán phát hiện góc nghiêng văn bản một cách thông minh thông qua việc tính toán kích thước chủ đạo của các đối tượng ảnh trong văn bản thông qua kỹ thuật tính biểu đồ tần xuất kích thước hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh được xác định trong quá trình dò biên. • Đề xuất một thuật toán cắt chữ Việt in dính nhờ việc sử dụng tính chất của đường biên và vị trí tương hỗ giữa chúng. Việc sử dụng tính chất của chu tuyến, vị trí tương hỗ giữa chúng và một số tính chất khác liên quan trong việc cắt chữ dính tỏ ra khá hiệu quả đối lớp các chữ Việt in dính đã được áp dụng các phương pháp truyền thống. • Đưa ra hướng tiếp cận kết hợp dựa hai kỹ thuật chủ yếu là: kỹ thuật trừ ảnh và kỹ thuật phát hiện biên để giải quyết bài toán phát hiện đối tượng chuyển động. 9 Phần kết luận Luận án gồm 108 trang được viết dựa trên 9 bài báo đã tập trung nghiên cứu một số phương pháp phát hiện biên, các kỹ thuật để nâng cao chất lượng biểu diễn biên và ứng dụng của biên trong xử lý ảnh với các kết quả đạt được như sau: 1. Đề xuất một cải tiến cho thuật toán dò biên trên cơ sở nghiên cứu các ngoại lệ và tìm cách khắc phục. Dựa vào cải tiến này, luận án đã trình một đề xuất xử lý các thuật toán làm mảnh dựa vào biên. 2. Đưa ra một mối liên hệ mới của phép toán giãn nở trên cơ sở đó chứng minh một cách chặt chẽ về mặt toán học cho các tính chất của các phép toán hình thái. Các phép toán có nhiều ứng dụng trong nhận dạng và xử lý ảnh. Trên cơ sở đó đề xuất một thuật toán phát hiện biên mới dựa vào các phép toán hình thái. 3. Đề xuất một thuật toán phát hiện biên dựa vào trung bình cục bộ. Thuật toán vừa có tính chất của thuật toán phát hiện biên gián tiếp lại vừa có tính chất của phát hiện biên trực tiếp. Do đó, về mặt nào đó đã phát huy được cả 2 ưu điểm của các phương pháp phát hiện biên truyền thống. 4. Đề xuất thuật toán phát hiện góc nghiêng văn bản một cách thông minh thông qua việc tính toán kích thước chủ đạo của các đối tượng ảnh trong văn bản thông qua kỹ thuật tính biểu đồ tần xuất kích thước hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh được xác định trong quá trình dò biên. 5. Đề xuất một thuật toán cắt chữ Việt in dính nhờ việc sử dụng tính chất của đường biên và vị trí tương hỗ giữa chúng. Việc sử dụng tính chất của chu tuyến, vị trí tương hỗ giữa chúng và một số tính chất khác liên quan trong việc cắt chữ dính tỏ ra khá hiệu quả hơn đối với lớp các chữ Việt in dính đã được áp dụng các phương pháp truyền thống. 6. Đưa ra hướng tiếp cận kết hợp dựa trên kỹ thuật trừ ảnh và kỹ thuật phát hiện biên để giải quyết bài toán phát hiện đối tượng chuyển động. Vấn đề có thể nghiên cứu tiếp tục: • Nghiên cứu sự chồng lấn giữa các đối tượng nhằm phát hiện ra các đường biên bị che khuất hoặc tiếp giáp. • Nghiên cứu phát hiện chuyển động của đối tượng dẫn đến hiểu hành vi của đối tượng làm cơ sở trong bài toán giám sát tự động. • Nghiên cứu ứng dụng xử lý biên trong y học như: đếm số hồng cầu trong máu, phân loại ảnh X-quang v.v.. 10 Danh mục công trình công bố 1- Phạm Việt Bình (2006), “Một tiếp cận mới trong phát hiện biên dựa vào các phép toán hình thái”, Kỷ yếu Hội thảo Quốc gia lần thứ 8 - Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Hải Phòng 25-27/08 /2005, Nxb KH&KT, Hà Nội 2006, 82-91. 2- Phạm Việt Bình, Cao Lê Mạnh Hà, Đỗ Năng Toàn (2006), “Một cách tiếp cận mới trong phát hiện biên của ảnh đa cấp xám”, Kỷ yếu Hội thảo Quốc gia lần thứ 8 - Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Hải Phòng 25- 27/08 /2005, Nxb KH&KT, Hà Nội 2006, 92-102 3- Phạm Việt Bình, Ngô Mạnh Hùng, Đỗ Năng Toàn (2006), “Một cải tiến thuật toán dò biên và ứng dụng trong làm mảnh đối tượng”, Kỷ yếu Hội thảo Khoa học Quốc gia lần thứ 2 - nghiên cứu cơ bản và ứng dụng Công nghệ Thông tin-FAIR’05, TP Hồ Chí Minh 23-24/09/2005, Nxb KH&KT, Hà Nội 2006, 474-482. 4- Đỗ Năng Toàn, Phạm Việt Bình, Vũ Thành Vinh (2005), “Kỹ thuật cắt chữ in dính ở mức từ thông qua thực nghiệm”, Kỷ yếu Hội thảo Quốc gia lần thứ 6 - Một số vấn đề chọn lọc của Công nghệ Thông tin và Truyền thông, Thái Nguyên 29- 31/08/2003, Nxb KH&KT, Hà Nội 2005, 48-55. 5- Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến trong phát hiện góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần t

Các file đính kèm theo tài liệu này:

  • pdfchuong_3.pdf
  • pdfchuong_1_va_2.pdf