Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Ở Việt Nam xử lý ảnh được đưa vào giảng dạy ở bậc đại học khoảng chục năm nay. Việc nghiên cứu, xây dựng và phát triển các ứng dụng về lĩnh vực xử lý ảnh là một vấn đề mới và đang ngày càng được quân tâm nhiều hơn. Đã có một số ứng dụng được xây dựng để xử lý ảnh trong viễn thám, trong y học hay trong an ninh và giám sát v.v.
71 trang |
Chia sẻ: tuandn | Lượt xem: 5791 | Lượt tải: 5
Bạn đang xem trước 20 trang tài liệu Đồ án Lập trình một số bài toán cơ bản trong xử lý ảnh số, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
‘pơMỤC LỤC
DANH MỤC CÁC HÌNH VẼ
Hình 11 Quá trình xử lý ảnh 8
Hình 12 Các giai đoạn chính trong xử lý ảnh 8
Hình 13 Ví dụ về ảnh đen trắng 10
Hình 14 Ví dụ ảnh xám 11
Hình 15 Ví dụ về ảnh màu 12
Hình 16 Lân cận của 1 điểm ảnh 12
Hình 17 Lược đồ xám của ảnh đậm 14
Hình 18 Lược đồ xám ảnh sáng 14
Hình 19 Minh họa ảnh biểu diễn bằng mã loạt dài. 15
Hình 110 Minh họa biểu diễn bằng mã xích 16
Hình 21 Ảnh sau khi tăng độ sáng (c =100) 21
Hình 22 Biểu đồ dãn độ tương phản 22
Hình 23 Ảnh gốc và ảnh kết quả sau khi tăng tương phản 22
Hình 24 Ảnh gốc và ảnh sau khi biến đổi âm bản 23
Hình 25 Ảnh gốc sau khi được tách ngưỡng 24
Hình 26 Minh họa về Histogram của ảnh 25
Hình 27 Minh họa về cân bằng lược đồ xám 26
Hình 28 Tâm mặt nạ và các điểm lân cận 28
Hình 29 Minh họa lọc trung bình không gian 29
Hình 210 Minh họa lọc thông thấp 30
Hình 211 Minh họa lọc thông cao 31
Hình 212 Minh họa lọc ảnh trung vị 32
Hình 213 Các dạng đường biên trong xử lý ảnh 34
Hình 214 Minh họa dò biên sử dụng toán tử Sobel 36
Hình 215 Minh họa dò biên sử dụng toán tử Prewitt 37
Hình 216 Minh họa dò biên sử dụng toán tử La bàn 39
Hình 217 Minh họa dò biên theo kỹ thuật Lalace – H2 40
Hình 218 Minh họa dò biên theo PP gián tiếp 42
Hình 31 Giao diện chính của chương trình 43
Hình 32 Các chức năng con thao tác với File ảnh 44
Hình 33 Form load ảnh 44
Hình 34 Form lưu ảnh sau xử lý 45
Hình 35 Các chức năng con trong chỉnh sửa ảnh 45
Hình 36 Form resize kích thước cho ảnh 46
Hình 37 Chức năng “Xử lý điểm ảnh” 46
Hình 38 Form thay đổi độ tương phản 47
Hình 39 Form thay đổi độ sáng 47
Hình 310 Form phân ngưỡng tạo ảnh đen trắng 48
Hình 311 Form thay đổi màu sắc 48
Hình 312 Chức năng Lọc ảnh 49
Hình 313 Chức năng dò và làm nổi biên ảnh 50
Hình 314 Form nhập ngưỡng khoảng cách màu 50
Hình 315 Chức năng Zoom ảnh 51
DANH MỤC CÁC BẢNG BIỂU
Bảng 11 Cấu trúc một tệp ảnh 18
THÔNG TIN KẾT QUẢ NGHIÊN CỨU
1. Thông tin chung
Tên đề tài:
Lập trình một số bài toán cơ bản trong xử lý ảnh số
Sinh viên thực hiện: Nguyễn Chí Hướng
Lớp: Tin Học Trắc Địa K50
Hệ đào tạo: Chính quy
Điện thoại: 01685.688.585
Email: chihuong.nguyen@gmail.com
Thời gian thực hiện: 2010
2. Mục tiêu
Nghiên cứu tổng quan về lý thuyết xử lý ảnh số (các thành phần của hệ thống xử lý ảnh, các khái niệm và vấn đề liên quan, bộ lọc ảnh, biên ảnh…).
Xây dựng giải thuật một số bài toán cơ bản trong xử lý ảnh số.
Xây dựng chương trình thực nghiệm.
3. Nội dung chính
Chương 1: Giới thiệu chung về xử lý ảnh.
Chương 2: Một số bài toán về xử lý ảnh số (Giới thiệu + Thuật toán).
Chương 3: Xây dựng chương trình thực nghiệm.
4. Kết quả chính đạt được
Có được nền tảng kiến thức về xử lý ảnh số. Từ đó vận dụng nó để xây dựng được thuật toán cho một số bài toán cơ bản trong xử lý ảnh số bằng ngôn ngữ C#.
Xây dựng được chương trình thực nghiệm cho một số bài toán xử lý ảnh số.
MỞ ĐẦU
1. Tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân Đôn đến New York từ những năm 1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Ở Việt Nam xử lý ảnh được đưa vào giảng dạy ở bậc đại học khoảng chục năm nay. Việc nghiên cứu, xây dựng và phát triển các ứng dụng về lĩnh vực xử lý ảnh là một vấn đề mới và đang ngày càng được quân tâm nhiều hơn. Đã có một số ứng dụng được xây dựng để xử lý ảnh trong viễn thám, trong y học hay trong an ninh và giám sát …v.v.
2. Tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài
Trong những năm gần đây, phần cứng máy tính và các thiết bị liên quan đã có sự tiến bộ vượt bậc về tốc độ tính toán, dung lượng chứa, khả năng xử lý v.v.. và giá cả đã giảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là thiết bị chuyên dụng nữa. Khái niệm ảnh số đã trở nên thông dụng với hầu hết mọi người trong xã hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với việc đưa vào máy tính xử lý đã trở nên đơn giản.
Trong hoàn cảnh đó, xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành môn học chuyên ngành của sinh viên ngành công nghệ thông tin trong nhiều trường đại học trên cả nước. Tuy nhiên tài liệu, giáo trình phần lớn tập trung vào lý thuyết, các bài toán cơ bản trong xử lý ảnh số thường được thể hiện dưới dạng công thức toán học, không thể hiện dưới dạng công thức thực dụng để có thể lập trình được.
Vì thế, việc xây dựng thuật toán và lập trình một số bài toán cơ bản trong xử lý ảnh số là rất cần thiết, giúp cho việc nghiên cứu, tìm hiểu về lý thuyết xử lý ảnh số được trực quan, sinh động hơn và dễ tiếp thu hơn.
GIỚI THIỆU CHUNG VỀ XỬ LÝ ẢNH
Tổng quan về hệ thống xử lý ảnh
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.
Hình 11 Quá trình xử lý ảnh
Để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết chúng ta xem xét các bước cần thiết trong xử lý ảnh.
Hình 12 Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera. Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled Device).
Ngoài ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor) hay ảnh, tranh được quét trên scanner.
Tiếp theo là quá trình số hóa (digitalizer) để biến đổi tín hiệu tương tự sang tín hiệu rời rạc(lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trước hết là công việc tăng cường ảnh. Do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu mà ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục ảnh để làm nổi bật một số đặc tính của ảnh,hay làm cho ảnh gần giống với trạng thái gốc – trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính như: biên, phân vùng ảnh, trích chọn các đặc tính, v.v…
Cuối cùng, tùy theo mục đích của ứng dụng mà sẽ là giai đoạn nhận dạng, phân lớp hay các quyết định khác.
Những vấn đề cơ bản trong xử lý ảnh
Những khái niệm liên quan
Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
Mức xám của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm ảnh với một giá trị nguyên dương. Thông thường nó xác định trong khoảng [0...255]. Tùy thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1, 4, 8, 24 hay 32 bit.
Ảnh số
Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một mảng hai chiều I(m,n) với m là số hàng, n là số cột. Ta ký hiệu P(x,y) là một điểm ảnh tại vị trí (x, y). Số lượng điểm ảnh trên mỗi hàng hoặc các hàng xác định độ phân giải của ảnh. Ảnh số được chia làm 3 loại:
Ảnh nhị phân
Giá trị xám của tất các các điểm ảnh chỉ nhận giá trị 1 hoặc 0. Như vậy mỗi điểm ảnh trong ảnh nhị phân được biểu diễn bới 1 bit.
Hình 13 Ví dụ về ảnh đen trắng
Ảnh xám
Giá trị xám nằm trong khoảng 0…255. Như vậy mỗi điểm ảnh trong ảnh nhị xám được biểu diễn bới 1 byte.
Hình 14 Ví dụ ảnh xám
Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G), lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, được viết: (T: trong công thức dưới đây là ký hiệu chuyển vị)
(1.1)
Hình 15 Ví dụ về ảnh màu
Các mối quan hệ cơ bản giữa các điểm ảnh
Lân cận của một điểm ảnh
Một điểm ảnh p tại tọa độ (x, y) có các lân cận theo chiều ngang và chiều dọc là: (x+1, y), (x-1, y), (x,y+1), (x, y-1).
Tập hợp các điểm ảnh trên được gọi là lân cận 4 của p, ký hiệu N4(p). Mỗi điểm ảnh có khoảng cách đơn vị đến (x, y), và nếu (x, y) nằm trên biên của ảnh thì lân cận của nó có thể nằm ngoài ảnh
Các lân cận chéo của p có tọa độ: (x+1, y+1), (x+1, y-1), (x-1, y+1), (x-1, y-1)
Tập lân cận chéo được ký hiệu ND(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p).
Hình 16 Lân cận của 1 điểm ảnh
Liên kết giữa các điểm ảnh
Các mối liên kết được sử dụng để xác định giới hạn (Boundaries) của đối tượng vật thể hoặc xác định vùng trong một ảnh. Một liên kết được đặc trưng bởi tính liền kề giữa các điểm và mức xám của chúng.
Giả sử V là tập các giá trị mức xám. Một ảnh có các giá trị cường độ sáng từ thang mức xám từ 32 đến 64 được mô tả như sau:
V={32, 33, … 63, 64}.
Có 3 loại liên kết:
+ Liên kết 4: Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là liên kết 4 nếu q nằm trong tập N4(p).
+ Liên kết 8: Hai điểm ảnh p và q với các giá trị cường độ sáng V được gọi là liên kết 8 nếu q nằm trong tập N8(p).
+ Liên kết m (liên kết hỗn hợp): Hai điểm ảnh p và q với các giá trị cường độ sáng V được nói là liên kết m nếu: q thuộc N4(p) hoặc q thuộc ND(p).
Lược đồ mức xám (Histogram)
Lược đồ mức xám của ảnh là một hàm cung cấp tuần suất xuất hiện của mỗi mức xám trong ảnh. Lược đồ mức xám được biểu diễn trong hệ tọa độ Decac xOy, trong đó Ox biểu diễn các mức xám của ảnh (256 mức trong trường hợp chúng ta xét), Oy biểu diễn số điểm ảnh cho một mức xám (số điểm ảnh có cùng mức xám).
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám của ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của ảnh cho phép phân tích một khoảng nào đó phân bố phần lớn các mức xám của ảnh: ảnh rất sáng hay rất đậm. Nếu ảnh sáng, lược đồ xám nằm bên phải (mức xám cao), còn ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp).
Hình minh họa cho lược đồ xám:
Hình 17 Lược đồ xám của ảnh đậm
Hình 18 Lược đồ xám ảnh sáng
Biểu diễn ảnh
Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region). Một số phương pháp biểu diễn thường dùng:
Biểu diễn bằng mã chạy (Run-Length Code)
Biểu diễn bằng mã xích (Chaine -Code)
Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh nhị phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
U(m,n) = 1 nếu (m,n) thuộc R
U(m,n) = 0 nếu (m,n) không thuộc R
(1.2)
Trong đó: U(m, n) là hàm mô tả mức xám ảnh tại tọa độ (m, n). Với cách biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1. Giả sử chúng ta mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ (x, y) theo các chiều và đặc tả chỉ đối với giá trị “1”. Khi đó dạng mô tả có thể là: (x, y)r; trong đó (x, y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục theo chiều ngang hoặc dọc.
Hình 19 Minh họa ảnh biểu diễn bằng mã loạt dài.
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá theo số thập phân hoặc số nhị phân thành mã của hướng.
Hình 110 Minh họa biểu diễn bằng mã xích
Theo Hình 19 ta thấy được hướng các điểm biên và mã tương ứng là: A11070110764545432
Biểu diễn bằng mã tứ phân
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bời một hình chữ nhật. Vùng này được chia làm 4 vùng con. Nếu vùng con gồm toàn điểm đen(1) hay toàn điểm trắng (0) thì không cần chia tiếp. Trong trường hợp ngược lại, vùng con gồm cả đen và trắng gọi là vùng xám lại tiếp tục được chia làm 4 vùng con tiếp. Quá trình chia dừng lại khi không thể chia tiếp được nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểm đen hay trắng. Như vậy, cây biểu diễn gồm một chuỗi các kí kiệu b(black), w(white) và g (grey) kèm theo ký hiệu mã hóa 4 vùng con. Biểu diễn theo phương pháp này ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài. Tuy nhiên, để tính toán số đo các hình như chu vi, mo men là khá khó.
Tăng cường ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như:
Lọc nhiễu, hay làm trơn ảnh.
Tăng độ tương phản, điều chỉnh mức xám của ảnh.
Làm nổi biên ảnh.
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số.
Phân vùng ảnh
Để phân tích các đối tượng trong ảnh, chúng ta cần phải phân biệt được các đối tượng cần quan tâm với phần còn lại của ảnh. Những đối tượng này có thể tìm ra được nhờ các kỹ thuật phân vùng ảnh.
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nói đến vùng ảnh là nói đến tính chất bề mặt của ảnh. Nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó : mức xám, màu sắc… Đường bao quanh một vùng ảnh (Boundary) là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Một phương pháp phân vùng ảnh là sử dụng một ngưỡng giá trị xám để phân tách ảnh thành đối tượng và nền (những điểm dưới ngưỡng xám thuộc về nền, ngược lại thuộc về đối tượng).
Trích chọn đặc tính
Dựa trên các thông tin thu nhận được qua quá trình phân vùng, kết hợp với các kỹ thuật xử lý để đưa ra các đặc trưng, đối tượng ảnh cũng như các thông tin cần thiết trong quá trình xử lý.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống.
Nhận dạng ảnh
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức là một dạng) dựa theo những quy luật và mẫu chuẩn.
Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
Nhận dạng theo tham số.
Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơ ron đang được áp dụng và cho kết quả khả quan.
Nén ảnh
Nhằm giảm thiểu không gian lưu trữ của ảnh, nén ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là tiếp cận theo kỹ thuật nén này.
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
Các định dạng ảnh cơ bản
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình xử lý tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPE…). Tuy các định dạng này khác nhau, song chúng đều tuân thủ theo một cấu trúc chung nhất. Nhìn chung, một tệp ảnh bất kỳ thường bao gồm 3 phần:
Mào đầu tệp (Header)
Dữ liệu nén (Data Compression)
Bảng màu (Palette Color)
Bảng 11 Cấu trúc một tệp ảnh
Mào đầu tệp
Là phần chứa các thông tin về kiểu ảnh, kích thước, độ phân giải, số bit dùng cho 1 pixel, cách mã hóa, vị trí bảng màu…
Dữ liệu nén
Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong phần Header.
Bảng màu
Bảng màu không nhất thiết phải có, ví dụ khi ảnh là đen trắng. Nếu có, bảng màu cho biết số màu dùng trong ảnh và bảng màu được sử dụng để hiện thị màu của ảnh.
Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu của các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh Bitmap là tốc độ vẽ và tốc độ xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất cho đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. File Ảnh JPEG là ảnh Bitmap đã được nén lại.
Ảnh GIF (Graphics Interchange Format)
Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được sử dụng tốt nhất cho