Phương pháp phân tích ảnh bằng wavelet

TỔNG QUAN KỸ THUẬT NÉN ẢNH Giới thiệu chung về nén ảnh số. Các kỹ thuật nén có tổn hao. CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET Các phép biến đổi Wavelet. Tính chất của biến đổi Wavelet. NÉN ẢNH BẰNG WAVELET Sơ đồ khối tổng quát. Biến đổi Wavelet. Tính toán năng lượng tiêu hao. Thuật toán nén ảnh bằng Wavelet hiệu năng EEW. CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET-JPEG2000 Các bước thực hiện nén ảnh theo chuẩn JPEG2000.

ppt28 trang | Chia sẻ: lvbuiluyen | Lượt xem: 4458 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Phương pháp phân tích ảnh bằng wavelet, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA QUỐC TẾ VÀ ĐÀO TẠO SAU ĐẠI HỌC ********** @ ********** TIỂU LUẬN MÔN: XỬ LÝ SỐ TÍN HIỆU PHƯƠNG PHÁP PHÂN TÍCH ẢNH BẰNG WAVELET GVHD: TS NGUYỄN NGỌC MINH NHÓM HỌC VIÊN: NỘI DUNG TỔNG QUAN KỸ THUẬT NÉN ẢNH Giới thiệu chung về nén ảnh số. Các kỹ thuật nén có tổn hao. CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET Các phép biến đổi Wavelet. Tính chất của biến đổi Wavelet. NÉN ẢNH BẰNG WAVELET Sơ đồ khối tổng quát. Biến đổi Wavelet. Tính toán năng lượng tiêu hao. Thuật toán nén ảnh bằng Wavelet hiệu năng EEW. CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET-JPEG2000 Các bước thực hiện nén ảnh theo chuẩn JPEG2000. TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.1 Giới thiệu chung về nén ảnh số Khái niệm nén ảnh số Mục đích nén ảnh số Các kỹ thuật nén ảnh số Tóm tắt quá trình nén và giải nén ảnh số - Phía phát: Dùng bộ mã hóa (Encoder) phân ly ảnh thành các băng con, lấy mẫu xuống theo hệ số 2. - Phía thu: Dùng bộ giải mã (Decoder),lấy mẫu lên hệ số 2 sau đó tổng hợp các băng con. - Một trong các phương pháp mã hoá băng con đó là áp dụng sự phân ly cây bát phân để phân ly dữ liệu ảnh thành các băng tần khác nhau. TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa băng con (Subband coding) + Phép biến đổi cosine rời rạc – DCT : Biến đổi thông tin ảnh từ miền không gian sang miền tần số để có thể biểu diễn dưới dạng gọn hơn. Biến đổi Fourier – FT: Biến đổi Fourier – FT (Fourier Transform) là một phép biến đổi thuận nghịch, nó cho phép sự chuyển đổi thuận – nghịch giữa thông tin gốc (miền không gian hoặc thời gian) Hạn chế: Thông tin về thời gian xuất hiện của phổ trong tín hiệu là cần thiết, thì phép biến đổi FT không có khả năng đáp ứng được yêu cầu này TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi - Nén và giải nén ảnh dựa theo phép biến đổi DCT trong JPEG JPEG là chuẩn nén số quốc tế đầu tiên cho các ảnh tĩnh có tông màu liên tục gồm cả ảnh đơn sắc và ảnh màu. Trong kỹ thuật này các khối ảnh kích thước 8x8 được áp dụng để thực hiện DCT, sau đó lượng tử hoá các hệ số rồi mã hoá entropy sau lượng tử. Đối với những ảnh màu RGB, để áp dụng kỹ thuật nén này, trước hết phải chuyển sang chế độ màu YUV (Y là thành phần chói, U và V là 2 thành phần màu). TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi - Sơ đồ khối bộ nén ảnh dựa theo phép biến đổi DCT trong JPEG Sắp xếp Zigzag các hệ số DCT ở bộ mã hoá TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi - Sơ đồ khối bộ giải nén ảnh dựa theo phép biến đổi DCT trong JPEG TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi + Biến đổi Fourier thời gian ngắn (STFS) - Biến đổi Fourier chỉ thích hợp khi phân tích những tín hiệu ổn định (stationary), khi tín hiệu không ổn định biến đổi Fourier không phân tích được. Để khắc phục những hạn chế của biến đổi FT, người ta dùng phép biến đổi Fourier thời gian ngắn (STFT) - Trong biến đổi STFT, tín hiệu được chia thành các khoảng nhỏ và trong khoảng đó tín hiệu được giả định là tín hiệu ổn định. - Để thực hiện kỹ thuật này cần chọn một hàm cửa sổ w sao cho độ dài của cửa sổ đúng bằng các khoảng tín hiệu phân chia. - Biến đổi STFT đối với tín hiệu liên tục thực được định nghĩa như sau: (t-τ):độ dài thời gian của cửa sổ. Chúng ta có thể dịch chuyển vị trí của cửa sổ bằng cách thay đổi giá trị t và để thu được các đáp ứng tần số khác nhau của đoạn tín hiệu ta thay đổi giá trị τ . TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi + Biến đổi Fourier thời gian ngắn (STFS) - Nguyên lý bất định Heissenber, nguyên lý này phát biểu là: Không thể biết được chính xác được biểu diễn thời gian - tần số của một tín hiệu (hay không thể biết các thành phần phổ của tín hiệu ở một thời điểm nhất định) - Hay nói cách khác: - Cửa sổ hẹp -> phân giải thời gian tốt, phân giải tần số kém - Cửa sổ rộng -> phân giải tần số tốt, phân giải thời gian kém TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi Biến đổi Wavelet (DWT) - Wavelet là phép biến đổi được sử dụng để phân tích các tín hiệu không ổn định (non-stationary) – là những tín hiệu có đáp ứng tần số thay đổi theo thời gian. - Bước này có thể hiểu phép biến đổi DWT như là áp dụng một tập các bộ lọc thông cao và thông thấp. Thiết kế các bộ lọc này tương đương như kỹ thuật mã hoá băng con (subband coding) nghĩa là: chỉ cần thiết kế các bộ lọc thông thấp, còn các bộ lọc thông cao chính là các bộ lọc thông thấp dịch pha đi một góc 180 độ. Tuy nhiên khác với mã hoá băng con, các bộ lọc trong DWT được thiết kế phải có đáp ứng phổ phẳng, trơn và trực giao. TỔNG QUAN KỸ THUẬT NÉN ẢNH 1.2 Các kỹ thuật nén có tổn hao Kỹ thuật mã hóa dựa trên phép biến đổi CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET - Biến đổi Wavelet liên tục của một hàm f (t ) được bắt đầu từ một hàm Wavelet mẹ (mother Wavelet) ψ (t ) . Hàm Wavelet mẹ ψ (t ) có thể là bất kỳ một hàm số thực hoặc phức liên tục nào thoả mãn các tính chất sau: + Tích phân suy rộng trên toàn bộ trục t của hàm ψ (t ) là bằng 0. Tức là: +Tích phân năng lượng của hàm trên toàn bộ trục t là một số hữu hạn, tức là: - Có nghĩa là hàm ψ (t ) phải là một hàm bình phương khả tích. 2.1 Các phép biến đổi Wavelet 2.1.1 Biến đổi Wavelet liên tục (Continuous Wavelet Transform-CWT) CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET - Sau khi hàm Wavelet ψ (t ) được lựa chọn, biến đổi Wavelet liên tục của một hàm bình phương khả tích f (t ) được tính theo công thức: - Khi a >1 thì hàm Wavelet sẽ được trải rộng còn khi 0< a <1 thì hàm sẽ được co lại. - Chúng ta có thể xem biến đổi CWT như là một ma trận hai chiều. Các hàng của ma trận tương ứng với các giá trị của a và các cột tương ứng với các giá trị của b 2.1 Các phép biến đổi Wavelet 2.1.1 Biến đổi Wavelet liên tục (Continuous Wavelet Transform-CWT) CƠ SỞ LÝ THUYẾT BIẾN ĐỔI WAVELET - Việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b như sau: - Việc tính toán hệ số của biến đổi Wavelet có thể dễ dàng thực hiện bằng các băng lọc số nhiều nhịp đa kênh. Minh hoạ lưới nhị tố dyadic với các giá trị của m và n 2.1 Các phép biến đổi Wavelet 2.1.2 Biến đổi Wavelet rời rạc NÉN ẢNH BẰNG WAVELET 3.1 Sơ đồ khối tổng quát Sơ đồ khối quá trình nén ảnh bằng Wavelet - Ảnh mẫu được đưa qua một phép biến đổi để tạo thành tập hệ số biến đổi. Các hệ số này tiếp tục được lượng tử hoá (chia cho các giá trị cố định cho trước) để giảm dung lượng dữ liệu. Đầu ra của bước này là một luồng các số nguyên mà mỗi một trọng số đó tương ứng với một chỉ số nhị phân được lượng tử hoá. - Bước cuối cùng là mã hoá: các luồng dữ liệu được chuyển thành chuỗi các từ mã nhị phân (binary symbol) theo cách: các từ mã nhị phân có độ dài ngắn mã hoá cho các số nguyên có xác suất xuất hiện cao. Điều này làm giảm số bít cần truyền. Các nguyên lý mã hoá như vậy là: Huffman và RLC (mã chạy dài). NÉN ẢNH BẰNG WAVELET 3. 2 Biến đổi Wavelet - Phép biến đổi Wavelet thuận sử dụng sự phân ly 1D (một chiều) để chuyển tập các mẫu 1D thành hai băng: băng con thông thấp (Li) và băng con thông cao (Hi). Băng Li là phiên bản có độ phân giải thấp của ảnh gốc được lấy mẫu xuống. Băng Hi biểu thị thông tin dư thừa của ảnh gốc - Quá trình phân ly băng con 2D chỉ là sự mở rộng quá trình phân ly băng con 1D. (a) Biến đổi Wavelet 2D mức 3 và (b) Minh hoạ bằng ảnh “CASTLE” NÉN ẢNH BẰNG WAVELET 3.3 Tính toán năng lượng tiêu hao Để thực hiện biến đổi Wavelet ta chọn bộ lọc có cặp Daubechies 5-tap / 3-tap do những ưu điểm sau của nó như sau: - Kết quả sau bộ lọc Wavelet có chứa thông tin điểm ảnh lân cận và như thế loại bỏ được hiệu ứng khối mà biến đổi DCT gặp phải. - Có tính chất đối xứng và định vị cho phép dễ dàng phát hiện đường viền, tính toán nhanh, ảnh nén có chất lượng cao. - Phương trình của bộ lọc Daubechies 5-tap/3-tap là: - Trong phép phân ly Wavelet thuận sử dụng ở bộ lọc trên, cần 8 phép toán cộng - A(Add) và dịch - S(Shift) để chuyển những điểm ảnh mẫu thành một hệ số thông thấp. Để phân ly thông cao cần 2 phép toán dịch và 4 phép toán cộng. NÉN ẢNH BẰNG WAVELET 3.3 Tính toán năng lượng tiêu hao - Như vậy có 8*S (phép dịch) + 8*A (phép cộng) là tải tính toán cần cho một điểm ảnh trong quá trình phân ly thông thấp và 2S + 4A phép toán cho thông cao. - Tất cả các điểm ảnh ở vị trí chẵn được phân ly thành các hệ số thông thấp và các điểm ảnh ở vị trí lẻ được phân ly thành các hệ số thông cao. Do kích thước của ảnh giảm theo hệ số 4 sau mỗi mức biến đổi, tổng tải tính toán có thể được biểu diễn bằng công thức sau: Tại một mức biến đổi, mỗi điểm ảnh sẽ được đọc hai lần và được ghi hai lần. Do vậy, với cùng một điều kiện cũng như cùng phương pháp đánh giá như trên, tổng tải truy nhập dữ liệu rút ra bằng số các toán tử đọc và ghi. *Tải truy nhập dữ liệu với biến đổi Wavelet thường Năng lượng tính toán tổng được tính bằng tổng trọng số của tải tính toán và tải truy nhập dữ liệu. NÉN ẢNH BẰNG WAVELET 3.4 Thuật toán nén ảnh bằng Wavelet hiệu năng – EEW EEW (Effective Energy Wavelet) - Thuật toán này với mục đích là tiết kiệm năng lượng lớn nhất nhưng chất lượng ảnh tốt nhất. EEW phân bố số học của các hệ số thông cao để loại bỏ một số lượng lớn các mẫu trong quá trình nén ảnh. Phân bố số học các hệ số thông cao sau phép biến đổi Wavelet mức 2 NÉN ẢNH BẰNG WAVELET 3.4 Thuật toán nén ảnh bằng Wavelet hiệu năng – EEW * Hiệu năng của các kỹ thuật loại bỏ - Mỗi ảnh đầu vào được thực hiện phép biến đổi theo hàng rồi đến cột và phân ly ảnh thành bốn băng con (LL, LH, HL, HH). Tuy nhiên, để thực hiện kỹ thuật loại bỏ HH, thì sau khi thực hiện biến đổi theo hàng, các hệ số thông cao chỉ được đưa vào bộ lọc thông thấp mà không được đưa vào bộ lọc thông cao trong bước biến đổi theo cột tiếp theo - Bằng với thuật toán Wavelet chúng ta chỉ tiết kiệm được 1/4 các lần “ghi” (tiết kiệm 25%) CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 Trình tự mã hoá (a) và giải mã JPEG2000 (b) Bước 1: Xử lý trước biến đổi Bước 2: Biến đổi liên thành phần Bước 3: Biến đổi riêng thành phần (biến đổi Wavelet) Bước 4: Lượng tử hoá - Giải lượng tử hoá Bước 5: Mã hoá và kết hợp dòng dữ liệu sau mã hoá CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 Trình tự mã hoá (a) và giải mã JPEG2000 (b) Bước 1: Xử lý trước biến đổi - Do sử dụng biến đổi Wavelet, JPEG2000 cần có dữ liệu ảnh đầu vào ở dạng đối xứng qua 0. Xử lý trước biến đổi chính là giai đoạn đảm bảo dữ liệu đưa vào nén ảnh có dạng trên. Ở phía giải mã, giai đoạn xử lý sau biến đổi sẽ trả lại giá trị gốc ban đầu cho dữ liệu ảnh. CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 4.1 Các bước thực hiện nén ảnh theo chuẩn JPEG2000 Bước 2: Biến đổi liên thành phần Giai đoạn này sẽ loại bỏ tính tương quan giữa các thành phần của ảnh. - JPEG2000 sử dụng hai loại biến đổi liên thành phần là: Biến đổi màu thuận nghịch (RCT ):làm việc với các giá trị nguyên. Biến đổi màu không thuận nghịch (ICT ): làm việc với các giá trị thực. ICT và RCT chuyển dữ liệu ảnh từ không gian màu RGB sang YCrCb. RCT được áp dụng trong cả hai dạng thức nén có tổn hao và không tổn hao, còn ICT chỉ áp dụng cho nén có tổn hao. Các thành phần Cr, Cb có ảnh hưởng rất ít tới sự cảm nhận hình ảnh của mắt trong khi thành phần độ chói Y có ảnh hưởng rất lớn tới ảnh. Minh hoạ ảnh với RGB và YCrCb CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 Bước 3: Biến đổi riêng thành phần (biến đổi Wavelet) - Biến đổi riêng thành phần được áp dụng trong JPEG2000 chính là biến đổi Wavelet. - Do phép biến đổi Wavelet không phải là một phép biến đổi trực giao như biến đổi DCT mà là một phép biến đổi băng con nên các thành phần sẽ được phân chia thành các băng tần số khác nhau và mỗi băng sẽ được mã hóa riêng rẽ. - Việc tính toán biến đổi trong JPEG2000 này sẽ được thực hiện theo phương pháp Lifting. - Sơ đồ của phương pháp Lifting 1D áp dụng trong JPEG2000 trên hình vẽ Phương pháp Lifting 1D dùng tính toán biến đổi Wavelet CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 Bước 4: Lượng tử hoá - Giải lượng tử hoá - Các hệ số của phép biến đổi sẽ được tiến hành lượng tử hoá. - Quá trình lượng tử hoá cho phép đạt tỷ lệ nén cao hơn bằng cách thể hiện các giá trị biến đổi với độ chính xác tương ứng cần thiết với mức chi tiết của ảnh cần nén. - Các hàm lượng tử hoá khác nhau sẽ được áp dụng cho các băng con khác nhau và được thực theo biểu thức: Với Δ là bước lượng tử, U(x,y) là giá trị băng con đầu vào; V(x,y) là giá trị sau lượng tử hoá. - Trong dạng biến đổi nguyên, đặt bước lượng tử bằng 1. - Với dạng biến đổi thực thì bước lượng tử sẽ được chọn tương ứng cho từng băng con riêng rẽ. Bước lượng tử của mỗi băng do đó phải có ở trong dòng bít truyền đi để phía thu có thể giải lượng tử cho ảnh. Công thức giải lượng tử hoá là: - r là một tham số xác định dấu và làm tròn, các giá trị ( U x,y);V(x,y) tương ứng là các giá trị khôi phục và giá trị lượng tử hoá nhận được. JPEG2000 không cho trước r tuy nhiên thường chọn r = 1/2 . CHUẨN NÉN ẢNH TĨNH DỰA TRÊN BIẾN ĐỔI WAVELET- JPEG2000 Bước 5: Mã hoá và kết hợp dòng dữ liệu sau mã hoá - JPEG2000 theo khuyến nghị của uỷ ban JPEG quốc tế có thể sử dụng nhiều phương pháp mã hoá khác nhau cũng như nhiều cách biến đổi Wavelet khác nhau để có thể thu được chất lượng ảnh tương ứng với ứng dụng cần xử lý. Điều này giúp cho JPEG2000 mềm dẻo hơn nhiều so với JPEG. Việc áp dụng các phương pháp mã hoá khác nhau cũng được mở rộng sang lĩnh vực nén ảnh động bằng biến đổi Wavelet. KẾT LUẬN - Bài tiểu luận đã trình bày phân tích ảnh chủ yếu là các kỹ thuật nén ảnh bằng Wavelet, các nguyên lý nén và một số khái niệm quan trọng trong lĩnh vực xử lý ảnh. Nhóm cũng đã tập trung vào trình bày các nguyên lý nén có tổn hao mà điển hình là kỹ thuật nén của chuẩn JPEG2000. - Với mục đích của tiểu luận là nghiên cứu về kỹ thuật nén ảnh sử dụng biến đổi Wavelet từ đó áp dụng trong các dữ liệu đa phương tiện , nên nhóm cũng đã đi sâu nghiên cứu cơ sở lý thuyết của phép biến đổi này đồng thời cũng giới thiệu chuẩn nén ảnh JPEG2000 – là chuẩn nén phổ biến dựa trên biến đổi Wavelet. - Tiểu luận cũng đã giới thiệu một thuật toán nén ảnh bằng Wavelet hiệu năng không chỉ cho hiệu suất nén ảnh cao, chất lượng ảnh truyền đảm bảo do ưu điểm của Wavelet, mà trên hết còn tiết kiệm năng lượng xử lý, năng lượng truyền thông cho ảnh trên mạng. TÀI LIỆU THAM KHẢO 1. TS. Nguyễn Ngọc San: Bài giảng môn học về công cụ toán học cơ sở và lý thuyết hệ thống-xử lý tín hiệu; Chuyên đề môn học XLSTH, MHH&Mô phỏng mạng thông tin CH ĐTVT khóa 5 do thầy giáo hướng dẫn, 2004-2005, Học viện CNBCVT VNPT. 2. Nhập môn xử lý ảnh số - Lương Mạnh Bá- Nguyễn Thanh Thủy. 3. Borko Furht, Stephen W.Smoliar, Hong Jiang Zhang – “Video and Image Processing in multimedia systems”. 4. Geoffrey Davis - Arina Nosratinia - “Waveled-Based Image Encoding - Overview”. 5. Geoffrey Davis - Roger Claypoole - Wim Sweldens - Richard G.Baraniuk - “Nonlinear Wavelet transform for Image Coding via lifting” 6. PIKS Inside, Third Edition. William K. Pratt: Digital Image Processing 7. Richard W. Hamming: Haar Wavelets 8. Martin Vetterli - Jelena Kovacevic - “Wavelet and Subband Coding”