Luận văn Nghiên cứu một số khả năng phát hiện tin giấu trong môi trường ảnh

Giấu tin là một lĩnh vựcnghiên cứurộng. Trong đó môi trường giấu tin phổ biến và được ứng dụng rộng rãi nhất là dữ liệu ảnh.Trong chương này luận văn bình bày tổng quan vấn đề giấu tin, các mô hình giấu tin, các ứng dụng của giấu tin,đồng thời đi sâu vào các kỹ thuật nhằm bảo mật thông tin được giấu. Hầu hết các kỹ thuật giấu tin mật đều tập trung giấu thông tin vào các bit ít quan trong nhất của mỗi điểm ảnh. Phần cuối chương trình bàycác kỹ thuật đã được công bố gần đâynhư giấu tin theo khối bitsửdụng tính chẵn lẻ của tổng số bit 1trong khối, kỹ thuật Wu_Lee, kỹ thuật Yang_Pan_Tseng.

pdf115 trang | Chia sẻ: lvbuiluyen | Lượt xem: 2185 | Lượt tải: 4download
Bạn đang xem trước 20 trang tài liệu Luận văn Nghiên cứu một số khả năng phát hiện tin giấu trong môi trường ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ MAI THÀNH HUYÊN NGHIÊN CỨU MỘT SỐ KHẢ NĂNG PHÁT HIỆN TIN GIẤU TRONG MÔI TRƯỜNG ẢNH Ngành : Công nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số : 60 48 05 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. TRỊNH NHẬT TIẾN HÀ NỘI - 2009 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các dữ liệu, kết quả nêu trong luận văn là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác. Hà nội, tháng 11 năm 2009 Tác giả luận văn Mai Thành Huyên LỜI CẢM ƠN Tôi xin chân thành cảm ơn các Thầy, Cô giáo trong khoa Công nghệ thông tin và các cán bộ, nhân viên các phòng Đào tạo Sau đại học, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội đã luôn nhiệt tình giúp đỡ và tạo điều kiện tốt nhất cho tôi trong suốt quá trình học tập tại trường. Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao học K12T3 - trường Đại học Công nghệ thuộc Đại học Quốc gia Hà Nội đã luôn động viên, giúp đỡ và nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, công tác trong suốt khoá học. Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS. Trịnh Nhật Tiến đã tận tình giúp đỡ tôi hình thành, nghiên cứu và hoàn chỉnh luận văn. Mặc dù đã có nhiều cố gắng, song do sự hạn hẹp về thời gian, điều kiện nghiên cứu và trình độ, luận văn không tránh khỏi những khiếm khuyết. Tôi chân thành mong nhận được sự đóng góp ý kiến của các thầy, cô giáo và đồng nghiệp gần xa. Hà Nội, tháng 11 năm 2009 Người thực hiện luận văn Mai Thành Huyên MỤC LỤC LỜI CAM ĐOAN ..............................................................................................................ii LỜI CẢM ƠN ...................................................................................................................iii MỤC LỤC..........................................................................................................................iv Chương 1. TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH ...........................................1 1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN ............................................................................1 1.1.1 Khái niệm giấu tin .......................................................................................1 1.1.2 Phân loại các kỹ thuật giấu tin .....................................................................1 1.1.3 Sơ lược về lịch sử giấu tin ...........................................................................2 1.1.4 Mô hình cơ bản của kỹ thuật giấu tin...........................................................3 1.1.5 Các ứng dụng của kỹ thuật giấu tin..............................................................5 1.2 GIẤU THÔNG TIN TRONG DỮ LIỆU ĐA PHƯƠNG TIỆN ...........................6 1.2.1 Giấu tin trong ảnh........................................................................................6 1.2.2 Giấu tin trong audio ....................................................................................6 1.2.3 Giấu tin trong video ....................................................................................7 1.2.4 Giấu tin trong văn bản .................................................................................7 1.3 NHỮNG ĐẶC TRƯNG VÀ TÍNH CHẤT CỦA GIẤU TIN TRONG ẢNH ......8 1.4 CÁC HƯỚNG TIẾP CẬN CỦA KỸ THUẬT GIẤU TIN TRONG ẢNH.........10 1.4.1 Tiếp cận trên miền không gian ảnh ............................................................10 1.4.2 Tiếp cận trên miền tần số ảnh ....................................................................10 1.5 MỘT SỐ PHƯƠNG PHÁP GIẤU TIN MẬT TRONG ẢNH ............................12 1.5.1 Giấu tin mật trong khối bit sử dụng tính chẵn lẻ của tổng số bit 1..............12 1.5.2 Kỹ thuật giấu tin Wu _ Lee .......................................................................17 1.5.3 Kỹ thuật giấu tin Yuan_Pan_Tseng ...........................................................23 1.6 KỸ THUẬT THỦY VÂN TRÊN ẢNH .................................................................32 1.6.1 Một số khái niệm cơ bản trong thủy vân số ...............................................32 1.6.2 Một số kỹ thuật thủy vân trên ảnh .............................................................36 Chương 2. MỘT SỐ KHẢ NĂNG PHÁT HIỆN ẢNH CÓ GIẤU TIN .................55 2.1 PHƯƠNG PHÁP PHÁT HIỆN ẢNH GIẤU TIN ..............................................55 2.1.1 Bài toán phân tích tin giấu.........................................................................56 2.1.2 Phân loại phương pháp phát hiện ảnh giấu tin ...........................................57 2.2 Cơ sở toán học ........................................................................................................58 2.2.1 Các khái niệm ...........................................................................................58 2.2.2 Các định lý ................................................................................................62 2.3 KỸ THUẬT PHÂN TÍCH CẶP GIÁ TRỊ ĐIỂM ẢNH......................................63 2.3.1 Khái niệm cặp giá trị .................................................................................63 2.3.2 Thuật toán PoV3 .......................................................................................64 2.4 KỸ THUẬT PHÂN TÍCH ĐỐI NGẪU ................................................................69 2.4.1 Các khái niệm ...........................................................................................69 2.4.2 Thuật toán RS (Regular – Singular)...........................................................71 2.5 KỸ THUẬT PHÂN TÍCH CẶP MẪU SPA .........................................................76 2.5.1 Các khái niệm ...........................................................................................76 2.5.2 Phát hiện giấu tin mật LSB nhờ kỹ thuật SPA ...........................................79 2.5.3 Phân tích kỹ thuật SPA..............................................................................81 2.5.4 Ước lượng độ chính xác của chiều dài thông điệp dấu theo SPA ...............84 2.6 KỸ THUẬT PHÂN TÍCH ĐỘ LỆCH CHUẨN ..................................................91 2.7 KỸ THUẬT THỐNG KÊ  – BÌNH PHƯƠNG MỘT BẬC TỰ DO ..............94 Chương 3. THỬ NGHIỆM ............................................................................................97 3.1 MÔI TRƯỜNG CÀI ĐẶT .....................................................................................97 3.2 MÔ HÌNH HỆ THỐNG ........................................................................................97 3.3 TẬP DỮ LIỆU ẢNH..............................................................................................99 3.4 KẾT QUẢ THỬ NGHIỆM KỸ THUẬT PoV3 .................................................101 KẾT LUẬN.....................................................................................................................107 TÀI LIỆU THAM KHẢO ............................................................................................108 1 Chương 1. TỔNG QUAN VỀ GIẤU TIN TRONG ẢNH Giấu tin là một lĩnh vực nghiên cứu rộng. Trong đó môi trường giấu tin phổ biến và được ứng dụng rộng rãi nhất là dữ liệu ảnh. Trong chương này luận văn bình bày tổng quan vấn đề giấu tin, các mô hình giấu tin, các ứng dụng của giấu tin, đồng thời đi sâu vào các kỹ thuật nhằm bảo mật thông tin được giấu. Hầu hết các kỹ thuật giấu tin mật đều tập trung giấu thông tin vào các bit ít quan trong nhất của mỗi điểm ảnh. Phần cuối chương trình bày các kỹ thuật đã được công bố gần đây như giấu tin theo khối bit sử dụng tính chẵn lẻ của tổng số bit 1 trong khối, kỹ thuật Wu_Lee, kỹ thuật Yang_Pan_Tseng. 1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN 1.1.1 Khái niệm giấu tin “Giấu thông tin” gọi tắt là “Giấu tin”, tiếng Hi Lạp là “Steagnography”, tiếng Anh là “Cover Writing”. “Giấu thông tin” là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác [2]. Kỹ thuật giấu tin nhằm hai mục đích: một là bảo mật cho dữ liệu được đem giấu, hai là bảo vệ cho chính đối tượng mang tin giấu. Hai mục đích khác nhau này dẫn đến hai kỹ thuật chủ yếu của giấu tin. Đó là giấu tin mật và thủy vân số. Nói chung giấu tin trong đa phương tiện là tận dụng “độ dư thừa” của phương tiện giấu để thực hiện việc giấu tin, mà người ngoài cuộc “khó” cảm nhận được có thông tin giấu trong đó. 1.1.2 Phân loại các kỹ thuật giấu tin Do kỹ thuật giấu tin số mới được hình thành trong thời gian gần đây, nên xu hướng phát triển vẫn chưa ổn định. Có nhiều cách phân loại khác nhau dựa trên những tiêu chí khác nhau. Theo Fabien A.P. Petitcolas đề xuất năm 1999, có thể chia lĩnh vực giấu tin thành hai hướng lớn, đó là giấu tin mật và thủy vân số [6]. Giấu tin mật với mục đích bảo toàn và bảo mật thông tin, tập trung vào các kỹ thuật giấu thông tin, sao cho người khác khó phát hiện việc có tin được giấu; hơn nữa nếu phát hiện có tin giấu thì giải tin cũng khó thực hiện. Bên cạnh đó cũng đặt ra vấn đề về lượng tin được giấu. Thủy vân số lại được chia thành hai hướng nhỏ là thủy vân dễ vỡ và thủy vân bền vững. Trong đó thủy vân dễ vỡ yêu cầu thông tin giấu sẽ bị sai lệch nếu có bất kỳ sự thay đổi vào trên môi trường chứa tin. Thủy vân bền vững quan tâm nhiều đến việc nhúng tin đòi hỏi độ bền cao trước các biến đổi thông thường trên môi trường chứa tin. 2 Hình 1.1 Phân loại các kỹ thuật giấu tin 1.1.3 Sơ lược về lịch sử giấu tin Từ “Steganography” bắt nguồn từ tiếng Hi Lạp. Từ “stegano” trong tiếng Hi Lạp có nghĩa là “covered”, còn “graphien” có nghĩa là “to write”. Như vậy, “steganography” có nghĩa là tài liệu được phủ “covered writing”. Các câu chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ. Có lẽ những ghi chép sớm nhất về kỹ thuật giấu thông điệp thuộc về sử gia Hi Lạp Herodotus. Khi bạo chúa Hi Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ V trước Công nguyên, ông ta đã gửi một thông báo bí mật cho con rể của mình là Aristagoras ở Miletus. Histiaeus đã cạo trọc đầu một nô lệ tin cậy và xăm một thông điệp trên da đầu của anh ta. Khi tóc của người nô lệ mọc ra đủ dài thì người nô lệ được gửi tới Miletus. Một câu chuyện khác về thời Hi Lạp cổ đại cũng do Herodotus ghi lại. Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong. Demeratus, một người Hi Lạp định báo cho Sparta rằng Xerxes định xâm chiếm Hi Lạp. Để tránh bị phát hiện, anh ta đã bóc lớp sáp ong ra khỏi các viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viên thuốc bằng một lớp sáp ong mới. Những viên thuốc mang tin mật đã ngụy trang được để cùng với các viên thuốc thông thường khác và lọt qua mọi sự kiểm soát một cách dễ dàng. Giấu thông tin Information hiding Giấu tin mật Steganography Thủy vân số Watermarking Thủy vân bền vững Robust Copyright Watermarking Thủy vân dễ vỡ Fragile watermarking Thủy vân ẩn Imperceptible watermarking Thủy vân hiện Visble watermarking 3 Mực không màu là phương tiện hữu ích cho bảo mật thông tin trong một thời gian dài. Người Romans cổ đã biết sử dụng những chất sẵn có như nước quả, nước tiểu và sữa viết các thông báo bí mật giữa các hàng văn tự thông thường. Khi được hơ nóng, những thứ mực này trở nên sẫm mầu và có thể đọc được. Mực không màu cũng vẫn còn được sử dụng gần đây, chẳng hạn trong chiến tranh thế giới thứ II [5]. Ý tưởng về che giấu thông tin đã có hàng ngàn năm trước nhưng kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo. Mãi cho tới vài thập niên gần đây, giấu tin mới nhận được sự quan tâm của các nhà nghiên cứu và các viện công nghệ thông tin với nhiều công trình nghiên cứu. Sự phát triển của thông tin số và mạng truyền thông (đặc biệt là mạng Internet) cùng với các kỹ thuật sao chép hoàn hảo, kỹ thuật chỉnh sửa, thay thế tinh vi đã và đang làm nảy sinh nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền, xuyên tạc trái phép, lan truyền thông tin bất hợp pháp. 1.1.4 Mô hình cơ bản của kỹ thuật giấu tin Mô hình của kỹ thuật giấu tin được mô tả trong hình 1.2 và 1.3. Hình 1.2 Lược đồ chung cho quá trình giấu tin Bộ nhúng thông tin Khóa Thông tin cần giấu Phương tiện chứa tin (audio, ảnh, video,…) Phương tiện chứa đã được giấu tin Phân phối 4 Hình 1.2 biểu diễn quá trình giấu tin cơ bản. Trong đó, phương tiện chứa tin có thể bao gồm: văn bản, ảnh, audio, video… Thông tin cần giấu tùy theo mục đích của người sử dụng, nó có thể là các thông điệp, các logo, hình ảnh bản quyền… Thông tin được giấu vào trong phương tiện chứa tin nhờ môt bộ nhúng. Bộ nhúng là chương trình theo thuật toán giấu tin và được thực hiện với một khóa bí mật giống như trong hệ mật mã. Đầu ra của quá trình giấu tin là phương tiện chứa đã được giấu tin. Các phương tiện này có thể được phân phối trên mạng [7]. Hình 1.3 mô tả quá trình tách tin đã giấu từ môi trường giấu tin. Với đầu vào là phương tiện đã chứa tin giấu, một bộ tách tin (tương ứng với bộ nhúng) cùng với khóa sẽ thực hiện việc tách tin. Đầu ra của quá trình là phương tiện chứa tin và thông tin đã giấu. Trong trường hợp cần thiết, thông tin giấu lấy ra có thể được xử lý, kiểm định và so sánh với thông tin đã giấu ban đầu. Hình 1.3 Lược đồ cho quá trình tách tin Bộ tách tin Khóa Thông tin giấu Phương tiện chứa tin (audio, ảnh, video,…) Phương tiện chứa đã được giấu tin Kiểm định Phân phối Formatted: Left Deleted: giải mã Deleted: t 5 1.1.5 Các ứng dụng của kỹ thuật giấu tin 1.1.5.1 Ứng dụng của thủy vân số * Bảo vệ bản quyền tác giả Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số. Một thông tin nào đó mang ý nghĩa quyền sở hữu gọi là thủy vân sẽ được nhúng vào trong sản phẩm. Thủy vân đó chỉ một mình người chủ sở hữu hợp pháp sản phẩm đó có, và được dùng làm minh chứng cho bản quyền sản phẩm. Yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững cùng sản phẩm, muốn bỏ thủy vân này mà không được phép của người chủ sở hữu, thì chỉ có cách phá hủy sản phẩm [8]. * Xác thực thông tin hay phát hiện xuyên tạc thông tin Một thông tin sẽ được giấu trong phương tiện chứa, sau đó sử dụng để nhận biết xem phương tiện gốc đó có bị thay đổi hay không. Thủy vân nên được ẩn để tránh sự tò mò của kẻ thù, hơn nữa việc làm giả thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng được xem xét. Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi. Yêu cầu chung đối với các ứng dụng là khả năng giấu thông tin cao và thủy vân không cần bền vững. * Giấu vân tay hay dán nhãn Thủy vân trong ứng dụng này được dùng để nhận diện người gửi hay người nhận của một thông tin nào đó. Yêu cầu của ứng dụng này là đảm bảo độ an toàn cao cho thủy vân. * Kiểm soát sao chép: Các thủy vân trong trường hợp này được dùng để kiểm soát sao chép đối với các thông tin. Thiết bị phát hiện ra thủy vân thường được gắn sẵn vào trong hệ thống đọc ghi. Ứng dụng loại này cũng yêu cầu thủy vân phải được đảm bảo an toàn, và cũng sử dụng phương pháp phát hiện thủy vân đã giấu mà không cần thông tin gốc. 1.1.5.2 Ứng dụng của giấu tin mật Thông tin giấu được trong trường hợp này càng nhiều càng tốt, việc tách tin để nhận được tin giấu cũng không cần phương tiện chứa ban đầu. Các yêu cầu mạnh về tính bền vững không cần thiết lắm, thay vào đó là thông tin giấu phải đảm bảo tính bí mật và giảm thời gian lưu thông trên đường truyền. 6 1.2 GIẤU THÔNG TIN TRONG DỮ LIỆU ĐA PHƯƠNG TIỆN 1.2.1 Giấu tin trong ảnh Hiện nay, giấu tin trong ảnh chiếm tỉ lệ lớn nhất trong hệ thống giấu tin. Bởi lẽ lượng thông tin được trao đổi bằng hình ảnh là rất lớn, hơn nữa chúng còn đóng vai trò quan trọng trong các ứng dụng an toàn thông tin như: xác thực thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, xác định xuyên tạc thông tin. Từ việc nghiên cứu kỹ thuật giấu tin trong ảnh số chuyển sang kỹ thuật giấu tin trong các phương tiện khác như audio, video, trong văn bản,… không có gì khó khăn về nguyên tắc. Chính vì lẽ đó, giấu tin trong ảnh đã và đang được nhiều tổ chức, các trường đại học, các viện nghiên cứu, các cá nhân quan tâm và đầu tư nghiên cứu [12]. Thông tin được giấu vào dữ liệu ảnh, nhưng chất lượng ảnh rất ít thay đổi và người ta khó có thể nhận thấy bằng mắt thường. Sau vụ khủng bố ngày 11 tháng 9 năm 2001 gây chấn động không chỉ nước Mĩ mà cả thế giới, có một số nhận định cho rằng chính trùm khủng bố quốc tế Osama Binladen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với đồng bọn và chúng đã qua mặt được cục tình báo trung ương Mĩ và các cơ quan an ninh quốc tế. Sự việc này cho thấy việc nghiên cứu các vấn đề liên quan đến giấu tin trong ảnh càng trở nên quan trọng. 1.2.2 Giấu tin trong audio Giấu tin trong audio mang những đặc điểm riêng khác với giấu tin trong các đối tượng đa phương tiện khác. Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu, đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc. Để đảm bảo yêu cầu này, kỹ thuật giấu tin trong audio phụ thuộc vào thính giác con người (HAS - Human Auditory System). HAS nghe được các tín hiệu ở dải tần rộng và công suất cao nhưng ngược lại cũng kém trong việc phát hiện sự khác biệt của các dải tần và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ, thấp một cách dễ dàng. Một vấn đề khó khăn nữa của giấu tin trong môi trường audio đó là kênh truyền tin. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Các phương pháp giấu tin trong audio thường lợi dụng điểm yếu trong hệ thống thính giác con người. 7 1.2.3 Giấu tin trong video Giấu tin trong video cũng được quan tâm phát triển và có nhiều ứng dụng như kiểm soát sao chép thông tin, xác thực thông tin và bảo vệ bản quyền tác giả. Một phương pháp giấu tin được đưa ra bởi Cox là phương pháp phân bố đều. Ý tưởng cơ bản của phương pháp là phân phối thông tin giấu dàn trải theo tần số dữ liệu gốc. Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng để giấu tin. Trong các thuật toán khởi nguồn thì thường các kỹ thuật cho phép giấu các ảnh vào trong video nhưng thời gian gần đây các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào video [6]. Ví dụ phương pháp của Swanson giấu được hai bit vào khối 8*8 [9]. Gần đây nhất là phương pháp của Mukherjee: giấu audio vào video sử dụng cấu trúc lưới đa chiều… Kỹ thuật giấu thông tin trong video áp dụng cả đặc điểm thị giác và thính giác của con người. Kỹ thuật giấu tin đang được áp dụng với nhiều môi trường không chỉ riêng với dữ liệu đa phương tiện. Gần đây đã có nghiên cứu giấu tin trong văn bản, cơ sở dữ liệu quan hệ và cơ sở dữ liệu XML, cho phép mở ra nhiều hướng nghiên cứu mới. 1.2.4 Giấu tin trong văn bản Trong việc trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ lệ rất lớn so với các loại phương tiện chứa tin khác. Tuy vậy, giấu tin trong văn bản lại chưa được quan tâm nghiên cứu nhiều. Các nghiên cứu về giấu tin trong văn bản được chia thành hai hướng, thứ nhất là văn bản chứa là những văn bản được chụp lại và lưu trên máy như một ảnh nhị phân. Theo hướng này, kỹ thuật giấu tin được thực hiện như giấu tin trong ảnh nhị phân. Hướng thứ hai, phương tiện chứa sử dụng cho quá trình giấu tin được lưu dưới dạng văn bản. Theo hướng này, các kỹ thuật giấu tin cũng tiến hành như giấu tin trong ảnh bằng cách thay đổi một số ký tự tại một số vị trí trên văn bản mà không làm ảnh hưởng nhiều đến nội dung văn bản gốc. 8 1.3 NHỮNG ĐẶC TRƯNG VÀ TÍNH CHẤT CỦA GIẤU TIN TR