Khóa luận Nghiên cứu phương pháp định danh bản quyền tác giả trên dữ liệu ảnh

Trong thời đại kỷ nguyên số, thông tin số được sử dụng rộng rãi trong môi trường mở: tài nguyên được phân phối cho nhiều người sử dụng, thì nhu cầu được bảo vệ bản quyền sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và được nhiều cơ sở nghiên cứu quan tâm. Thủy vân số hay nhúng thủy vân được đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, kiểm soát truy cập đối với dữ liệu đa phương tiện. Không giống như các hệ mật mã được sử dụng cho truyền thống và không ngăn cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp thủy vân hứa hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà sản phẩm đó được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy vân là một phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa phương tiện cần được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản phẩm. Thủy vân phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm. Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp thủy vân số mà tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG), ,và cách xử lý ảnh màu, cách nén ảnh chuẩn JPEG Và tôi cũng xây dựng được một ứng dụng cho việc xác định bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong khóa luận. Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu quả của ứng dụng đã xây dựng được.

pdf53 trang | Chia sẻ: lvbuiluyen | Lượt xem: 1904 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Khóa luận Nghiên cứu phương pháp định danh bản quyền tác giả trên dữ liệu ảnh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Lê Ngọc Việt NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ Lê Ngọc Việt NGHIÊN CỨU PHƢƠNG PHÁP ĐỊNH DANH BẢN QUYỀN TÁC GIẢ TRÊN DỮ LIỆU ẢNH KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hƣớng dẫn: ThS. Nguyễn Thị Hậu HÀ NỘI - 2010 Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - i - Lời cám ơn Trước hết tôi xin gửi lời cám ơn đến toàn thể các thầy cô giáo trường Đại học công nghệ Đại học Quốc gia Hà Nội đã giúp đỡ và chỉ bảo tôi trong suốt quá trình học tập ở trường. Đặc biệt tôi xin gửi lời cám ơn sâu sắc đến cô Nguyễn Thị Hậu đã chỉ bảo hướng dẫn tôi từ bước chọn đề tài, đến nghiên cứu và tạo điều kiện tốt nhất cho tôi trong quá trình làm khóa luận. Đồng thời tôi cũng xin cảm ơn những người bạn đã luôn bên cạnh, chia sẻ giúp đỡ và động viên tôi trong suốt quá trình nghiên cứu và học tập. Cuối cùng, tôi xin bày tỏ niềm biết ơn vô hạn tới bố mẹ, chị tôi, và những người bạn thân luôn bên cạnh, động viên tôi trong suốt quá trình thực hiện khóa luận tốt nghiệp. Hà Nội, 17/05/2010 Sinh viên: Lê Ngọc Việt Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - ii - Tóm tắt nội dung Trong thời đại kỷ nguyên số, thông tin số được sử dụng rộng rãi trong môi trường mở: tài nguyên được phân phối cho nhiều người sử dụng, thì nhu cầu được bảo vệ bản quyền sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề quan trọng và được nhiều cơ sở nghiên cứu quan tâm. Thủy vân số hay nhúng thủy vân được đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc, kiểm soát truy cập đối với dữ liệu đa phương tiện. Không giống như các hệ mật mã được sử dụng cho truyền thống và không ngăn cấm được người dùng sử dụng trái phép những dữ liệu, các phương pháp thủy vân hứa hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi mà sản phẩm đó được sử dụng trong môi trường mở và không cần đến việc mã hóa. Tạo thủy vân là một phương pháp nhúng một lượng thông tin nào đó vào trong dữ liệu đa phương tiện cần được bảo vệ sở hữu và không để lại ảnh hưởng đến chất lượng của sản phẩm. Thủy vân phải tồn tại bền vững với sản phẩm số và không thể loại bỏ bằng bất kì những tấn công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm. Trong phạm vi khóa luận này, tôi xin đưa ra một số phương pháp thủy vân số mà tôi nghiên cứu cho dữ liệu ảnh như BMP (bitmap), JPG (JPEG),…,và cách xử lý ảnh màu, cách nén ảnh chuẩn JPEG… Và tôi cũng xây dựng được một ứng dụng cho việc xác định bản quyền tác giả trên dữ liệu ảnh sử dụng phương pháp DCT đề cập trong khóa luận. Đồng thời nội dụng khóa luận đề cập tới một số thử nghiệm đánh giá hiệu quả của ứng dụng đã xây dựng được. Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - iii - Mục lục Lời cám ơn ......................................................................................................................... i Tóm tắt nội dung ................................................................................................................ ii Bảng các kí hiệu và chữ viết tắt .......................................................................................... iv Mục lục các hình vẽ ........................................................................................................... v Mở đầu .............................................................................................................................. 7 Chương 1: Giới thiệu về ẩn – giấu tin .................................................................................. 8 1.1. Khái niệm về ẩn - giấu tin. ........................................................................................... 8 1.2. Phân loại kỹ thuật giấu tin: ........................................................................................... 8 1.3. Mô hình giấu tin cơ bản: ............................................................................................. 10 1.4. Tính chất của ẩn giấu tin trong ảnh. ............................................................................ 12 Chương 2: Kỹ thuật thủy vân số ........................................................................................ 14 2.1. Khái niệm về thủy vân số. ........................................................................................... 14 2.2. Phân loại thủy vân số. ................................................................................................. 15 2.3. Mô hình thủy vân số: .................................................................................................. 16 2.4. Các khuynh hƣớng tiếp cận của kỹ thuât thủy vân số. .................................................. 18 2.5. Một số ứng dụng......................................................................................................... 26 2.6. Yêu cầu về chất lƣợng ảnh của thủy vân số: ...................................................................... 26 Chương 3: Phát triển ứng dụng. ....................................................................................... 28 3.1. Các chức năng chính: ................................................................................................. 28 3.2. Hƣớng giải quyết bài toán ........................................................................................... 28 3.3. Giới thiệu về các module:............................................................................................ 34 3.4. Giao diện chƣơng trình ............................................................................................... 38 3.5. Môi trƣờng lập trình. ................................................................................................. 41 Chương 4: Thực nghiệm đánh giá..................................................................................... 43 4.1. Cài đặt: ...................................................................................................................... 43 4.2. Chất lƣợng ảnh. ......................................................................................................... 43 4.3. Độ bền vững của thông tin. ......................................................................................... 46 4.4. Một số hạn chế của hệ thống: ...................................................................................... 48 Kết luận ........................................................................................................................... 49 Các thuật ngữ tiếng anh ................................................................................................... 50 Tài liệu tham khảo ........................................................................................................... 51 Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - iv - Bảng các kí hiệu và chữ viết tắt Kí hiệu Diễn giải LSB Least Significant Bit DFT Discrete Fourier Transform IDFT Inverse Discrete Fourier Transform DCT Discrete Cosine Transform IDCT Inverse Discrete Cosine Transform DWT Discrete Wavelet Transform IDWT Inverse Discrete Wavelet Transform Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - v - Mục lục các hình vẽ Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin ............................................................... 8 Hình 1.2: Lược đồ chung cho quá trình giấu tin ........................................................ 11 Hình 1.3: Lược đồ chung cho quá trình giải mã ........................................................ 12 Hình 2.1: Ví dụ về thủy vân số .................................................................................. 14 Hình 2.2: Sơ đồ phân loại các loại thủy vân số. ......................................................... 15 Hình 2.3: Mô hình thủy vân số .................................................................................. 16 Hình 2.4: Mô hình nhúng thủy vân số ....................................................................... 17 Hình 2.5: Mô hình tách thủy vân số .......................................................................... 17 Hình 2.6 Sơ đồ phân chia 3 miền tần số của phép biến đổi DCT ............................... 22 Hình 2.7: ảnh jpeg ..................................................................................................... 22 Hình 2.8 Sơ đồ miền tần số của ảnh .......................................................................... 22 Hình 2.9: Mô hình DWT trên miền màu đỏ (Red) của khối ảnh RGB mxn .............. 23 Hình 2.10: Mô hình IDWT của ảnh RGB .................................................................. 24 Hình 2.11: Mô hình nhúng thủy vân số trên miền DWT ............................................ 25 Hình 3.1 Mô hình nhúng thủy vân trên miền DCT .................................................... 29 Hình 3.2: Mô hình tách thủy vân. .............................................................................. 30 Hình 3.3 Các bước của quá trình mã hóa biến đổi DCT đối với một khối .................. 31 Hình 3.4: Ma trận lượng tử ....................................................................................... 32 Hính 3.5:Mô hính tương tác module thủy vân hiện ................................................... 34 Hình 3.6:Mô hình tương tác module nhúng thủy vân ẩn ............................................ 35 Hình 3.7: Mô hình tương tác module tách thủy vân ẩn .............................................. 36 Hình 3.8: Giao diện chính của ứng dụng ................................................................... 37 Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - vi - Hình 3.9: Giao diện thủy vân hiện ............................................................................. 38 Hình 3.10: Mô tả thành phần của .NET Framework .................................................. 41 Hình 4.1: Ảnh gốc trước khi thủy vân hiện ............................................................... 42 Hình 4.2: Ảnh sau khi thủy vân ................................................................................. 43 Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 7 - Mở đầu Trong thời đại bùng nổ thông tin với sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặc biệt là trong lĩnh vực đa phương tiện (multimedia) hỗ trợ đắc lực cho sự sản xuẩt, quản lý và phân phối các sản phẩm đa phương tiện như: hình ảnh, âm thanh… và khiến chúng trở lên rất dễ dàng. Đặc biệt với sự phát triển mạnh mẽ của Internet đã làm cho quá trình phân phối các sản phầm này trở nên rất nhanh chóng. Và chính điều này đã đặt ra vấn đề là làm sao bảo vệ bản quyền sở hữu đối vơi các sản phẩm đa phương tiện này. Một trong những phương pháp được dùng rất sớm để bảo vệ quyền sở hữu đối với các sản phẩm đa phương tiện là dùng phương pháp mã hóa. Các sản phẩm được mã hóa và gửi cho người dùng. Người dùng chỉ đọc được các sẩn phẩm này khi mà nhận được khóa để giải mã đi kèm. Phương pháp mã hóa này chỉ hiệu quả trong việc truyền dữ liệu đa phương tiện nhưng không hiệu quả trong việc bảo vệ bản quyền sở hữu vì người dùng sau khi giải mã thì sẽ nhân bản và phân phối lại sản phẩm đó. Chính điểu đó mà chúng ta cần phải xây dựng một phương pháp tốt hơn để giải quyết vấn đề này. Và thủy vân số là một trong những giải pháp được đưa ra để giải quyết vấn đề về bản quyến sở hữu. Trong phạm vi khóa luận đã đi vào nghiên cứu các phương pháp để giải quyết vấn đề đó. Mục tiêu của khóa luận là không chỉ nghiên cứu các phương pháp xác thực bản quyền tác giả trên dữ liệu ảnh sử dụng thủy vân số mà còn xây dựng một hệ thống thực nghiệm sử dụng một trong nhưng kỹ thuật thủy vân được nghiên cứu trong khóa luận. Ngoài phần Mở đầu và Kết luận, kết cấu của khóa luận bao gồm các chương sau:  Chƣơng 1: Giới thiệu về ẩn giấu tin. Nêu ra các khái niệm cơ bản nhất về ẩn giấu tin và ứng dụng trong thực tế.  Chƣơng 2: Giới thiệu về thủy vân số. Nghiên cứu phân tích một số thuật toán thủy vân số hiện nay đang được phổ biến. Tìm hiểu ưu nhược điểm của từng thuật toán.  Chƣơng 3: Hướng giải quyết và đề xuất mô hình bài toán. Miêu tả chi tiết thuật toán sử dụng và môi trường phát triển ứng dụng  Chƣơng 4: Kết quả thực nghiệm và đánh giá. Đưa ra kết quả đã làm được và đánh giá kết quả. Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 8 - Chƣơng 1: Giới thiệu về ẩn – giấu tin 1.1. Khái niệm về ẩn - giấu tin. Hiện nay có rất nhiều cách định nghĩa khác nhau về ẩn giấu tin như:  Theo tác giả Trịnh Nhật Tiến thì: Ẩn giấu tin (steganography) được hiểu là nhúng mẩu tin mật vào một vật mang tin khác, sao cho khó phát hiện ra mẩu tin đó, mặt khác nhận biết được vật mang tin đã được giấu một tin mật.[1]  Theo một số tác giả khác: Ẩn giấu tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác (giấu thông tin chỉ mang tính quy ước không phải là một hành động cụ thể).[2] Như vậy. Ẩn giấu tin là một kỹ thuật nhúng các mẩu tin vào một đối tượng mang tin sao cho khó có thể phát hiện ra tin mật đó. 1.2. Phân loại kỹ thuật giấu tin: Phân loại theo khuynh hƣớng: Hình 1.1: Sơ đồ phân loại kỹ thuật giấu tin Trong kỹ thuật giấu tin nhằm mục đích an toàn và bảo mật thông tin ở hai khía cạnh:  Bảo mật dữ liệu đem giấu.  Bảo mật cho chính đối tượng được dùng để giấu tin. Từ hai khía cạnh trên dần dần hình thành hai khuynh hướng chủ yếu của giấu tin là: 1. Giấu tin (Steganography) là kỹ thuật nhúng tin mật vào môi trường giấu tin. Theo khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được càng nhiều càng tốt và quan trọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay không bằng kỹ thuật thông thường. Infomation hiding Giấu thông tin Steganography Giấu tin mật Watermarking Thuỷ vân số Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 9 - 2. Thủy vân số (kỹ thuật đánh dấu số) là kỹ thuật nhúng dấu ấn số vào một tài liệu hoặc sản phẩm, nhằm chứng thực nguồn gốc hay chủ sở hữu. So sánh giữa giấu tin và thủy vân số[1]: Giấu tin Thủy vân số - Mục đích là bảo vệ thông tin được giấu. - Giấu được càng nhiều thông tin càng tốt, ứng dụng trong truyền dữ liệu thông tin mật. - Thông tin được giấu phải ẩn, không cho người khác thấy được bằng mắt thường. - Chỉ tiêu quan trọng nhất là dung lượng của tin được giấu. - Mục đích là bảo vệ môi trường giấu tin. - Chỉ cần thông tin đủ để đặc trưng cho bản quyền của chủ sở hữu. - Thông tin giấu có thể ẩn (thủy vân ẩn) hoặc hiện (thủy vân hiện). - Chỉ tiêu quan trọng nhất là tính bền vững của tin được giấu. Phân loại theo môi trƣờng giấu tin: a. Giấu tin trong Audio Kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con người (HAS – Human Auditory System). HAS cảm nhận được tín hiệu ở dải tần rộng và công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa dải tần và công suất. Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng. Kênh truyền tin cũng là một vấn đề. Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu. Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin. b. Giấu tin trong video Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Ta có thể lấy một ví dụ là hệ thống chương trình trả tiền xem theo video clip của các thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật cho phép giấu cả âm thanh và ảnh vào trong video. c. Giấu tin trong ảnh Giấu thông tin trong ảnh hiện nay chiếm tỷ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, và hệ thống giấu tin trong đa phương tiện bởi lượng thông tin trao Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 10 - đổi được trao đổi bằng ảnh là rất lớn. Hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng đối với hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật… Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức, trường đại học, và các viện nghiên cứu trên thế giới. Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa. Ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những lợi ích quan trọng trên nhiều lĩnh vực của đời sống xã hội. Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng. Phần mềm MS Word của MicroSoft cũng cho phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông tin. Tài liệu sau đó được truyền trực tiếp qua máy fax hoặc lưu truyền trên mạng. Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào. Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số hoá và lưu trữ trong hệ thống máy tính hay trên mạng, chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng. 1.3. Mô hình giấu tin cơ bản: Giấu thông tin vào phương tiện chứa và tách lấy thông tin là hai quá trình trái ngược nhau. a. Giấu thông tin vào phương tiện chứa Qui trình giấu thông tin vào phương tiện chứa được mô tả qua sơ đồ khối hình 1.2 trong đó: - Thông tin cần giấu tuỳ theo mục đích của người sử dụng, nó có thể là thông điệp (với các tin bí mật) hay các logo, hình ảnh bản quyền. - Phương tiện chứa: các file ảnh, text, audio… là môi trường để nhúng tin - Bộ nhúng thông tin: là những chương trình thực hiện việc giấu tin - Đầu ra: là các phương tiện chứa đã có tin giấu trong đó Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 11 - Hình 1.2: Lược đồ chung cho quá trình giấu tin[1][2][7] b. Tách thông tin: Tách thông tin từ các phương tiện chứa diễn ra theo quy trình ngược lại với đầu ra là các thông tin đã được giấu vào phương tiện chứa. Phương tiện chứa sau khi tách lấy thông tin có thể được sử dụng, quản lý theo những yêu cầu khác nhau. Thông tin giấu Môi trường chứa(audio, ảnh, video) Môi trường chứa đã được giấu tin Khóa giấu tin Bộ nhúng thông tin Phân phối Lê Ngọc Việt – K51CHTTT Thủy vân số trên ảnh - 12 - Hình 1.3: Lược đồ chung cho quá trình giải mã[1][2][7] Hình vẽ 1.3 chỉ ra các công việc giải mã thông tin đã giấu. Sau khi nhận được đối tượng phương tiện chứa có giấu thông tin, quá trình giải mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhúng. Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu. Bước tiếp theo thông tin đã giấu sẽ được xử lý kiểm định so sánh với thông tin ban đầu. 1.4. Tính chất của ẩn giấu tin trong ảnh. Có nhiều phương pháp ẩn giấu tin trong ảnh đã được nghiêm cứu. Để đánh giá chất lượng của một phương pháp ẩn giấu tin, người ta dựa vào một số chỉ tiêu sau:[1][7] a. Bảo đảm tính vô hình.