Luận văn Xây dựng ứng dụng tìm kiếm thông tin theo vịtrí trên mạng ngang hàng có cấu trúc

Hiện nay, các dịch vụdựa vào vịtrí cung cấp dịch vụcho các thiết bịdi động đang phát triển mạnh. Trong đó dịch vụtìm kiếm thông tin theo vịtrí là một dịch vụ quan trọng. Do các máy chủcung cấp dịch vụdựa vào vịtrí hiện nay hoạt động rời rạc, không có sựliên kết với nhau dễgây quá tải tại các máy chủvào giờcao điểm, thông tin cung cấp cho người dùng không đa dạng. Chính vì vậy nảy sinh nhu cầu liên kết các máy chủcủa các nhà cung cấp dịch vụlại với nhau thành một mạng dịch vụ. Đểcác máy chủcung cấp dịch vụcó thểliên kết được với nhau thì phải giải quyết được các vấn đềvềquản lý, lưu trữ, xửlý thông tin phân tán và tìm kiếm thông tin quy mô lớn. Mạng ngang hàng có cấu trúc sẽlà một giải pháp tốt đểliên kết các máy chủ cung cấp dịch vụlại với nhau vì bản chất của mạng ngang hàng là xửlý và lưu trữdữ liệu phân tán đồng thời mạng ngang hàng có cấu trúc có ưu điểm là tìm kiếm dữliệu nhanh, có thểtìm kiếm được dữliệu trên quy mô lớn và hệthống có khảnăng mởrộng cao. Khoá luận đã xây dựng một hệthống tìm kiếm thông tin theo vịtrí dựa trên mạng ngang hàng có cấu trúc trong đó thông tin tìm kiếm được dựa trên ngữcảnh của người sửdụng. Ngữcảnh ở đây là các thông tin vềtuổi, giới tính, sởthích của người dùng và các thông tin vềmôi trường nhưthời tiết, mùa trong năm, thời gian trong ngày và vịtrí hiện tại của người dùng. Hệthống đã được thửnghiệm và đánh giá thông qua môi trường mạng có giới hạn băng thông và độtrễgiống với môi trường mạng Internet và mạng điện thoại hiện nay. Kết quảthửnghiệm cho thấy hệthống xây dựng đã đáp ứng được các yêu cầu của dịch vụdựa vào vịtrí là cung cấp dịch vụthời gian thực và có thểdễdàng mởrộng hệthống.

pdf51 trang | Chia sẻ: lvbuiluyen | Lượt xem: 1994 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng ứng dụng tìm kiếm thông tin theo vịtrí trên mạng ngang hàng có cấu trúc, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Hậu XÂY DỰNG ỨNG DỤNG TÌM KIẾM THÔNG TIN THEO VỊ TRÍ TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÚC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin HÀ NỘI - 2009 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Phạm Đình Hậu XÂY DỰNG ỨNG DỤNG TÌM KIẾM THÔNG TIN THEO VỊ TRÍ TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÚC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: TS.Nguyễn Hoài Sơn HÀ NỘI - 2009 LỜI CẢM ƠN Để hoàn thành khóa luận này, trước hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy TS. Nguyễn Hoài Sơn. Thầy đã tận tình hướng dẫn, giúp đỡ em trong suốt quá trình làm khóa luận. Đồng thời em xin được cảm ơn các thầy giáo, cô giáo trong Trường Đại Học Công Nghệ - Đại Học Quốc Gia Hà Nội đã truyền đạt cho em nhiều kiến thức bổ ích trong suốt thời gian học tập tại trường. Cuối cùng, em xin cảm ơn tất cả bạn bè, gia đình và người thân đã giúp đỡ, động viên em rất nhiều để em có thể hoàn thành tốt khoá luận. Hà Nội, ngày 25 tháng 5 năm 2009 Sinh viên Phạm Đình Hậu TÓM TẮT NỘI DUNG Hiện nay, các dịch vụ dựa vào vị trí cung cấp dịch vụ cho các thiết bị di động đang phát triển mạnh. Trong đó dịch vụ tìm kiếm thông tin theo vị trí là một dịch vụ quan trọng. Do các máy chủ cung cấp dịch vụ dựa vào vị trí hiện nay hoạt động rời rạc, không có sự liên kết với nhau dễ gây quá tải tại các máy chủ vào giờ cao điểm, thông tin cung cấp cho người dùng không đa dạng. Chính vì vậy nảy sinh nhu cầu liên kết các máy chủ của các nhà cung cấp dịch vụ lại với nhau thành một mạng dịch vụ. Để các máy chủ cung cấp dịch vụ có thể liên kết được với nhau thì phải giải quyết được các vấn đề về quản lý, lưu trữ, xử lý thông tin phân tán và tìm kiếm thông tin quy mô lớn. Mạng ngang hàng có cấu trúc sẽ là một giải pháp tốt để liên kết các máy chủ cung cấp dịch vụ lại với nhau vì bản chất của mạng ngang hàng là xử lý và lưu trữ dữ liệu phân tán đồng thời mạng ngang hàng có cấu trúc có ưu điểm là tìm kiếm dữ liệu nhanh, có thể tìm kiếm được dữ liệu trên quy mô lớn và hệ thống có khả năng mở rộng cao. Khoá luận đã xây dựng một hệ thống tìm kiếm thông tin theo vị trí dựa trên mạng ngang hàng có cấu trúc trong đó thông tin tìm kiếm được dựa trên ngữ cảnh của người sử dụng. Ngữ cảnh ở đây là các thông tin về tuổi, giới tính, sở thích của người dùng và các thông tin về môi trường như thời tiết, mùa trong năm, thời gian trong ngày và vị trí hiện tại của người dùng. Hệ thống đã được thử nghiệm và đánh giá thông qua môi trường mạng có giới hạn băng thông và độ trễ giống với môi trường mạng Internet và mạng điện thoại hiện nay. Kết quả thử nghiệm cho thấy hệ thống xây dựng đã đáp ứng được các yêu cầu của dịch vụ dựa vào vị trí là cung cấp dịch vụ thời gian thực và có thể dễ dàng mở rộng hệ thống. MỤC LỤC LỜI MỞ ĐẦU 1 CHƯƠNG 1. MÔ HÌNH DỊCH VỤ DỰA VÀO VỊ TRÍ 3 1.2. Tổng quan về dịch vụ dựa vào vị trí ...............................................................................3 1.3. Các thành phần của dịch vụ dựa vào vị trí .....................................................................4 1.3.1. Thiết bị di động .......................................................................................................5 1.3.2. Mạng kết nối............................................................................................................6 1.3.3. Thành phần định vị ..................................................................................................8 1.3.4. Nhà cung cấp ứng dụng và dịch vụ .........................................................................9 1.4. Cách thức hoạt động của dịch vụ dựa vào vị trí ...........................................................10 1.5. Tìm kiếm thông tin dựa vào vị trí.................................................................................11 1.6. Tổng kết........................................................................................................................12 CHƯƠNG 2. PHƯƠNG PHÁP TÌM KIẾM THÔNG TIN TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÚC 13 2.1. Tổng quan về mạng ngang hàng...................................................................................13 2.1.1. Khái niệm mạng ngang hàng.................................................................................13 2.1.2. Ưu điểm và nhược điểm của mạng ngang hàng ....................................................14 2.1.3. Phân loại mạng ngang hàng...................................................................................15 2.2. Mạng ngang hàng có cấu trúc.......................................................................................16 2.1.1. Tổng quan về mạng ngang hàng có cấu trúc .........................................................16 2.2.2. Mạng ngang hàng có cấu trúc CHORD.................................................................18 2.3. Tìm kiếm thông tin trên mạng ngang hàng có cấu trúc ................................................22 2.3.1. Tìm kiếm chính xác ...............................................................................................22 2.3.2. Tìm kiếm theo thuộc tính – giá trị .........................................................................22 2.3.3. Tìm kiếm theo khoảng...........................................................................................23 2.4. Kết luận ........................................................................................................................24 CHƯƠNG 3. XÂY DỰNG DỊCH VỤ TÌM KIẾM THÔNG TIN THEO VỊ TRÍ DỰA TRÊN MẠNG NGANG HÀNG CÓ CẤU TRÚC 26 3.1. Mục đích và yêu cầu của tìm kiếm thông tin dựa vào vị trí .........................................26 3.2. Giải pháp thực hiện.......................................................................................................27 3.2.1. Tạo câu truy vấn phù hợp với ngữ cảnh ................................................................27 3.2.2. Biểu diễn dữ liệu theo vị trí ...................................................................................27 3.2.3. Chèn dữ liệu vào mạng ngang hàng có cấu trúc....................................................29 3.2.4. Tìm kiếm dữ liệu ...................................................................................................30 3.3. Cấu trúc hệ thống..........................................................................................................32 3.4. Hoạt động của hệ thống................................................................................................33 3.5. Đặc điểm của hệ thống đề xuất.....................................................................................36 3.6. Kết luận ........................................................................................................................37 CHƯƠNG 4. THỰC THI VÀ ĐÁNH GIÁ CHƯƠNG TRÌNH 38 4.1. Kết quả thực thi chương trình.......................................................................................38 4.2. Mô hình thử nghiệm .....................................................................................................39 CHƯƠNG 5. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN TIẾP THEO 43 5.1. Kết luận ........................................................................................................................43 5.2. Hướng phát triển tiếp theo của khoá luận.....................................................................44 DANH MỤC HÌNH ẢNH Hình 1. Cấu trúc hệ thống dịch vụ dựa vào vị trí .......................................................................4 Hình 2. Một số thiết bị di động sử dụng dịch vụ dựa vào vị trí..................................................5 Hình 3. Mạng diện rộng không dây............................................................................................6 Hình 4. Mạng cục bộ không dây ................................................................................................7 Hình 5. Mạng cá nhân không dây...............................................................................................7 Hình 6: Xác định vị trí dùng tín hiệu vệ tinh..............................................................................8 Hình 7. Xác định vị trí dùng dựa vào các trạm sóng đài ............................................................9 Hình 8. Cách thức hoạt động của dịch vụ dựa vào vị trí ..........................................................10 Hình 9: Mô hình mạng ngang hàng..........................................................................................13 Hình 10. Hệ thống mạng ngang hàng lai ghép .........................................................................15 Hình 11. Mạng ngang hàng có cấu trúc Chord dạng vòng tròn ...............................................17 Hình 12. Mô hình mạng Chord.................................................................................................19 Hình 13: Định nghĩa các trường trong bảng định tuyến của Chord .........................................19 Hình 14. Minh hoạ quy tắc lưu khoá trong mạng Chord..........................................................20 Hình 15. Minh hoạ chia bề mặt trái đất thành các ô.................................................................28 Hình 16. Minh hoạ một ô của bề mặt trái đất được chia ra ......................................................28 Hình 17: Minh hoạ tìm kiếm thông tin trong một vùng ...........................................................30 Hình 18: Minh hoạ thông tin vị trí của một ô trên bề mặt trái đất............................................31 Hình 20. Cấu trúc hệ thống dịch vụ tìm kiếm thông tin dựa vào vị trí.....................................33 Hình 21: Minh hoạ việc tạo truy vấn theo ngữ cảnh ................................................................34 Hình 22: Yêu cầu địa chỉ IP và cổng của các máy trong mạng ngang hàng ............................34 Hình 23: Yêu cầu tìm kiếm của thiết bị di động gửi lên mạng ngang hàng .............................35 Hình 24: Minh hoạ mạng ngang hàng trả kết quả cho thiết bị di động ....................................36 Hình 25: Minh hoạ giao diện hiển thị kết quả tìm kiếm thông tin ...........................................38 Hình 27: Giao diện hiển thị kết quả trên bản đồ.......................................................................39 Hình 28: Mô hình thí nghiệm ...................................................................................................39 Hình 29: Kết quả thí nghiệm ....................................................................................................40 Hình 30: Đồ thị kết quả thử nghiệm.........................................................................................41 1 LỜI MỞ ĐẦU Ngày này, số lượng các thiết bị di động cầm tay tăng nhanh, sức mạnh xử lý và bộ nhớ của thiết bị đã có thể đáp ứng được yêu cầu của nhiều dịch vụ. Trong đó dịch vụ dựa vào vị trí là một dịch vụ phổ biến và đang phát triển hiện nay. Dịch vụ này được ứng dụng trong nhiều lĩnh vực và cung cấp các thông tin như dịch vụ gần nhất, theo dõi phương tiện giao thông, các dịch vụ khẩn cấp. Dịch vụ tìm kiếm thông tin là một dịch vụ quan trọng của dịch vụ dựa vào vị trí và đang phát triển mạnh. Tuy hiện nay có nhiều dịch vụ tìm kiếm thông tin nhưng thông tin tìm kiếm được thường không đúng yêu cầu và không có liên hệ với ngữ cảnh của người dùng. Ngữ cảnh ở đây là các thông tin cá nhân (tuổi, giới tính, sở thích, lịch làm việc), thông tin môi trường xung quanh (thời gian trong ngày, mùa trong năm, thời tiết...) và vị trí của người dùng. Để đáp ứng được nhu cầu của người sử dụng là tìm kiếm thông tin chính xác và phù hợp với yêu cầu của người dùng thì khoá luận đã xây dựng một hệ thống tìm kiếm thông tin theo vị trí trong đó thông tin được tìm kiếm dựa trên ngữ cảnh của người dùng. Hệ thống sẽ cung cấp thông tin một cách tự động cho người dùng bằng cách tạo truy vấn tìm kiếm tự động từ ngữ cảnh của người dùng. Yêu cầu của hệ thống này là phải có khả năng tìm kiếm dữ liệu trên quy mô lớn, có tính phân tán và có khả năng mở rộng cao. Công nghệ mạng ngang hàng đã phát triển nhanh chóng trên mạng Internet trong thời gian gần đây với sự xuất hiện của hàng loạt các ứng ngang hàng như Napster, Gnutella, Freenet, BitTorrent, Edonkey…. Sở dĩ mô hình mạng mạng ngang hàng phát triển như vậy là vì mô hình này rất phù hợp với tính phân tán của dữ liệu, đồng thời nó đảm bảo quyền quản lý dữ liệu của người dùng nên khuyến khích được việc chia sẻ dữ liệu, làm tăng nguồn tài nguyên trên mạng. Mô hình mạng ngang hàng cũng được sử dụng để xử lý các bài toán phức tạp do tận dụng được khả năng tính toán phân tán và tích hợp dữ liệu từ các máy tính tham gia mạng. Trong mạng ngang hàng các máy tham gia đều đóng góp tài nguyên như băng thông, khả năng xử lý và khả năng lưu trữ. Để đáp ứng được yêu cầu của hệ thống tìm kiếm thông tin theo vị trí là có thể tìm kiếm dữ liệu trên quy mô lớn, có tính phân tán và có tính mở rộng cao thì mạng ngang hàng có cấu trúc là một giải pháp tốt. Bởi vì mạng ngang hàng có cấu trúc có ưu điểm là có thể quản lý, lưu trữ và tìm kiếm trên quy mô lớn, có tính phân tán và có thể dễ dàng mở rộng. Vì vậy khoá luận đã đi sâu vào nghiên cứu và xây dựng hệ thống tìm kiếm thông tin theo vị trí dựa trên mạng ngang hàng có cấu trúc . Để đánh giá hiệu quả của hệ thống đã xây dựng thì hệ thống đã được thử nghiệm trong môi trường được giới 2 hạn về băng thông và độ trễ giống với môi trường Internet và mạng điện thoại hiện nay và kết quả thử nghiệm là khá khả quan. Khoá luận được chia làm 5 chương: - Chương 1: Chương này sẽ giới thiệu về cấu trúc của hệ thống dịch vụ dựa vào vị trí hiện đang được sử dụng và các yêu cầu của dịch vụ dựa vào vị trí. - Chương 2: Trong chương này sẽ giới thiệu tổng quan về mạng ngang hàng, ưu nhược điểm của mạng ngang hàng và các phương pháp tìm kiếm đang được sử dụng trong mạng ngang hàng có cấu trúc. - Chương 3: Chương này sẽ trình bày về ý tưởng, yêu cầu và cách thức xây dựng dịch vụ tìm kiếm thông tin theo vị trí dựa trên mạng ngang hàng có cấu trúc. - Chương 4: Trong chương này chúng ta sẽ trình bày về mô hình thực nghiệm để đánh giá hiệu quả của dịch vụ tìm kiếm thông tin theo vị trí đã xây dựng và đưa ra các nhận xét đánh giá kết quả thử nghiệm. - Chương 5: Kết luận và hướng phát triển tiếp theo của khoá luận. 3 CHƯƠNG 1. MÔ HÌNH DỊCH VỤ DỰA VÀO VỊ TRÍ Ngày nay, với sự tiến bộ của khoa học kỹ thuật, đặc biệt là sự phát triển nhanh chóng của công nghệ phần cứng đã có thể tạo ra các thiết bị nhỏ gọn, có khả năng lưu trữ và xử lý lớn như PDA, Smart Phone, Pocket PC.... Giá thành của các sản phẩm này liên tục giảm khiến cho số lượng người dùng sử dụng các thiết bị thông minh này tăng nhanh chóng. Chính vì số lượng các thiết bị thông minh này tăng nhanh dẫn đến nhu cầu của người dùng muốn sử dụng các dịch vụ gia tăng trên các thiết bị này lớn. Dịch vụ dựa vào vị trí là một dịch vụ gia tăng đang phát triển ngày nay. Các ứng dụng của dịch vụ này rất đa dạng, các ứng dụng này cung cấp cho mọi người các thông tin như vị trí các rạp chiếu bóng, các phòng nghe nhạc, các bữa tiệc và các thông tin về bản đồ, nhà hàng, viện bảo tàng, bệnh viện... ở các địa điểm gần mình. 1.2. Tổng quan về dịch vụ dựa vào vị trí Dịch vụ dựa vào vị trí là dịch vụ cung cấp các thông tin liên quan đến vị trí của thiết bị di động cầm tay thông qua mạng điện thoại hoặc kết nối không dây. Dịch vụ dựa vào vị trí cũng có thể được định nghĩa là dịch vụ khai thác các thông tin về vị trí của thiết bị di động cầm tay. Dịch vụ này có thể cung cấp các thông tin như “Vị trí trạm ATM (Automatic Teller Machine) gần nhất” hoặc các thông tin về vị trí của các nhà hàng, quán ăn, các bến xe... ở quanh vị trí của thiết bị di động cầm tay. Các thông tin này có thể được cung cấp một cách tự động mà không cần bất cứ thao tác yêu cầu nào của người dùng hoặc người dùng cũng có thể yêu cầu trực tiếp các thông tin mình muốn tìm và có thể tuỳ chọn tìm kiếm thông tin về một vị trí được chỉ định trên bản đồ số. Dịch vụ dựa vào vị trí mới xuất hiện gần đây, dịch vụ này tập trung vào cung cấp các dịch vụ trong phạm vi nhóm người dùng không chuyên và hoạt động trong môi trường tính toán di động có năng lực tính toán thấp. Các ứng dụng phổ biến của dịch vụ dựa vào vị trí: + Định vị: Dùng để xác định vị trí của một người nào hay vật nào để trả lời cho câu hỏi đang ở đâu. + Di chuyển: Ứng dụng này có thể chỉ dẫn một cách chi tiết làm sao để đi đến một vị trí mà người dùng mong muốn. + Tìm kiếm: Ứng dụng này có thể là cung cấp các thông tin về các dịch vụ gần nhất (có thể là nhà hàng gần nhất, trạm ATM gần nhất), các thông tin về giao thông như tình trạng tắc nghẽn giao thông tại điểm nào đó. 4 + Xác định một người hay vật: Dùng để xác định một vật hay người nào đó ở vị trí hiện tại. + Kiểm tra sự kiện: Dùng để kiểm tra xem có sự kiện nào xảy ra ở vị trí này không. + Dịch vụ khẩn cấp: Khi có các tình trạng khẩn cấp như hoả hoạn, lũ lụt, trộm cướp thì có thể sử dụng dịch vụ này để thông báo cho cảnh sát hoặc cho lính cứu hoả. + Dịch vụ theo dõi: Dịch vụ này có thể là theo dõi giao thông để thông báo cho các các xe cứu thương hoặc cung cấp cho người dùng tránh các điểm tắc nghẽn. 1.3. Các thành phần của dịch vụ dựa vào vị trí Dịch vụ dựa vào vị trí gồm có bốn thành phần như hình 1 [3]: - Thiết bị di động - Mạng kết nối - Thành phần định vị -Nhà cung cấp ứng dụng và dịch vụ Hình 1. Cấu trúc hệ thống dịch vụ dựa vào vị trí 5 1.3.1. Thiết bị di động Là các thiết bị Mobile Phone, Smart Phone, Laptop, PDA... mà người dùng có thể sử dụng để truy cập và hiển thị thông tin. Người dùng có thể nhận thông tin dưới các dạng như âm thanh, văn bản, hình ảnh... Các thiết bị di động có thể là PDA, Phones, Laptops... nhưng cũng có thể là các thiết bị định vị gắn kèm với ô tô. Có nhiều loại thiết bị kết nối với dịch vụ dựa vào vị trí, tuỳ theo sức mạnh và khả năng lưu trữ của thiết bị, người dùng có thể sử dụng một hoặc nhiều dịch vụ khác nhau. Các thiết bị dùng dịch vụ dựa vào vị trí có thể được phân loại thành hai loại là thiết bị đơn nhiệm và thiết bị đa nhiệm. + Thiết bị đơn nhiệm: Thường sử dụng các dịch vụ khẩn cấp như còi báo động hoặc cảnh báo tình trạng khẩn cấp. + Thiết bị đa nhiệm: Các thiết bị này đang được nhiều người sử dụng và nó đã trở thành một phần của cuộc sống chúng ta. Một số thiết bị đa nhiệm trong hình vẽ 2: Mobile Phone, Smart Phone, Pocket PC, Laptop hoặc PDA. Hình 2. Một số thiết bị di động sử dụng dịch vụ dựa vào vị trí 6 + Đặc điểm của các thiết bị di động: - Hầu hết các thiết bị di động có tài nguyên tính toán và khả năng xử lý thấp. - Màn hình hiển thị nhỏ, pin có thời gian sử dụng ngắn, bị ảnh hưởng bởi điều kiện thời tiết. - Bị giới hạn về băng thông kết nối. 1.3.2. Mạng kết nối Thành phần này dùng để truyền dữ liệu, phục vụ các yêu cầu của người dùng và gửi kết quả cho người dùng. Mạng kết nối thường được phân chia thành các loại khác nhau tuỳ theo mục đích, giới hạn về sóng đài (radio) và các tính chất địa lý. + Mạng diện rộng không dây (WWAN: Wireless Wide Area Networks) thường từ 100 m đến 35 km và yêu cầu người dùng phải đăng ký để được sử dụng. Mạng này bao gồm GSM (Global System for Mobile, GPRS (General Packet Radio Service) và UMTS (Universal Mobile Telecommunication System). GMM và GPRS có thể truyền dữ liệu tối đa là 14 kbps và 115 kbps ngược lại UMTS có thể truyền tới 2 Mbps. Hình 3. Mạng diện rộng không dây 7 + Mạng cục bộ không dây (WLAN: Wireless Local Area Network): khoảng cách từ 10 đến 150 m. Thiết bị