Luận văn Xây dựng hệ thống thống kê và phân tích thông tin truy cập các Website

Hiện nay, Internet đã trở nên khá phổ biến và số lượng người dùng cũng đã tăng vọt đáng kể, người sử dụng website cũng trở nên thành thạo và chuyên nghiệp hơn. Bên cạnh đó, số lượng người sở hữu các website, nhất là các website thương mại điện tử và các website dịch vụ cũng tăng vọt, và từ đó, các chủ website (hay còn gọi là các webmaster) trở nên có nhu cầu hơn bao giờ hết về việc muốn tìm hiểu tất cả mọi thông tin liên quan đến những người truy cập vào website của họ. Ngày nay, việc cạnh tranh các website đang bắt đầu trở nên gay gắt, những ai muốn thành công trong lĩnh vực kinh doanh trực tuyến đều rất muốn lôi kéo khách hàng đến website của họ ngày càng nhiều hơn, và do đó cần tìm hiểu các thông tin về khách hàng như: Họ đến từ đâu, phần lớn khách hàng sử dụng trình duyệt gì, hệ điều hành nào, họ có thói quen dùng các chương trình tìm kiếm nào, online vào giờ nào trong ngày nhiều nhất, ngày nào trong tuần nhiều nhất, v.v. Rất nhiều thông tin cần phải nắm về thói quen cũng như sự thỏa mãn của khách hàng về website, do đó, việc làm chủ thông tin về khách hàng sẽ tạo cho các nhà phát triển web đưa ra những quyết định về việc sẽ phát triển hệ thống website của mình như thế nào để có thể lôi kéo 1 cách tốt nhất khách hàng đến website của mình. Hiện nay, trên Internet đã có nhiều nhà cung cấp dịch vụ khai thác thông tin này, như Google Analystic, Alexa hay HiStats. Các dịch vụ này đều cung cấp dịch vụ khai thác các thông tin cơ bản của những người truy cập web, tuy nhiên, việc báo cáo kết quả thì cần phải đăng nhập trực tiếp vào hệ thống của họ (Google, Alexa, Histats, . ), do đó có thể gây ra 1 số bất tiện cho các webmaster khi họ muốn kết quả báo cáo đó được hiển thị trên hệ thống của họ hay trên điện thoại di động (ĐTDĐ) hay PDA. Đứng trên góc độ muốn thõa mãn nhu cầu còn lại của webmaster về việc khai thác thông tin đến các client khác nhau, đề tài “Xây dựng hệ thống thống kê và phân tích thông tin truy cập của các website” ra đời nhằm mục đích cung cấp cho các webmaster một hệ thống thống kê thông tin người truy cập với đầy đủ các thông tin cơ bản, ngoài ra còn cung cấp cho các webmaster một web service trả về kết quả báo cáo về thông tin truy cập của các khách hàng đến website của họ. Như vậy, ngoài việc có thể xem báo cáo trực tiếp trên hệ thống, các webmaster còn có thể dùng kết nối đến hệ thống để lấy kết quả báo cáo về (thông qua web service) để có thể hiển thị lên các phần mềm của họ như phần mềm để bàn, ĐTDĐ hay PDA.

doc87 trang | Chia sẻ: tuandn | Lượt xem: 2825 | Lượt tải: 1download
Bạn đang xem trước 20 trang tài liệu Luận văn Xây dựng hệ thống thống kê và phân tích thông tin truy cập các Website, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA CÔNG NGHỆ THÔNG TIN Tel. (84-511) 736 949, Fax. (84-511) 842 771 Website: itf.ud.edu.vn, E-mail: cntt@edu.ud.vn LUẬN VĂN TỐT NGHIỆP KỸ SƯ NGÀNH CÔNG NGHỆ THÔNG TIN MÃ NGÀNH : 05115 ĐỀ TÀI : Xây dựng hệ thống thống kê và phân tích thông tin truy cập của các website Mã số : 04T2-002 Ngày bảo vệ : 16/06/2009 SINH VIÊN : Quán Đức Bình Nguyễn Văn Hồng Quang LỚP : 04T2 CBHD : TS. GVC. GV Nguyễn Thanh Bình ĐÀ NẴNG, 06/2009 LỜI CẢM ƠN Để hoàn thành được đồ án này, chúng em đã nhận được sự chỉ bảo tận tình của các Thầy Cô giáo trong khoa Công nghệ Thông tin trường Đại học Bách Khoa, sự giúp đỡ động viên của gia đình và bạn bè. Trước tiên chúng em xin chân thành cảm ơn tất cả các thầy cô của trường Đại học Bách Khoa, Đại học Đà Nẵng đã dạy dỗ và truyền đạt kiến thức cho chúng em trong thời gian học tại trường. Em xin chân thành cám ơn thầy giáo Tiến sĩ Nguyễn Thanh Bình. Cám ơn Thầy đã tận tình hướng dẫn góp ý cho chúng em trong quá trình thực hiện đồ án này. Nhờ đó mà chúng em có thể hoàn thành theo đúng yêu cầu về nội dung của một đồ án tốt nghiệp. Chúng em cũng xin gửi lời cảm ơn đến những người bạn cùng ngành đã góp ý và hỗ trợ về mặt kỹ thuật, tài liệu cũng như thông tin để chúng em có thể hoàn thành đồ án kịp tiến độ được giao. Sinh viên, Quán Đức Bình Nguyễn Văn Hồng Quang LỜI CAM ĐOAN Tôi xin cam đoan : Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn trực tiếp của thầy (cô) xóa TS. GVC. GV Nguyễn Thanh Bình.. Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả, tên công trình, thời gian, địa điểm công bố. Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, chúng tôi xin chịu hoàn toàn trách nhiệm. Sinh viên, Quán Đức Bình Nguyễn Văn Hồng Quang NHẬN XÉT CỦA CÁN BỘ HƯỚNG DẪN NHẬN XÉT CỦA CÁN BỘ DUYỆT MỤC LỤC MỤC LỤC CÁC BẢNG Bảng 1: Các chủ thể của hệ thống 27 Bảng 2: Các Use Case của Collector 28 Bảng 3: Các Use Case của Guest 29 Bảng 4: Các Use Case của thành viên 30 Bảng 5: Các Use Case của tác nhân hệ thống 32 Bảng 6: Bảng mô tả lớp DBSource 54 Bảng 7: Bảng mô tả lớp Spider 57 Bảng 8: Mô hình lớp WSClient 57 Bảng 9: Bảng mô tả lớp WSService 58 Bảng 10: Bảng mô tả lớp WSMessage 58 Bảng 11: Bảng mô tả giao diện đăng ký 59 Bảng 12: Bảng mô tả giao diện chức năng thiết lập thông tin cho website 60 Bảng 13: Bảng mô tả giao diện chức năng lấy code javascript 61 Bảng 14: Bảng mô tả giao diện đăng nhập 61 Bảng 16: Bảng mô tả giao diện hệ thống báo cáo dạng bánh (Pie) 62 Bảng 17: Bảng mô tả giao diện báo cáo dạng cột hay đường thẳng 63 MỤC LỤC HÌNH ẢNH Hình 1: Cây mục tiêu của đề tài 3 Hình 2: Các giao thức của Web Service 13 Hình 3: Biểu đồ xử lý CSDL trước khi thiết lập index 17 Hình 4: Biểu đồ xử lý CSDL sau khi lập index 17 Hình 5: Công cụ SQL Profiler của SQL Server 18 Hình 6: Công cụ Data Engine Tunning Advisor 19 Hình 7: Công cụ Data Engine Tunning Advisor và giải pháp xây dựng các index 19 Hình 8: Table đã được tạo partition 20 Hình 9: Cách tạo partition table 20 Hình 10: Đồ thị dạng bánh 21 Hình 11: Đồ thị dạng cột 21 Hình 12: Đồ thị dạng đường thẳng 22 Hình 13: Đồ thị vùng 22 Hình 14: Đồ thị xu hướng 23 Hình 15: Các chủ thể của hệ thống 26 Hình 16: Các Use Case của Collector 27 Hình 17: Các Use Case của Guest 29 Hình 18: Các Use Case của Member 30 Hình 19: Các Use Case của tác nhân hệ thống 31 Hình 20: Sơ đồ tuần tự các chức năng của Collector 46 Hình 21: Sơ đồ tuần tự chức năng khai thác thông tin về trình duyệt 47 Hình 22: Sơ đồ tuần tự chức năng khai thác thông tin trình duyệt 48 Hình 23: Sơ đồ tuần tự chức năng khai thác thông tin các Referer 49 Hình 24: Sơ đồ tuần tự chức năng khai thác thông tin các trang ngõ vào 50 Hình 25: Sơ đồ tuần tự chức năng khai thác thông tin ngõ ra 51 Hình 26: Sơ đồ tuần tự chức năng khai thác thông tin lần load trang 51 Hình 27: Sơ đồ tuần tự chức năng khai thác thông tin thời gian duyệt web 52 Hình 28: Sơ đồ tuần tự chức năng khai thác thông tin về lượt truy cập 53 Hình 29: Mô hình lớp DBSource 54 Hình 30: Mô hình lớp Spider 55 Hình 31: Mô hình lớp WSClient 57 Hình 32: Mô hình lớp WSService 58 Hình 33: Mô hình lớp WSMessage 58 Hình 34: Wireframe giao diện đăng ký 59 Hình 35: Wireframe thiết lập thông tin website 60 Hình 36: Wireframe lấy mã script 60 Hình 37: Wireframe đăng nhập hệ thống 61 Hình 38: Wireframe thay đổi mật khẩu 61 Hình 39: Bảng mô tả giao diện chức năng thay đổi mật khẩu 62 Hình 40: Wireframe report dạng pie 62 Hình 41: Wireframe report dạng cột và đường thẳng 63 Hình 42: Các biểu đồ của ChartDirector 66 Hình 43: Giao diện chức năng đăng ký đã làm 69 Hình 44: Giao diện chức năng thiết lập thông tin website đã làm 70 Hình 45: Giao diện chức năng đăng nhập đã làm 70 Hình 46: Phần header của trang báo cáo dạng bánh 71 Hình 47: Phần chi tiết của các trang báo cáo 71 Hình 48: Trang báo cáo dạng cột 72 Hình 49: Trang báo cáo dạng đường thẳng 73 CHƯƠNG 1 MỞ ĐẦU Giới thiệu bối cảnh đề tài Hiện nay, Internet đã trở nên khá phổ biến và số lượng người dùng cũng đã tăng vọt đáng kể, người sử dụng website cũng trở nên thành thạo và chuyên nghiệp hơn. Bên cạnh đó, số lượng người sở hữu các website, nhất là các website thương mại điện tử và các website dịch vụ cũng tăng vọt, và từ đó, các chủ website (hay còn gọi là các webmaster) trở nên có nhu cầu hơn bao giờ hết về việc muốn tìm hiểu tất cả mọi thông tin liên quan đến những người truy cập vào website của họ. Ngày nay, việc cạnh tranh các website đang bắt đầu trở nên gay gắt, những ai muốn thành công trong lĩnh vực kinh doanh trực tuyến đều rất muốn lôi kéo khách hàng đến website của họ ngày càng nhiều hơn, và do đó cần tìm hiểu các thông tin về khách hàng như: Họ đến từ đâu, phần lớn khách hàng sử dụng trình duyệt gì, hệ điều hành nào, họ có thói quen dùng các chương trình tìm kiếm nào, online vào giờ nào trong ngày nhiều nhất, ngày nào trong tuần nhiều nhất, v.v... Rất nhiều thông tin cần phải nắm về thói quen cũng như sự thỏa mãn của khách hàng về website, do đó, việc làm chủ thông tin về khách hàng sẽ tạo cho các nhà phát triển web đưa ra những quyết định về việc sẽ phát triển hệ thống website của mình như thế nào để có thể lôi kéo 1một cách tốt nhất khách hàng đến website của mình. Hiện nay, trên Internet đã có nhiều nhà cung cấp dịch vụ khai thác thông tin này, như Google Analystic, Alexa hay HiStats. Các dịch vụ này đều cung cấp dịch vụ khai thác các thông tin cơ bản của những người truy cập web, tuy nhiên, việc báo cáo kết quả thì cần phải đăng nhập trực tiếp vào hệ thống của họ (Google, Alexa, Histats, ... ), do đó có thể gây ra 1 không dùng số ở đây, thay một cách có hệ thống số bất tiện cho các webmaster khi họ muốn kết quả báo cáo đó được hiển thị trên hệ thống của họ hay trên điện thoại di động (ĐTDĐ) hay PDA.. Đứng trên góc độ muốn thõa mãn nhu cầu còn lại của webmaster về việc khai thác thông tin đến các client khác nhau, đề tài “Xây dựng hệ thống thống kê và phân tích thông tin truy cập của các website” ra đời nhằm mục đích cung cấp cho các webmaster một hệ thống thống kê thông tin người truy cập với đầy đủ các thông tin cơ bản, ngoài ra còn cung cấp cho các webmaster một web service trả về kết quả báo cáo về thông tin truy cập của các khách hàng đến website của họ. Như vậy, ngoài việc có thể xem báo cáo trực tiếp trên hệ thống, các webmaster còn có thể dùng kết nối đến hệ thống để lấy kết quả báo cáo về (thông qua web service) để có thể hiển thị lên các phần mềm của họ như phần mềm để bàn, ĐTDĐ hay PDA. Đề tài này ra đời với ý đồ không hề tham lam có thể cung cấp được nhiều thông tin như các đại gia như Google, Alexa hay HiStats mà chỉ muốn có một hệ thống tương tự, qua đó, có thể tiếp tục phát triển thêm những chức năng chuyên biệt, có thể chuyên biệt cho từng quốc gia, hoặc chuyên biệt cho từng loại hình website nào đó. Ý nghĩa và mục đích của đề tài Tên đề tài: “Xây dựng hệ thống thống kê và phân tích thông tin truy cập của các website”. Đề tài góp phần nghiên cứu cách thức khai thác thông tin về các lượt truy cập, qua đó giúp các webmaster có thể nắm rõ thông tin về khách hàng của họ và qua đó, xóa đưa ra những chiến lược, sách lượt để nâng tầm website của họ. Cung cấp cho các webmaster 1! web service để họ có thể nhận báo cáo của họ, và dùng nó cho các chương trình riêng của họ một cách dễ dàng, nhanh chóng. Nhiệm vụ phải thực hiện Mục tiêu nghiên cứu Xây dựng cây mục tiêu như sau: Hình 1: Cây mục tiêu của đề tài Kết quả dự kiến Xây dựng thành công hệ thống khai thác, bóc tách thông tin website của thành viên. Xây dựng thành công một quy trình hoàn chỉnh cho một webmaster bất kỳ muốn sử dụng dịch vụ khai thác thông tin của hệ thống, từ việc đăng ký đến cách thức áp dụng kỹ thuật tách dữ liệu trên website của họ Xây dựng thành công hệ thống báo cáo chạy trên môi trường web, qua đó giúp webmaster (đã đăng nhập) có thể xem được báo cáo thống kê về thông tin truy cập trên website của họ Xây dựng thành công một webservice, qua đó các webmaster có thể gửi các yêu cầu để lấy báo cáo của họ qua giao thức SOAP. Xây dựng một ứng dụng .NET, sử dụng giao thức SOAP để truy cập đến hệ thống và lấy ra các báo cáo tương ứng Xây dựng 1 ứng dụng Mobile nhỏ truy cập đến 1 wap server để lấy ra kết quả báo cáo. Tóm tắt phương pháp triển khai Bố cục sẽ trình bày Chương 1 (Giới thiệu): Giới thiệu bối cảnh của đề tài. Chọn tên đề tài, mục đích và ý nghĩa của đề tài. Nhiệm vụ phải thực hiện (các mục tiêu nghiên cứu cụ thể và kết quả dự kiến). Tóm tắt phương pháp triển khai, tóm tắt nội dung, bố cục sẽ trình bày. Chương 2 (Cơ sở lý thuyết): Trình bày các khái niệm trong ứng dụng Tìm hiểu cách thức khai thác thông tin bằng cách sử dụng javascript và HTTP Header Tìm hiểu về webservice, cách thức cài đặt và chạy ví dụ minh họa. Lựa chọn cách thức lưu trữ dữ liệu và kiến trúc database. Tìm hiểu về các đồ thị báo cáo Chương 3 (Phân tích và thiết kế hệ thống): giới thiệu bài toán, các yêu cầu chức năng, phương pháp giải quyết, trình bày kết quả phân tích và thiết kế bài toán gồm: phân tích chức năng như sơ đồ UseCase, sơ đồ tuần tự; thiết kế như sơ đồ lớp; giao diện,…). Chương 4 (Phát triển ứng dụng): Giới thiệu môi trường, công cụ và công nghệ được áp dụng; và trình bày một số kết quả đạt được. Chương 5 (Kết luận và hướng phát triển): Trình bày, đánh giá kết quả đạt được và chưa đạt được của chương trình, hướng bổ sung và mở rộng đề tài. CHƯƠNG 2 CƠ SỞ LÝ THUYẾT Tìm hiểu các khái niệm trong ứng dụng thống kê Các thông tin về người sử dụng website được hệ thống thống kê lại và chia làm các 4 nhóm chính sau: Referer:bỏ dấu “:” sau các tiêu đề Nhóm này thống kê lại tất cả những tác nhân góp phần mang người sử dụng đến trang web cần thống kê, được chia làm 4 nhóm chính sau Direct Request: Khi người sử dụng đến trang web cần thống kê bằng cách gõ link trực tiếp vào trình duyệt, thì những liên kết đó được thống kê vào kiểu Direct Request. Tất cả các Direct Request được tính là 1 Referer No Referrer: Vì một lý do nào đó, hệ thống không thể xác định được người dùng đến website từ các tác nhân nào, và khi đó hệ thống sẽ thống kê loại tác nhân này vào kiểu No Referer, và cũng giống như Direct Request, tất cả các request thuộc loại này được tính là 1 Referer. Search Engines: Khi người sử dụng đến với trang web cần thống kê từ một cỗ máy tìm kiếm nào đó, ví dụ Google, hay Yahoo, Live Search,v.v... thì những request này được thống kê vào kiểu Search Engine, mỗi request đến từ một cỗ máy tìm kiếm nào đó được tính là một Referer. Search keywords: Cũng từ các cỗ máy tìm kiếm, người sử dụng đến với trang web cần thống kê, nhưng lúc này, hệ thống sẽ chỉ quan tâm đến họ sử dụng từ khóa nào để đến với website cần thống kê, mỗi request đến bằng một từ khóa nào đó được tính là một Referer. Countries: Mỗi request đến với website cần tìm kiếm, từ một quốc gia nào đó được tính là 1 Referer System: Color/Resolution: Chúng ta sẽ thống kê người dùng đến từ loại màn hình nào: 16 triệu màu, 65,536 màu hay 256 màu. Màn hình hiển thị của người dùng ở chế độ nào Higher, 1024x760, 800x600, 640x480, Unknown. Browsers: Thống kê website theo tiêu chí nguời ta đến với website bằng trình duyệt nào: FireFox 2, FireFox 3, Internet Explorer 6, Internet Explorer 7, Safari, Opera, Google Chrome, … Operating Systems: Người dùng đến với website cần thống kê, sử dụng hệ điều hành nào. Traffic: Visits: Khái niệm Visit được đưa ra để tính tổng số session truy cập vào website cần thống kê. Sau một session mới, nếu người dùng truy cập vào lại website đó thì tính là lần truy cập mới. Để có thể hiểu rõ hơn về Visit, ta có thể hình dung như sau: Mỗi khi ta đến 1 trang web, có nghĩa là ta đã mở một session (và cũng có nghĩa là 1 Visit), và session mới chỉ tính khi ta đóng trình duyệt web đó lại rồi lại mở trình duyệt web lên lại và truy cập vào lại trang web. Thông thường, ở một số website, người ta thiết đặt thời gian timeout của mỗi session khoảng 30 phút, có nghĩa là sau 30 phút nếu ta không gửi cho server bất kỳ một request nào, thì server sẽ tạo lại cho ta một session mới. Page views: Là tổng số lần load trang web, tức là số Page views sẽ được tăng lên mỗi khi người sử dụng tác động lên 1 trang web nào đó bằng cách refresh lại trang hoặc đến 1 trang con khác.. Unique visitors: Có thể 1 người sử dụng sẽ đến với website cần thống kê nhiều lần, nhưng để xác định xem có bao nhiêu người cụ thể đến với website cần thống kê thì người ta đưa ra khái niệm Unique visitors. New visitors: Để tính xem trong tuần này, hoặc tháng này có bao nhiêu người mới đến với website cần thống kê, người ta đưa ra khái niệm New Visitor. Những người nào đã từng đến với website thống kê 1 lần rồi thì sẽ không được tính là New Visitor nữa.. Visit per week: Thống kê website có bao nhiêu lượt truy cập trong một tuần. Trong 1 tuần thì thường người ta đến với website của mình nhiều nhất vào ngày nào trong tuần. Visit per hour: Thống kê lượng truy cập theo giờ trong một ngày. Tiêu chí này rất quan trọng, dựa trên tiêu chí này người ta sẽ biết được website của mình được truy cấp nhiều nhất vào giờ nào trong ngày. Visit frequency: Để tính độ thường xuyên của người sử dụng khi họ sử dụng trang web cần thống kê, nghĩa là khi chúng ta quan tâm đến việc họ đến website mình một lần, rồi họ có quay lại nữa hay không, quay lại bao nhiêu lần. Để tính được mật độ này, người ta đưa ra khái niệm Visit Frequency. Time: Time spent on site: Thời gian người dùng ở lại với website trong thời gian bao lâu cho 1 lần truy cập. Time spent on page: Trong một hệ thống website thì có rất nhiều trang, chúng ta sẽ tính thời gian người truy cập ở lại đối với mỗi trang. Page: Entry pages: Thống kê tất cả các trang mà người dùng thường bắt đầu website cần thống kê với trang này. Thường thì trang này rất quan trọng, nó có thể là trang chủ, hoặc là một trang có nội dung hay nên được nhiều người vào và được rating cao trên các cỗ máy tìm kiếm. Exit pages: Thống kê tất cả các trang mà người dùng thường bắt đầu website cần thống kê với trang này. Thường thì khi nắm được con số của những trang này, các webmaster sẽ tìm hiểu vì sao họ lại kết thúc ở đây, có thể vì không có liên kết đến với trang khác, hoặc là kém hấp dẫn, v.v... Khai thác thông tin của client khi họ truy cập vào 1 website Java script và khả năng khai thác thông tin Có rất nhiều thông tin của người sử dụng khi họ truy cập đến 1 trang web mà ta chỉ có thể khai thác bằng cách sử dụng javascript đặt vào website cần thống kê. Sau đây, chúng ta sẽ tìm hiểu 1 số thông số về trình duyệt mà javascript có thể lấy thông tin. Độ rộng màn hình Để xác định được độ rộng màn hình, chúng ta chỉ có thể nhận được thống ctả số đó từ phía client, và thông tin đó được lưu trữ trong biến screen.width của javascript. Bằng cách gửi thông tin này lên phía server thống kê, ta sẽ có được độ rộng màn hình của người đang truy cập vào website cần thống kê Hệ màu Tương tự như xác định độ rộng màn hình, hệ màu của người đang truy cập vào website cần thống kê được lưu lại tại client, và có thể được lấy ra bằng cách sử dụng biến screen.pixelDepth (Đối với Netscape) hoặc screen.colorDepth (Đối với các trình duyệt khác) Có sử dụng cookie? Bằng cách sử dụng cookie, ta có thể xác định được trình duyệt mà người đang sử dụng website cần thống kê có chấp nhận cookie hay không. Khi biết được thông tin này, các webmaster sẽ có kế hoạch thiết kế trang web cho phù hợp. Các plugin HTTP Header và khả năng khai thác thông tin HTTP Header là gì? Đối với mỗi request đến 1 website, HTTP Headers gửi rất nhiều các thông tin liên quan đến người truy cập để server có thể nhận biết để có lặp lại “để” cách hành xử tương ứng, và cũng rất quan trọng trong mỗi HTTP Response (mang các thông tin cần thiết từ phía server gửi về phía client). Nó định nghĩa một số loại dữ liệu khác nhau, bao gồm các thông tin của một lần yêu cầu (request) và các thông tin đáp trả (response). Các thông tin trong header sẽ nằm trên các dòng khác nhau của header. Các thông tin về HTTP Header nằm ở dạng chuỗi (string) dưới dạng text ASCII, nhưng đôi khi cũng mang những thông tin rất khó hiểu (đã được mã hóa). Như vậy, HTTP Header mang những thông tin nào mà chúng ta cần quan tâm? User-Agent User-Agent mang các thông tin về trình duyệt, hệ điều hành của người đang truy cập vào website. Chúng ta sẽ xem xét User-Agent qua các ví dụ sau: Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727) Ví dụ thứ nhất, ta có thể thấy được người truy cập đến bằng trình duyệt Firefox và hệ điều hành Windows. Ở ví dụ thứ 2, ta thấy rằng người truy cập đến bằng trình duyệt Internet Explorer 6.0 (MSIE 6) và bằng hệ điều hành Windows. Referer Khi một website được mở ra, webmaster sẽ quan tâm đến việc trang web này đến từ đâu, được click vào từ một liên kết nằm trên trang web nào, có nghĩa là Referer chứa địa chỉ của trang web trước đó mà từ đó, người ta click vào link để đến trang web hiện tại. Cookie Tất cả các thông tin được lưu trữ trong cookie sẽ được gửi đến server nằm trong mục Cookie (chỉ những cookie có domain hợp lệ với domain hiện tại thì mới được gửi lên) Ngoài ra, mỗi request đến server thì đều có thể nhận biết được là đến từ IP-Address nào, qua đó ta có thể thống kê lại được các thông số về tần suất truy cập hoặc là các thống ctả số về các quốc gia.định dạng ? Tổng quan về Webservices Giới thiệu công nghệ Theo định nghĩa của W3C (World Wide Web Consortium), dịch vụ Web là một hệ thống phần mềm được thiết kế để hỗ trợ khả năng tương tác giữa các ứng dụng trên các máy tính khác nhau thông qua mạng Internet, giao diện chung và sự gắn kết của nó được mô tả bằng XML. Dịch vụ Web là tài nguyên phần mềm có thể xác định bằng địa chỉ URL, thực hiện các chức năng và đưa ra các thông tin người dùng yêu cầu. Một dịch vụ Web được tạo nên bằng cách lấy các chức năng và đóng gói chúng sao cho các ứng dụng khác dễ dàng nhìn thấy và có thể truy cập đến những dịch vụ mà nó thực hiện, đồng thời có thể yêu cầu thông tin từ dịch vụ Web khác. Nó bao gồm các mô đun độc lập cho hoạt động của khách hàng và doanh nghiệp và bản thân nó được thực thi trên server. Trước hết, có thể nói rằng ứng dụng cơ bản của Dịch vụ Web là tích hợp các hệ thống và là một trong những hoạt động chính khi phát triển hệ thống. Trong hệ thống này, các ứng dụng cần được tích hợp với cơ sở dữ liệu (CSDL) và các ứng dụng khác, người sử dụng sẽ giao tiếp với CSDL để tiến hành phân tích và lấy dữ liệu. Trong thời gian gần đây, việc phát triển mạnh mẽ của thương mại điện đòi hỏi các hệ thống phải có khả năng tích hợp với CSDL của các đối tác kinh doanh (nghĩa là tương tác với hệ thống bên ngoài – bên cạnh tương tác với các thành phần bên trong của hệ thống trong doanh nghiệp). Đặc điểm của Dịch vụ Web Đặc điểm: Dịch vụ Web cho phép client và server tương tác được