Nghiên cứu phát triển giải thuật quản lý nhiều bản sao cho các ứng dụng phức tạp

Bài viết này nêu lên kết quả mô hình hóa và nghiên cứu giải thuật đảm bảo tính gắn bó thông tin trong quản lý nhiều bản sao trên môi trường phân tán hiện đại. Trên cơ sở lý thuyết về cập nhật thông tin cho các bản sao của cùng một đối tượng, kỹ thuật đánh dấu bản điều khiển cho phép xác định trạng thái chung của toàn hệ và chọn lựa giải thuật cập nhật phù hợp được nghiên cứu. Việc tham chiếu đến bản điều khiển là cơ sở chủ yếu để các tác tử tự quyết định khi tiến hành cập nhật các bản sao một cách tin cậy. Toàn bộ giải pháp kỹ thuật này được thiết kế và xây dựng bằng Java trên JVM và bao gồm các bước thể hiện hoạt động của hệ theo phương thức cung cấp động danh sách các bản sao cần phải cập nhật. Kết quả này có thể phục vụ cho quá trình nghiên cứu thiết kế và xây dựng các ứng dụng phức tạp với khối lượng lớn các thông tin dùng chung cần xử lý.

doc11 trang | Chia sẻ: lvbuiluyen | Lượt xem: 1821 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Nghiên cứu phát triển giải thuật quản lý nhiều bản sao cho các ứng dụng phức tạp, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Báo cáo tốt nghiệp NGHIÊN CỨU PHÁT TRIỂN GIẢI THUẬT QUẢN LÝ NHIỀU BẢN SAO CHO CÁC ỨNG DỤNG PHỨC TẠP MỤC LỤC LÊ VĂN SƠN Trường Đại học Sư phạm - Đại học Đà Nẵng TÓM TẮT Bài viết này nêu lên kết quả mô hình hóa và nghiên cứu giải thuật đảm bảo tính gắn bó thông tin trong quản lý nhiều bản sao trên môi trường phân tán hiện đại. Trên cơ sở lý thuyết về cập nhật thông tin cho các bản sao của cùng một đối tượng, kỹ thuật đánh dấu bản điều khiển cho phép xác định trạng thái chung của toàn hệ và chọn lựa giải thuật cập nhật phù hợp được nghiên cứu. Việc tham chiếu đến bản điều khiển là cơ sở chủ yếu để các tác tử tự quyết định khi tiến hành cập nhật các bản sao một cách tin cậy. Toàn bộ giải pháp kỹ thuật này được thiết kế và xây dựng bằng Java trên JVM và bao gồm các bước thể hiện hoạt động của hệ theo phương thức cung cấp động danh sách các bản sao cần phải cập nhật. Kết quả này có thể phục vụ cho quá trình nghiên cứu thiết kế và xây dựng các ứng dụng phức tạp với khối lượng lớn các thông tin dùng chung cần xử lý. ABSTRACT This paper presents the result of modelisation and algorithm research to assure the coherence in managing multicopies of the modern distributive environment. On the theory of information update for the copies of the same object, the technique of marking the control panel allows defining the general state of the whole system and choosing the appropriate update researched algorithm. The reference to control panel is the principal basis for an agent to make decision when it carries out updating the copies reliably. All of this technical measure is designed and built by Java on JVM and consists of the steps of the system activities according to the method of dynamic supplication for the list of updated copies. This result can serve the process of research on designing and building complicated applications with the large quantity of treated information. I. ĐẶT VẤN ĐỀ Hiện nay, trong lĩnh vực mạng diện rộng, đặc biệt là mạng Internet, việc quản lý nhiều bản sao của cựng một đối tượng thông tin đang được các nhà chuyên môn tin học quan tâm nghiên cứu ngay trong giai đoạn phân tích, thiết kế và xây dựng hệ điều hành. Ngoài ra, đây cũn là một trong những vấn đề có tính chất cơ sở cho các ứng dụng phức tạp. Quản lý nhiều bản sao (multicopies) là giải phỏp kỹ thuật bao gồm tập hợp cỏc thụng tin được nhân bản từ một đối tượng thông tin và các chương trỡnh quản lý chỳng trong mụi trường phân tán. Vấn đề truy cập và xử lý thụng tin phõn tỏn núi chung, quản lý nhiều bản sao núi riờng được nghiên cứu trong hàng loạt các công trỡnh, đặc biệt của Herman, Ellis, Wilms và Le Lann [[5], tr. 205-206 và 275-291]. Các giải thuật này là cơ sở chủ yếu cho giải pháp đảm bảo sự gắn bó yếu nhờ dấu, nhờ bộ tuần tự tuần hoàn và đảm bảo sự gắn bó mạnh cho các hệ thống đồng nhất. Yờu cầu quan trọng của tất cả cỏc giải phỏp quản lý nhiều bản sao là đảm bảo tính gắn bó thông tin (coherence), toàn vẹn dữ liệu và trỏnh bế tắc diễn ra trong quỏ trỡnh khai thỏc - vận hành hệ. Nội dung quản lý nhiều bản sao là cỏc giải phỏp cho phộp tự động hóa các công việc kiểm tra tính hợp thức của truy cập thông tin, khôi phục thông tin, cập nhật thông tin, an toàn cho các bản sao, sử dụng các bộ nhớ, đĩa, lưu lịch sử, mở/ghi lịch sử, chuyển các bản loại bỏ vào vùng có thể khôi phục,...Trong các nội dung nêu trên, vấn đề quan trọng nhất là cập nhật tự động thông tin vào các bản sao. Bài viết này định hướng chủ yếu vào việc xây dựng hệ thống giải pháp kỹ thuật quản lý nhiều bản sao trong mụi trường phân tán phục vụ cho các ứng dụng có khối lượng xử lý thông tin lớn trong điều kiện kỹ thuật phần cứng, phần mềm không đồng nhất. Mục tiờu nghiờn cứu của đề tài là xây dựng mô hỡnh hoạt động của hệ phân tán và phát triển giải thuật quản lý nhiều bản sao trờn cơ sở công nghệ tác tử di động trên môi trường JVM. II. CẬP NHẬT THÔNG TIN TRONG MÔI TRƯỜNG PHÂN TÁN Mụ hỡnh và giải thuật nghiờn cứu phải đảm bảo các đặc tính toàn vẹn đó được nêu trong [[6], tr. 205-206] và tuân thủ theo các giai đoạn thể hiện trong hỡnh vẽ 1. Mỗi một giai đoạn cập nhật thể hiện những đặc điểm riêng biệt về sự gắn bó dữ liệu giữa các bản sao. Trong giai đoạn 1 và 3, thao tác duy nhất là lưu dữ liệu và trạng thái hiện có là đủ. Nếu nằm vào trạng thái 2, thỡ tỏc tử phải cố gắng kết thỳc cụng việc của mỡnh ở điểm II hoặc là phải phục hồi lại trạng thái ban đầu ở điểm I. Hai giai đoạn gắn bó 1 và 2 cú bản dữ liệu khỏc nhau. Trong môi trường phân tán, sơ đồ vị trí của các bản sao và việc cập nhật chúng có thể mô tả trong hỡnh vẽ 2 sau đây. Các bản sao có thể đặt trên các server S1, S2,...,Sn trên các tập tin hay vùng nhớ đặc biệt bij, i=1..n, j=1..m, trong đó i chỉ server, j chỉ bản sao, n là số lượng server được mắc nối trong mạng, m là số lượng các bản sao cần phải cập nhật. Mỗi server có thể quản lý một mạng con. Ngoài ra, cỏc bản sao cú thể được bố trí trên các trạm thể hiện bằng cỏc tk, k=1..q, k là trạm và q là số trạm được mắc nối. Nếu ta cú n bản sao của đối tượng b nào đó, thỡ ràng buộc toàn vẹn phải là: Trên bản sao của 1 đối tượng b1=b2=b3=...=bn Trên các bản sao của toàn bộ các đối tượng b11=b21=...=bn1 b12=b22=...=bn2 ... b1m=b2m=...=bnm Gọi M là cực đại của các cập nhật có thể diễn ra đồng thời, thỡ M cú thể tớnh theo cụng thức M=n x m. Căn cứ vào nội dung thông tin cần phải đảm bảo sự gắn bó mà người ta chia ra hai loại giải thuật: · Giải thuật toỏn gắn bú mạnh · Giải thuật toỏn gắn bú yếu. Hệ thống viễn thông là đối tượng có thể diễn ra các sự cố kỹ thuật và ùn tắt đường truyền, ta có số lần truy cập bản sao trên thực tế sẽ lớn hơn M rất nhiều; hiệu năng hoạt động của hệ trong trường hợp này sẽ bị giảm. Một trong những giải pháp khắc phục vấn đề vừa nêu là áp dụng kỹ thuật đánh dấu bản điều khiển và căn cứ vào hệ thống tín hiệu này, người ta có thể chọn các giải thuật cập nhật thích hợp, rút ngắn được tốc độ cập nhật bỡnh quõn. Việc lựa chọn giải thuật cập nhật được tiến hành trên cơ sở truy cập vào cấu trúc phân tầng. Cấu trúc này được mô tả trong hỡnh vẽ 3. Ứng với mỗi một loại truy cập, người ta có thể hoặc là áp dụng các giải thuật đang có đó được kiểm nghiệm hoặc là phải nghiên cứu các giải thuật phù hợp hơn nhằm khai thác tối đa khả năng của kỹ thuật và công nghệ mới. III. KỸ THUẬT ĐÁNH DẤU BẢN ĐIỀU KHIỂN Kỹ thuật đánh dấu bản điều khiển gọi tắt là TOMCP (Technique Of Marking the Control Panel) là một hệ thống bao gồm các chương trỡnh, danh sỏch tài nguyờn cần thiết để thực hiện các lệnh và tổ hợp các tín hiệu cho phép nhận biết trạng thái của toàn bộ các bản sao đang được sử dụng trong hệ. Thành phần cơ bản của TOMCP có thể mô tả trong hỡnh vẽ 4 sau đây. Chương trỡnh quản lý TOMCP được xây dựng dưới dạng thủ tục tiện ích với chức năng chủ yếu là kiểm tra tính hợp thức của việc truy cập vào bản, dũ tỡm thụng tin, cập nhật cỏc tớn hiệu và yờu cầu được cung cấp tài nguyên theo danh sách,... Thủ tục này là một trong những thành phần cơ bản của tác tử. Danh sách các tài nguyên cần thiết là tổ hợp các các thiết bị, chương trỡnh và dữ liệu phục vụ cho việc quản lý TOMCP. Hệ thống cỏc tớn hiệu nhận dạng là tập hợp cỏc chuẩn hỡnh thành trong quỏ trỡnh thiết kế hệ phục vụ cho việc nhận biết tự động trạng thái của hệ quản lý nhiều bản sao và xác định GTl cần thực hiện. Nội dung cơ bản của kỹ thuật này có thể mô tả trong hỡnh vẽ 5. Theo mụ hỡnh điều khiển này, tại mỗi tác tử di động, trạng thái các bản sao trên toàn bộ hệ thống được thể hiện một cách chính xác và nhờ đó các tác tử biết cần phải hành động như thế nào là tối ưu nhất. Mỗi khi cập nhật, thay vỡ phải kớch hoạt một trỡnh điều khiển như mô hỡnh Client/Server chứa sẵn trờn Server và gửi toàn bộ các yêu cầu thay đổi, thỡ kỹ thuật này cho phộp chỉ gửi những chi tiết cần thay đổi là đủ. Việc làm tươi thông tin trong bản điều khiển sẽ do các tác tử thực hiện tự động căn cứ vào dữ liệu mà nó có được. Những thông tin này có khối lượng không lớn và được các tác tử trao đổi với nhau bằng thông điệp. Để tránh bế tắc diễn ra trong quá trỡnh truy cập bản điều khiển theo kiểu 2 pha, thông thường giải pháp gắn bú mạnh của Herman được sử dụng. Hai tỏc tử quan trọng trong tiến trỡnh truy cập bản để đọc và ghi bản là tác tử gửi thông điệp (tác tử yêu cầu) và tác tử nhận thông điệp (tác tử đáp ứng yêu cầu). Cấu trúc của các thông điệp trao đổi giữa các tác tử có thể mô tả trong hỡnh vẽ 6 dưới đây. Các trường của thông điệp trao đổi là: 1 START Bắt đầu Giá trị 8 bít cho phép bắt đầu thông điệp. 2 SOURCE Địa chỉ nguồn Địa chỉ tác tử gửi thông điệp với độ dài từ 8 bít đến 16 bít đủ để biểu diễn số lượng địa chỉ của các tác tử trong các hệ thống lớn. 3 TARGET Địa chỉ đích Địa chỉ của tác tử nhận với độ dài của trường từ 8 bít đến 16 bít. 4 CODE Mó Mó sử dụng để nhận biết phép toán trên bản với độ dài là 8 bít. Ý nghĩa các bít được trỡnh bày trong hỡnh 6. 5 INFORMATION Thụng tin Thụng tin cần thiết để truy cập vào các bản sao. 6 CONTROL Kiểm tra Trường kiểm tra phục vụ cho việc truyền dữ liệu qua mạng và các giá trị được quy ước cho từng loại mạng cụ thể. 7 END Kết thỳc Giá trị 8 bít cho phép kết thúc thông điệp. Giỏ trị cỏc bớt của trường CODE được thể hiện trong hỡnh 7 dưới đây. Ưu điểm căn bản của kỹ thuật đánh dấu bản điều khiển là: 1 Gắn bú Đảm bảo tính gắn bó thông tin. Nếu kết hợp với kỹ thuật hàng đợi các thông điệp ta có thể tránh được hiện tượng thiếu vô hạn tài nguyên. 2 Tin cậy Hệ thống hoạt động với kỹ thuật này chịu đựng được trạng thái lỗi của mạng nói chung, trong đó có lỗi của hệ thống đường truyền. 3 Nhạy Phản ứng được với các tỡnh huống sinh lỗi. 4 Liờn tục Cho phộp phõn phối động các tài nguyên cần cập nhật. 5 Phỏt hiện sự cố Phỏt hiện cỏc lỗi phỏt sinh trong quỏ trỡnh vận hành. 6 Thống kờ Biết được trạng thái cập nhật ở mọi thời điểm. Ngoài ra, để hoàn chỉnh kỹ thuật này, ta cần nghiên cứu Root Server với chức năng giám sát thường xuyên các hoạt động của toàn bộ tác tử cập nhật. IV. GIẢI THUẬT QUẢN Lí NHIỀU BẢN SAO Sơ đồ thể hiện giải thuật tổng quát xử lý cập nhật thụng tin vào cỏc bản sao được mô tả trong hỡnh vẽ 9. Cỏc thụng điệp trao đổi được sử dụng với các mục đích khác nhau căn cứ vào nội dung của trường CODE. Tác tử gửi ghi thông tin yêu cầu dưới dạng mó vào trường này, cũn tỏc tử nhận sẽ căn cứ vào mó đó để nhận biết sẽ phải hành động như thế nào trên bản sao. Việc xử lý trạng thái điều khiển do tác tử nhận tiến hành trên cơ sở tham chiếu thông tin trong bản điều khiển và theo yêu cầu thể hiện trong hỡnh 8. Sau khi hoàn thành trọn vẹn công việc, tác tử nhận tiến hành phát thông điệp đến toàn bộ các tác tử của hệ thống để cập nhật vào bản điều khiển, đồng thời tự động cập nhật vào bản cục bộ của mỡnh. Khi cập nhật, giải thuật GTl, l=1..P được thực hiện bởi tác tử nhận trong cơ chế then cài đối với các phép làm thay đổi thông tin trong bản sao, ngược lại, thỡ thực hiện theo kiểu tương tranh. Việc phỏt hiện và xử lý lỗi trong quỏ trỡnh xử lý được tiến hành ngay sau khi tác tử nhận được yêu cầu cập nhật. Nếu mọi cố gắng sửa lỗi không thể thực hiện có kết quả, thỡ thụng điệp sẽ được phát đi để yêu cầu tác tử gửi phát lại thông tin. Trong trường hợp công việc cập nhật kết thúc tốt đẹp, một thông điệp khẳng định cũng được phát đi bởi tác tử nhận. Sau khi phát đi thông điệp, tác tử gửi chuyển sang trạng thái chờ thông điệp mới, cũn tỏc tử nhận thụng điệp chỉ chuyển sang trạng thái chờ khi đó nhận đủ các thông điệp khẳng định. Các bước thể hiện công việc xử lý thông tin điều khiển được tiến hành tuần tự như trong hỡnh 10 sau đây. Thuật toỏn kiểm tra và cập nhật bản sao thể hiện bằng cỏc khối trong hỡnh vẽ 11, trong đó mỗi khối có thể xây dựng một thủ tục hoặc hàm chuyên biệt. Sơ đồ trên được nghiên cứu cho việc ghi có kiểm tra thông tin vào một trường xác định của bản sao là cơ sở dữ liệu phân tán. V. KẾT LUẬN Trong quỏ trỡnh xõy dựng cỏc phần mềm cho hệ phõn tỏn hỗ trợ cỏc ứng dụng lớn như thương mại điện tử, chính phủ điện tử,... vấn đề cập nhật thông tin dùng chung trong các bản sao của cùng một đối tượng là một trong những vấn đề quan trọng. Nó không chỉ đảm bảo hệ thống hoạt động với tốc độ bỡnh quõn chấp nhận được, ổn định, tin cậy mà quan trọng hơn cả là phải đảm bảo tính gắn bó của dữ liệu trong các bản sao. Mụ hỡnh hệ thống quản lý nhiều bản sao giống nhau trờn mụi trường phân tán và các giải thuật được nghiên cứu đó đáp ứng các yêu cầu của một hệ thống phức tạp với lượng thông tin lớn cần phải xử lý và thể hiện ở cỏc mặt sau đây: · Tự động hóa cập nhật các bản sao · Phát triển giải thuật nhiều bản sao trong môi trường phân tán hiện đại · Làm phong phú khả năng ứng dụng các tác tử di động. · Triển khai kỹ thuật đánh dấu bản điều khiển trong quản lý nhiều bản sao · Bổ sung lý thuyết cập nhật nhiều bản sao Kết quả nghiên cứu đó thể hiện cụ đọng bằng những sơ đồ giải thuật và mô hỡnh. Cỏc giải thuật và mụ hỡnh này đó được thực nghiệm trên ngôn ngữ Java RMI trong môi trường Java ảo. TÀI LIỆU THAM KHẢO Guy Pujolle, Les Rộseaux, Eyrolles, Paris 1995. S. Fdida, G. Pujolle, Modốles de systốmes et de rộseaux, Tom I, Performances, Eyrolles, Paris, 1989. Lê Văn Sơn, Trần Nguyễn Hồng Phúc, Nghiờn cứu cỏc kỹ thuật thụng bỏo lỗi và kỹ thuật truy vấn hệ thống trong mạng Internet bằng ICMP, Tạp chí Khoa học và Công nghệ các Trường Đại học Kỹ thuật, Hà Nội, Số 38+39 (2002), tr. 11-16. Abraham Silberschatz và Peter B. Galvin, Principes des systemes d’exploitation, 4e edition, Addison-Wesley, 1998. Le Van Son, Tra Van Son, Integrating Mobile Agent into Network Management, ASIAN'02 Workshop on Southeast Asian Computing Research, Hanoi, V1, pp 1-3.
Luận văn liên quan