Sự phát triển của mạng máy tính có tác động sâu sắc đến nhiều khía cạnh của khoa học kĩ thuật cũng như cuộc sống con người. Việc ra đời và phát triển của các mạng tốc độ cao đã đẩy nhanh sự phát triển của mạng máy tính , qua mạng tốc độ cao quá trình truy xuất các luồng thông tin khác nhau được thực hiện nhanh hơn với giá thành thấp hơn. Hệ thống thông tin cũng như mạng máy tính cần phải được xây dựng phức tạp hơn để đáp ứng nhu cầu xử lí , truyền tải thông tin với tốc độ nhanh và dung lượng lớn. Sự phát triển của mạng máy tính hiện nay đã dẫn đến sự hình thành và phát triển của mạng Internet, internet cung cấp cho thế giới rất nhiều dịch vụ đa dạng, một trong những dịch vụ của Internet được sử dụng rộng rãi và được nhiểu người quan tâm nhất nhất là Word Wide Web. Các trang Web được lưu trữ trong các WebServer, với số lượng các trang Web tăng một cách nhanh chóng hiện nay thì việc đảm bảo cho các WebServer hoạt động có hiệu quả là một yêu cầu hết sức cần thiết. Trong quá trình thiết kế xây dựng mạng máy tính đặc biệt là hệ thống internet thì một nhiệm vụ đặt ra hết sức quan trọng là phải phân tích đánh giá được hiệu năng của hệ thống để hỗ trợ cho việc xây dựng và phát triển hệ thông tin.
Việc phân tích đánh giá hiệu năng của mạng máy tính là một việc tương đối phức tạp. Một trong những phương pháp đánh giá được sử dụng rộng rãi và có hiệu quả trên thực tế là phương pháp mô hình hoá và các mô hình được sử dụng hiện nay là mô hình hàng đợi, mạng Petri, đồ thị, và các mô hình lai ghép. Trong đó mô hình hàng đợi là một mô hình đơn giản và tỏ ra có hiệu quả trong thực tế. Lý thuyết xếp hàng đã được nghiên cứu rộng rãi trên thế giới đầu thế kỉ 20. Có nhiều ứng dụng được cài đặt sử dụng lí thuyết này, có các thư viện mở được xây dựng để giải quyết các bài toán trên mô hình hàng đợi một trong số đó có thể kể đến là thư viện PDQ .
Do sự phổ biến và có hiệu quả của lí thuyết xếp hàng trong việc đánh giá hiệu năng của mạng mà đồ án của em sẽ đi xâu vào nghiên cứu lí thuyết xếp hàng từ đó xây dựng thư viện giải bài toán hàng đợi và áp dụng để cài đặt chương trình minh hoạ tính các tham số hiệu năng của WebServer. Đồ án của em gồm 5 chương với các nội dung chính sau :
- Chương 1 : Tổng quan về đánh giá hiệu năng của mạng máy tính
Chương này sẽ trình bày sơ lược về mạng máy tính, hiệu năng của mạng máy tính và phương pháp mô hình hoá để đánh giá hiệu năng của mạng máy tính. Trong chương này em giới thiệu về các độ đo hiệu năng được sử dụng để đánh giá hiệu năng của mạng máy tính, yêu cầu đối với bài toán phân tích đánh giá hiệu năng của mạng máy tính. Sau đó trình bày về phương pháp mô hình hoá để đánh giá hiệu năng của mạng máy tính và đi đến kết luận mô hình hàng đợi là mô hình phù hợp cho bài toán phân tích đánh giá hiệu năng của mạng máy tính.
- Chương 2 : Lí thuyết xếp hàng
Chương này trình bày các khái niệm cơ bản của lí thuyết xếp hàng, các tham số của hệ thống hàng đợi, một số lí thuyết toán học như quá trình Poisson, phân bố mũ Sau đó đi sâu vào khảo sát một số hàng đợi cụ thể như M/M/1, M/G/1 Phần cuối của chương giới thiệu về mạng các hàng đợi trong đó em trình bày một số thuật toán để giải mô hình mạng các hàng đợi như thuật toán phân tích giá trị trung bình và thuật toán tích chập.
- Chương 3 : Khảo sát thư viện lập trình giải bài toán hàng đợi
Chương này em sẽ đi vào giới thiệu một thư viện lập trình mở để giải các mô hình hàng đợi PDQ, đây là một thư viện mở , viết bằng C chuẩn, được cung cấp miễn phí. Sau khi giới thiệu qua về môi trường , giao diện lập trình, cách sử dụng các biến, các hàm của thư viện em đã sử dụng nó để xây dựng thêm một số hàm bổ sung vào thư viện
- Chương 4 : Đánh giá hiệu năng của WebServer
Chương này em trình bày các khái niệm cơ bản nhất về Web, và WebServer. Sau đó nêu sự cần thiết và yêu cầu chung về đánh giá hiệu năng của WebServer.
- Chương 5 : Xây dựmg chương trình xác định thời gian đáp ứng và dung lượng của WebServer sử dụng mô hình hàng đợi và thư viện PDQ.
Chương này em xây dựng mô hình hàng đợi để mô hình hoá hoạt động của WebServer từ đó dùng thư viện PDQ để viết chương trình tính thời gian đáp ứng và thông lượng của WebServer
72 trang |
Chia sẻ: tuandn | Lượt xem: 3460 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đồ án Lí thuyết hàng đợi và hiệu năng mạng máy tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MỤC LỤC
MỞ ĐẦU
Sự phát triển của mạng máy tính có tác động sâu sắc đến nhiều khía cạnh của khoa học kĩ thuật cũng như cuộc sống con người. Việc ra đời và phát triển của các mạng tốc độ cao đã đẩy nhanh sự phát triển của mạng máy tính , qua mạng tốc độ cao quá trình truy xuất các luồng thông tin khác nhau được thực hiện nhanh hơn với giá thành thấp hơn. Hệ thống thông tin cũng như mạng máy tính cần phải được xây dựng phức tạp hơn để đáp ứng nhu cầu xử lí , truyền tải thông tin với tốc độ nhanh và dung lượng lớn. Sự phát triển của mạng máy tính hiện nay đã dẫn đến sự hình thành và phát triển của mạng Internet, internet cung cấp cho thế giới rất nhiều dịch vụ đa dạng, một trong những dịch vụ của Internet được sử dụng rộng rãi và được nhiểu người quan tâm nhất nhất là Word Wide Web. Các trang Web được lưu trữ trong các WebServer, với số lượng các trang Web tăng một cách nhanh chóng hiện nay thì việc đảm bảo cho các WebServer hoạt động có hiệu quả là một yêu cầu hết sức cần thiết. Trong quá trình thiết kế xây dựng mạng máy tính đặc biệt là hệ thống internet thì một nhiệm vụ đặt ra hết sức quan trọng là phải phân tích đánh giá được hiệu năng của hệ thống để hỗ trợ cho việc xây dựng và phát triển hệ thông tin.
Việc phân tích đánh giá hiệu năng của mạng máy tính là một việc tương đối phức tạp. Một trong những phương pháp đánh giá được sử dụng rộng rãi và có hiệu quả trên thực tế là phương pháp mô hình hoá và các mô hình được sử dụng hiện nay là mô hình hàng đợi, mạng Petri, đồ thị, và các mô hình lai ghép. Trong đó mô hình hàng đợi là một mô hình đơn giản và tỏ ra có hiệu quả trong thực tế. Lý thuyết xếp hàng đã được nghiên cứu rộng rãi trên thế giới đầu thế kỉ 20. Có nhiều ứng dụng được cài đặt sử dụng lí thuyết này, có các thư viện mở được xây dựng để giải quyết các bài toán trên mô hình hàng đợi một trong số đó có thể kể đến là thư viện PDQ .
Do sự phổ biến và có hiệu quả của lí thuyết xếp hàng trong việc đánh giá hiệu năng của mạng mà đồ án của em sẽ đi xâu vào nghiên cứu lí thuyết xếp hàng từ đó xây dựng thư viện giải bài toán hàng đợi và áp dụng để cài đặt chương trình minh hoạ tính các tham số hiệu năng của WebServer. Đồ án của em gồm 5 chương với các nội dung chính sau :
- Chương 1 : Tổng quan về đánh giá hiệu năng của mạng máy tính
Chương này sẽ trình bày sơ lược về mạng máy tính, hiệu năng của mạng máy tính và phương pháp mô hình hoá để đánh giá hiệu năng của mạng máy tính. Trong chương này em giới thiệu về các độ đo hiệu năng được sử dụng để đánh giá hiệu năng của mạng máy tính, yêu cầu đối với bài toán phân tích đánh giá hiệu năng của mạng máy tính. Sau đó trình bày về phương pháp mô hình hoá để đánh giá hiệu năng của mạng máy tính và đi đến kết luận mô hình hàng đợi là mô hình phù hợp cho bài toán phân tích đánh giá hiệu năng của mạng máy tính.
- Chương 2 : Lí thuyết xếp hàng
Chương này trình bày các khái niệm cơ bản của lí thuyết xếp hàng, các tham số của hệ thống hàng đợi, một số lí thuyết toán học như quá trình Poisson, phân bố mũ… Sau đó đi sâu vào khảo sát một số hàng đợi cụ thể như M/M/1, M/G/1…Phần cuối của chương giới thiệu về mạng các hàng đợi trong đó em trình bày một số thuật toán để giải mô hình mạng các hàng đợi như thuật toán phân tích giá trị trung bình và thuật toán tích chập.
- Chương 3 : Khảo sát thư viện lập trình giải bài toán hàng đợi
Chương này em sẽ đi vào giới thiệu một thư viện lập trình mở để giải các mô hình hàng đợi PDQ, đây là một thư viện mở , viết bằng C chuẩn, được cung cấp miễn phí. Sau khi giới thiệu qua về môi trường , giao diện lập trình, cách sử dụng các biến, các hàm của thư viện em đã sử dụng nó để xây dựng thêm một số hàm bổ sung vào thư viện
- Chương 4 : Đánh giá hiệu năng của WebServer
Chương này em trình bày các khái niệm cơ bản nhất về Web, và WebServer. Sau đó nêu sự cần thiết và yêu cầu chung về đánh giá hiệu năng của WebServer.
- Chương 5 : Xây dựmg chương trình xác định thời gian đáp ứng và dung lượng của WebServer sử dụng mô hình hàng đợi và thư viện PDQ.
Chương này em xây dựng mô hình hàng đợi để mô hình hoá hoạt động của WebServer từ đó dùng thư viện PDQ để viết chương trình tính thời gian đáp ứng và thông lượng của WebServer
Do hạn chế về điều kiện tiếp cận đối tượng nghiên cứu và trình độ hạn hẹp của mình nên đồ án của em không thể tránh được các sai sót, mong được sự thông cảm và góp ý kiến của các thầy cô và các bạn.
Em xin chân thành cảm ơn TSKH Nguyễn Thúc Hải _ Người thầy đã hướng dẫn tận tâm, nhiệt tình cho em trong suốt quá trình thực hiên đồ án tốt nghiệp cũng như trong suốt thời gian 3 năm em học tập ở khoa CNTT trường đại học Bách Khoa Hà Nội. Thầy là người đã định hướng và mở đường cho em trong việc xác định lĩnh vực nghiên cứu phân tích đánh giá hiệu năng của mạng máy tính. Em cũng xin được cám ơn các thầy cô giáo khoa CNTT trường đại học Bách Khoa Hà Nội đã tận tâm truyền đạt cho em rất nhiều kiến thức chuyên môn trong quá trình em học tập tại khoa. Và cuối cùng em xin cám ơn sự giúp đỡ quí báu của Trung Tâm đào tạo KSTN trường đại học Bách Khoa Hà nội và các bạn bè cùng khoá trong suốt quá trình thực hiện đồ án tốt nghiệp này.
Hà Nội ngày tháng năm 2003
TỔNG QUAN VỀ ĐÁNH GIÁ HIỆU NĂNG CỦA MẠNG MÁY TÍNH
Mạng máy tính và phân tích, đánh giá hiệu năng của mạng máy tính
Sự kết hợp của máy tính với hệ thống truyền thông đã tạo ra sự biến đổi có tính chất cách mạng trong vấn đề khai thác và sử dụng hệ thống máy tính. Các mô hình tập trung dựa trên các máy tính lớn với phương thức khai thác theo lô đã được thay thế bới mô hình tổ chức sử dụng mới trong đó các máy tính lớn được kết nối với nhau để cùng thực hiện một công việc. Môi trường làm việc với nhiều người sử dụng phân tán được hình thành, cho phép nâng cao hiệu quả của việc khai thác, sử dụng các tài nguyên chung ở các vị trí địa lí phân tán khác nhau . Hệ thống như thế được gọi là mạng máy tính.
Như vậy Mạng máy tính là một tập hợp các máy tính được nối với nhau để trao đổi thông tin nâng cao hiệu quả khai thác và sử dụng tài nguyên. Mạng máy tính được hình thành từ trước những năm 70 của thế kỉ 20, bắt đầu bằng việc nối các máy tính và các thiết bị đầu cuối dữ liệu để tận dụng tài nguyên, giảm giá thành truyền số liệu. Tiếp đó do việc tăng nhanh các máy PC đã dẫn tới tăng yêu cầu truyền số liệu giữa máy tính -terminal và ngược lại, vì vậy mạng máy tính ngày càng phát triển để đáp ứng nhu cầu của người dùng. Ngày nay sự phát triển của mạng truyền tin cho phép xây dựng các mạng máy tính rộng lớn mang tính toàn cầu. Mạng truyền tin bao gồm các nút truyền tin và các đường truyền kết nối các nút, các thiết bị đầu cuối, các thiết bị tập trung, các bộ xử lí, các máy tính được ghép nối vào các nút mạng.Trong mạng xuất hiện các trạm đầu cuối thông minh được liên kết chặt chẽ dựa trên các máy tính. Các xử lí ngoại vi của mạng được đưa vào các máy chủ trong các trạm đầu cuốithông minh.
Việc kết nối các máy tính thành mạng máy tính có hai mục tiêu chính là :
- Tận dụng tài nguyên chung, xoá bỏ khoảng cách địa lí
- Tăng chất lượng hiệu quả khai thác, xử lí thông tin và độ tin cậy của hệ thống.
Ngày nay mạng máy tính đã trở thành lĩnh vực nghiên cứu nhằm đảm bảo truyền tin đúng , chính xác, có hiệu quả. Một trong những lĩnh vụ nghiên cứu quan trọng của mạng máy tính là phân tích đánh giá hiệu năng của mạng máy tính. Lĩnh vực này sẽ hỗ trợ cho quá trình thiết kế và xây dựng mạng máy tính để đạt được mục tiêu đề ra của mạng máy tính là tăng chất lượng hiệu quả khai thác, xử lí thông tin và độ tin cậy của hệ thống.
Như chúng ta đã biết thì khái niệm về hiệu năng, bản thân nó không phải là một thực thể được định nghĩa một cách duy nhất. Hiện có nhiều độ do khác nhau với các đánh giá hiệu năng thích hợp với một mạng máy tính như thông lượng, thời gian thiết lập liên kết, thời gian phản hồi..., tuy nhiên không phải phương pháp nào cũng mang lại hiệu quả tối ưu trong đánh giá hiệu năng.
Thông thường các đánh giá về hiệu năng mạng máy tính nói chung thường có liên quan đến tốc độ mà trong đó các thông điệp riêng lẻ được truyền giữa hai máy tính được kết nối với nhau, trong đó phải kể đến độ trễ và tốc độ truyền dữ liệu điểm- điểm.
Độ trễ có thể định nghĩa là thời gian cần thiết để truyền một thông điệp rỗng giữa hai máy tính. Nó là một độ đo của hàm trễ theo phần mềm có liên quan tới việc truy nhập vào mạng tại vị trí nơi nhận và nơi gửi. Còn tốc độ truyền dữ liệu là tốc độ dữ liệu được truyền giữa hai máy tính trong mạng, với điều kiện khi việc truyền dữ liệu đã bắt đầu, tính theo bit/giây.
Có thể thấy thời gian truyền một thông điệp yêu cầu và việc nhận một thông điệp phản hồi phải không được lâu hơn thời gian truy cập đĩa- tức là thời gian truyền mỗi thông điệp phải nhỏ hơn 10 mili giây. Và để đạt được điều này thì độ trễ truyền thông điệp phải nhỏ hơn 5 mili giâyvà tốc độ truyền cũng phải lớn hơn 200 kB/giây.
Trước hết, chúng ta sẽ xem xét đánh giá hiệu năng của mạng máy tính trên cơ sở các khái niệm về các độ đo hiệu năng của mạng máy tính
Thời gian thiết lập liên kết :
Trước khi dữ liệu được truyền theo bất kỳ dịch vụ mạng định hướng kết nối (CONS) nào, trước hết nó cần được thiết lập cuôc gọi hoặc phiên làm việc. Tuy nhiên, với một dịch vụ mạng không dùng kết nối (CLNS) thì điều này là không cần thiết. Có thể lấy ví dụ về các hệ thống CONS là X.25 và SNA, trong khi IP (ex - TCP) và ISO 8273 là các ví dụ về các giao thức CLNS.CONS, đó là những giao thức thường được các nhà cung cấp dịch vụ chọn lựa và áp dụng trên các mạng diện rộng (WAN)nhằm bảo đảm việc chuyển phát dữ liệu, trong khi giao thức CLNS được sử dụng trên những hệ thống như các mạng LAN.
Đối với một vài ứng dụng, như hệ thống kiểm tra thẻ tín dụng, thời gian thiết lập liên kết là một độ đo hiệu năng quan trọng nhất. Thời gian thiết lập liên kết được thực hiện ở cả hai lớp vật lý, như việc quay số Modem theo mạng PSTN, và các tín hiệu từ tầng 2 đến tầng 6 giao thức 0SI.
Thời gian phản hồi :
Độ đo hiệu năng cơ bản nhất đối với việc phân phối dữ liệu là thời gian phản hồi mạng. Đây là thời gian cần thiết để người sử dụng tiếp nhận được phản hồi từ một thông điệp. Trước hết cần phân biệt được giữa thời gian truyền mạng một chiều và thời gian trả lời trọn một vòng (hai chiều). Độ trễ trọn vòng thông thường quan trọng hơn đối với các ứng dụng tương tác lẫn nhau, trong khi thời gian truyền mạng một chiều có liên quan tới các thao tác xử lý theo lô. Khi đó ta sẽ có tương ứng 4 phương thức tuỳ theo phần thông điệp nào được sử dụng, có thể là phần tử đầu tiên hoặc cuối cùng. Bốn phương thức đó là : FILO (First - In Last - Out) FIFO (Fist - In First - Out), LILO (Last - In Last - Out), LIFO (Last - In First - Out). Các phương pháp có thể khác nhau tuỳ thuộc mức độ đánh giá và các yêu cầu cần đạt được trong việc xác định hiệu năng.
FILO là mô hình yếu nhất trong các định nghĩa trên, và có thể thích hợp đối với các ứng dụng không truyền dữ liệu khi màn hình hiển thị chưa bị lấp đầy và không trả về dữ liệu khi thiết bị đầu cuối chưa nhận hết thông tin tại màn hình hiển thị. Trong các giao dịch một chiều, mô hình này áp dụng cho trường hợp máy chủ chỉ tiến hành xử lý thông tin khi toàn bộ giao dịch hoàn tất đã được thu nhận.
FIFO tương tự FILO, ngoại trừ việc trạm cuối bắt đầu hiển thị dữ liệu trả lại ngay khi dữ liệu vừa đến.
LILO ứng dụng trong các trường hợp dữ liệu được truyền đi như khi nó được khởi tạo nhưng chỉ được hiển thị hoặc được xử lý một khi giao dịch hoàn tất đã được nhận.
LIFO là phương pháp tối ưu nhất trong đánh giá hiệu năng sử dụng thời gian phản hồi của hệ thống. Phương pháp này ứng dụng trong trạng thái dữ liệu giao tác vừa được truyền và được xử lý như khi được khởi tạo. Ví dụ phổ biến của một tiến trình LIFO: thiết bị đầu cuối của người sử dụng và máy chủ sử dụng giao thức không đồng bộ để truyền thông qua mạng chuyển mạch gói từ các PADs.
Độ dao động:
Trong một số trường hợp thì không phải bản thân thời gian phản hồi của hệ thống là nhân tố quan trọng mà chính là sự biến đổi của nó. Điều này được định nghĩa là độ dao động của thời gian phản hồi. Phương pháp đánh giá này được ứng dụng nhiều trong các ứng dụng đa phương tiện. Độ trễ có thể biến đổi sẽ có tác dụng trong nhiều trường hợp xử lý tiếng nói hoặc hình ảnh bị gián đoạn.
Độ lệch:
Một khía cạnh khác của thời gian phản hồi cũng được sử dụng trong các ứng dụng đa phương tiện là sự chênh lệch về độ trễ cho các phần khác nhau của ứng dụng, khái niệm này được định nghĩa là độ lệch. Một ví dụ có thể thấy là độ lệch giữa các tín hiệu hình ảnh và âm thanh trong các ứng dụng video, việc có thể chúng không cùng đồng bộ chúng trong cùng một đoạn video.
Thông lượng:
Đối với những giao dịch lớn hoặc những ứng dụng truyền file lớn, thì độ đo hiệu năng quan trọng nhất lại là thông lượng. Tham số này được định nghĩa là số lượng dữ liệu không lỗi được truyền đi trên một đơn vị thời gian. Như vậy, định nghĩa này không bao gồm các dữ liệu được truyền lại trên mạng vì một lý do nào đó. Định nghĩa này thường áp dụng cho một kiểu giao dịch hoặc kết nối cụ thể, nhưng trong một số trường hợp thì tham số thông lượng toàn hệ thống được xác định là quan trọng hơn việc xác định thông lượng của một bộ phận riêng lẻ. Tuy nhiên độ đo hiệu năng này có thể bị giới hạn bởi phương tiện truyền hoặc khả năng xử lý trên mạng.
Chi phí:
Các điều kiện rằng buộc về chi phí có thể chỉ ra rằng tham số đo hiệu năng thực sự quan trọng nhất của một mạng là khả năng vận chuyển lượng truyền thông lớn nhất với một chi phí cho trước. Điều này có nghĩa là cần thiết phải có các giao thức định tuyến thích hợp cho phép việc vận chuyển lưu thông trên mạng qua ít nhất các tuyến có thể.
Các phương pháp mô hình hoá đánh giá hiệu năng của mạng máy tính
Phương pháp mô hình hoá
Bài toán đánh giá hiệu năng của mạng máy tính là một bài toán phức tạp vì trên thực tế mạng máy tính là một thực thể động thay đổi liên tục về mặt hoạt động cũng như về cấu hình. Một trong những phương pháp để đánh giá hiệu năng của mạng máy tính là phương pháp mô hình hoá.
Mô hình hoá là một phương pháp rất thông dụng trong lĩnh vực nghiên cứu khoa học và công nghệ. Tư tưởng của phương pháp là thể hiện bằng thực thể hay bằng khái niệm một số thuộc tính và quan hệ đặc trưng của một số đối tượng nào đó (gọi là nguyên hình), nhằm sử dụng nó làm đối tượng quan sát thay cho nguyên hình hoặc(và) làm đối tượng nghiên cứu (thực nghiệm hay suy diễn) về nguyên hình.
Trong bài toán phân tích hiệu năng của mạng máy tính, nguyên hình chính là mạng máy tính. Các thuộc tính được thể hiện trong mô hình là các thuộc tính có ảnh hưởng đến hiệu năng của hệ thống, đầu ra của mô hình là kết quả ước lượng của hiệu năng, với một sai số chấp nhận được.
Vậy tại sao phải sử dụng phương pháp mô hình hoá khi nghiên cứu hiệu năng của mạng máy tính?
Thứ nhất, mô hình chỉ biểu diễn một phần hoặc một khía cạnh của mạng máy tính, dựa trên hệ thống có thực hoặc tưởng tượng. Do đó, nhờ mô hình hoá, ta có thể thực hiện đánh giá hiệu năng ngay từ pha thiết kế của hệ thống để đảm bảo lựa chọn được phương án tối ưu.
Thông thường, việc đo hiệu năng của bài toán thường bị bỏ qua, hoặc trì hoãn lại vì ở pha thiết kế, ta không có cơ sở để đo hiệu năng hệ thống. Vì vậy, ra quyết định chọn thiết kế chỉ dựa trên các yêu cầu chức năng và thường thu được các hệ thống có hiệu năng kém. Khi cài đặt hệ thống trong thực tế, ta mới phát hiện ra nhược điểm này và khi đó thì đã quá muộn để sửa chữa. Sau khi xây dựng mô hình, ta có thể thay đổi các tham số của nó, nhờ vậy kiểm tra được hiệu năng của các tình huống khác nhau, kể cả các tình huống không xảy ra hoặc ít xảy ra trong thực tế, hay các tình huống quá tải, có thể phá vỡ các hệ thống thực. Lúc này, ta sẽ dự đoán được tình trạng hoạt động của hệ thống và bằng cách so sánh các kết quả thu được từ các mô hình khác nhau, ta chọn được mô hình tốt nhất.
Hai là, mạng máy tính là một hệ thống không đơn định, có tương tác qua lại giữa các thành phần của hệ thống. Vì thế, khó có thể phân tích hoạt động và hiệu năng của chúng trong các điều kiện tải trọng khác nhau. Các chi tiết rườm rà có thể che mất các khía cạnh quan trọng. Ảnh hưởng tương tác phức tạp giữa các phần khác nhau của hệ thống cũng làm người quan sát không có khả năng phát hiện ra các điểm chính yếu, ví dụ như trong một hệ thống có ảnh hưởng giữa các thành phần, khó có thể tìm ra thành phần nào có hiệu năng thấp nhất, dưới yêu cầu cho phép của nó, làm toàn bộ hệ thống bị ảnh hưởng theo... Mô hình hoá giúp ta loại bỏ các chi tiết này, chỉ giữ lại các thuộc tính có liên quan đến hiệu năng, nhờ vậy, phân tích trên mô hình thường đơn giản hơn nhiều so với phân tích trên hệ thống thực.
Ba là, các mô hình là hình thức biểu diễn trìu tượng hoá của một lớp các hệ thống có cùng cấu trúc. Vì vậy, với cùng một loại mô hình, ta có thể biểu diễn nhiều hệ thống khác nhau. Các hệ thống hiện nay rất đa dạng, phong phú, vì vậy nếu như phân tích trên hệ thống thực là cách sản xuất thủ công, đơn chiếc, thì phân tích trên mô hình là phương pháp sản xuất công nghiệp. Do đó, người ta có thể tập trung nghiên cứu một số dạng mô hình nhất định, đưa ra được các lược đồ đánh giá hiệu năng chuẩn để áp dụng cho mọi hệ thống được biểu diễn bởi cùng mô hình đó. Đây chính là cơ sở cho việc xây dựng các bộ công cụ đo hiệu năng tự động, giúp giảm thời gian và chi phí khi phân tích hiệu năng của bài toán lớn.
Tóm lại, mô hình hoá hiệu năng là môt công cụ cho phép phân tích các yêu cầu về hiệu năng của hệ thống song song với việc phân tích các các yêu cầu về chức năng. Có thể áp dụng kỹ thuật này ở mọi pha trong quá trình xây dựng và bảo trì hệ thống, trợ giúp tích cực cho người thiết kế và quản trị hệ thống phân tán. Vì vậy, trên thế giới, người ta đã tập trung vào nghiên cứu vấn đề này, coi đây là một vấn đề trọng tâm trong hệ phân tán và họ cũng đã thu được rất nhiều kết quả thú vị.
Các phương pháp mô hình hoá hiệu năng đang được sử dụng hiện nay chủ yếu là các loại mô hình toán học. Trong các mô hình này, hệ thống được biểu diễn bằng các quan hệ định lượng hay nói cụ thể hơn, người ta sử dụng các công cụ toán học để biểu diễn quan hệ giữa hiệu năng của hệ thống và các thông số đầu vào. Thông dụng nhất là các mô hình ngẫu nhiên do các thông số trong hệ phân tán thường thay đổi ngẫu nhiên theo thời gian.
Do hiệu năng của mạng máy tính không chỉ phụ thuộc vào các thao tác của hệ mà còn phụ thuộc vào nền kiến trúc phần cứng nên ta cũng có 2 cách tiếp cận mô hình hoá tương ứng là: mô hình hoá hoạt động và mô hình hoá thực thể.
Mô hình hoá hoạt động có đối tượng mô hình hoá là các giao dịch trong hệ thống. Vì vậy, một hệ thống được biểu diễn bằng một đầu vào, một đầu ra và một khối xử lý. (Hình 2.1). Việc phân tích hiệu năng chính là đánh giá các thông số đo hiệu năng của hệ thống này dựa vào hoạt động của khối xử lý, khi đầu vào của khối thay đổi. Đây là phương pháp mô hình hoá khá phổ biến, dùng để đo thời gian tính toán, thông lượng…
Hình 2.1. Mô hình hoạt động của hệ thống
Mô hình hoá thực thể thường tiếp cận theo hướng tiến hành mô hình các đối tượng có sẵn trong hệ thống như các máy chủ, các tài nguyên…Liên hệ giữa các đối tượng này là các luồng dữ liệu, luồng điều khiển của hệ thống. Cách này được sử dụng để đánh giá hiệu năng cụ thể của các thực thể nói trên như thời gian bận của một máy chủ, chi phí truyền thông của hệ thống…
Mỗi phương pháp được đặc trưng bởi định nghĩa mô hình, các thông số vào, ra và các phương pháp để ước lượng và đánh giá kết quả của mô hình. Dưới đây, ta sẽ trình bày một số loại mô hình có được sử dụng rộng rãi trong bài toán phân tích hiệu năng trên thực tế.
Mạng xếp hàng (Queuing Networks)
Mô hình mạng xếp hàng là mô hình cổ điển nhất trong các mô hình đánh giá hiệu năng hệ phân tán. Vì vậy, nó là loại mô hình đơn giản nhất và có các lý thuyết được xây dựng khá chỉnh, trợ giúp đắc lực cho người sử dụng.
Một mạng xếp hàng là một đồ thị có hướng bao gồm các nút là các hàng đợi, thường gọi là các trung tâm dịch vụ, biểu diễn mô hình của các tài nguyên của hệ thống. Các khách hàng trong hàng đợi này là các tác vụ trong hệ thống,