Luận văn Mô phỏng một số thuật toán trên đồ thị

Cách đây gần bathập kỉ(khoảng những năm 80 của thế kỉ XX), ở nhiều nước trên thế giới mô phỏng thuật toánđã được sử dụng trong việc giảng dạy các môn Khoa học máy tính như một công cụ hữu hiệu để mô tả thuật toán một cách trực quan, khoa học. Không những vậy nó còn cho người học biết chi tiết từng bước hoạt động của thuật toán cùng với cấu trúc dữ liệu đi kèm thông qua việc mô tả bằng đồ họa. Những năm gần đây, ở Việt Nam môn Tin học đã được đưa vào chương trình của học sinh trung học phổ thông như là một môn học chính thức. Tuy nhiên trên thực tế, một số trường chuyên trên cả nước đã tuyển sinh học sinh chuyên Tin từ cuối những năm 80 của thế kỉ XX. Những học sinh nàycần nắm chắc kiến thức cơ bản về Tin học như: các cấu trúc dữ liệu trừu tượng: stack, queue, cây, cây nhị phân, cây nhị phân tìm kiếm, các chiến lược thiết kế thuật toán: tham lam, quay lui, quy hoạch động Trong đó, lý thuyết về đồ thị và thuật toán trên đồ thị là một lĩnh vực rộng và phức tạp.Việc hiểu và cài đặt tốt các thuật toán đó đòi hỏi thời gian và công sức rất lớn. Hiện nay, việc truyền đạt các thuậttoán trên đồ thị cho học sinh chuyên Tin gặp rất nhiều khó khăn. Có nhiều rất nhiều lý do: Các thuật toán đó khó hình dung, việc tổ chức dữ liệu cho nó cũng phức tạp, thời gian giảng dạy trên lớpcó hạn, tài liệu tham khảo có thể tự đọc, tự học vẫn còn ít .

pdf84 trang | Chia sẻ: lvbuiluyen | Lượt xem: 4543 | Lượt tải: 7download
Bạn đang xem trước 20 trang tài liệu Luận văn Mô phỏng một số thuật toán trên đồ thị, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Trang 3 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ CHINH MÔ PHỎNG MỘT SỐ THUẬT TOÁN TRÊN ĐỒ THỊ LUẬN VĂN THẠC SĨ Hà Nội - 2011 Trang 4 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ CHINH MÔ PHỎNG MỘT SỐ THUẬT TOÁN TRÊN ĐỒ THỊ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60 48 05 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. HỒ CẨM HÀ Hà Nội - 2011 Trang 5 LỜI CAM ĐOAN Tôi xin cam đoan, kết quả luận văn hoàn toàn là kết quả của tự bản thân tôi tìm hiểu, nghiên cứu dưới sự hướng dẫn của TS. Hồ Cẩm Hà. Các tài liệu tham khảo được trích dẫn và chú thích đầy đủ. Học viên Nguyễn Thị Chinh Trang 6 LỜI CẢM ƠN Trước hết, tôi muốn gửi lời cảm đến các Thầy, Cô trong khoa Công nghệ thông tin- Trường Đại học Công nghệ - Đại học Quốc gia Hà nội đã truyền đạt các kiến thức quý báu cho tôi trong suốt thời gian học tập tại trường. Đặc biệt, tôi xin gửi lời cảm ơn sâu sắc tới cô giáo hướng dẫn TS Hồ Cẩm Hà, người đã tận tình chỉ bảo và hướng dẫn về mặt chuyên môn cho tôi trong suốt quá trình thực hiện luận văn này. Cũng qua đây, tôi xin gửi lời cảm ơn đến Ban Giám hiệu trường THPT Chuyên Đại học Sư phạm Hà Nội, nơi tôi đang công tác đã tạo mọi điều kiện thuận lợi cho tôi trong thời gian học tập cũng như trong suốt quá trình thực hiện luận văn tốt nghiệp. Cuối cùng, tôi xin cảm ơn gia đình, bạn bè, đồng nghiệp đã luôn ủng hộ, động viên tôi rất nhiều để tôi yên tâm nghiên cứu và hoàn thành luận văn. Trong suốt quá trình làm luận văn, bản thân tôi đã cố gắng tập trung tìm hiểu, nghiên cứu và tham khảo thêm nhiều tài liệu liên quan. Tuy nhiên, do thời gian hạn chế và bản thân còn chưa có nhiều kinh nghiệm trong nghiên cứu khoa học, chắc chắn bản luận văn vẫn còn nhiều thiếu sót. Tôi rất mong được nhận sự chỉ bảo của các Thầy Cô giáo và các góp ý của bạn bè, đồng nghiệp để luận văn được hoàn thiện hơn. Hà Nội, ngày 12 tháng 06 năm 2011 Nguyễn Thị Chinh Trang 7 MỤC LỤC LỜI CẢM ƠN................................................................................................... 6 LỜI NÓI ĐẦU ................................................................................................. 10 Chương 1 MỘT SỐ KIẾN THỨC CƠ BẢN VỀ THUẬT TOÁN .................... 12 1. Khái niệm bài toán Tin học ....................................................................... 12 2. Khái niệm thuật toán ................................................................................. 12 3. Các tính chất của thuật toán ...................................................................... 13 4. Độ phức tạp và xác định độ phức tạp của thuật toán.................................. 14 5. Chi phí thực hiện thuật toán ...................................................................... 18 6. Ba bài toán trên mô hình đồ thị được đưa vào giảng dạy trong trường Trung học Phổ thông Chuyên .................................................................................. 18 6.1. Một số khái niệm cơ bản về đồ thị ...................................................... 18 6.1.1. Khái niệm đồ thị (Graph).............................................................. 18 6.1.2. Các khái niệm cơ bản ................................................................... 19 6.2. Bài toán tìm kiếm trên đồ thị .............................................................. 21 6.2.1. Phát biểu bài toán ......................................................................... 21 6.2.2. Giới thiệu thuật toán tìm kiếm DFS và BFS ................................. 22 6.2.3. Độ phức tạp tính toán của thuật toán DFS và BFS........................ 24 6.3. Bài toán tìm đường đi ngắn nhất trên đồ thị có trọng số ...................... 24 6.3.1. Phát biểu bài toán ......................................................................... 24 6.3.2. Giới thiệu thuật toán Ford - Bellman ............................................ 25 6.2.3. Giới thiệu thuật toán thuật toán Dijkstra ....................................... 26 6.3.4. Độ phức tạp .................................................................................. 28 6.4. Các thuật toán tìm kiếm trên cây khung.............................................. 28 6.4.1. Bài toán cây khung ....................................................................... 28 6.4.2. Giới thiệu thuật toán Prim ............................................................ 29 6.4.3. Giới thiệu thuật toán Kruskal........................................................ 30 6.4.5. Độ phức tạp ................................................................................. 31 Trang 8 6.5. Bài toán tìm chu trình Hamilton qua tất cả các đỉnh của đồ thị ........... 32 6.5.1. Phát biểu bài toán ......................................................................... 32 6.5.2. Giới thiệu thuật toán tìm chu trình Hamilton: ............................... 33 Chương 2 MÔ PHỎNG THUẬT TOÁN .......................................................... 34 1. Khái niệm và chức năng của mô phỏng..................................................... 34 2. Lịch sử của mô phỏng thuật toán............................................................... 35 3. Hiệu quả của mô phỏng thuật toán trong giảng dạy................................... 37 4. Một số yêu cầu đối với mô phỏng thuật toán............................................. 41 4.1. Mô phỏng đúng theo thuật toán .......................................................... 41 4.2. Cho phép thực hiện theo từng bước .................................................... 41 4.3. Mô phỏng thuật toán phải có tính động ............................................... 41 4.4. Có thể thực thi với mọi bộ dữ liệu đầu vào ......................................... 43 4.5. Có sự phân cấp người học................................................................... 43 5. Quy trình mô phỏng thuật toán.................................................................. 43 5.1. Nghiên cứu và phân tích giải thuật...................................................... 43 5.2. Mô phỏng dữ liệu vào và kết quả đầu ra ............................................. 44 5.3. Chia thuật toán thành nhiều bước nhỏ rồi mô phỏng theo từng bước .. 45 5.4. Tổng hợp mô phỏng theo các bước ..................................................... 47 5.5. Sơ đồ cấu trúc chung của hệ thống mô phỏng ..................................... 47 6. Đề xuất lựa chọn công cụ để phát triển chương trình mô phỏng thuật toán48 6.1. Một số hệ thống mô phỏng thuật toán chung ...................................... 49 6.2. Sử dụng công cụ mô phỏng thuật toán riêng biệt ................................ 52 6.3. Xây dựng hệ thống từ đầu................................................................... 53 Chương 3 PHÂN TÍCH THIẾT KẾ HỆ THỐNG MÔ PHỎNG MỘT SỐ THUẬT TOÁN TRÊN ĐỒ THỊ....................................................................... 54 1. Mục đích ................................................................................................... 54 2. Những yêu cầu thực tế .............................................................................. 54 3. Đề xuất cho hệ thống mới ......................................................................... 55 4. Thiết kế hệ thống mô phỏng một số thuật toán trên đồ thị ......................... 56 Trang 9 4.1. Lựa chọn công cụ lập trình ................................................................. 57 4.2. Chức năng mô phỏng của các thuật toán được cài đặt ......................... 59 4.2.1 Mô phỏng thuật toán tìm kiếm....................................................... 59 4.2.2. Mô phỏng thuật toán Dijkstra ....................................................... 61 4.2.3. Mô phỏng thuật toán Ford – Bellman ........................................... 63 4.2.4. Mô phỏng thuật toán Prim ............................................................ 63 4.2.5. Mô phỏng thuật toán Kruskal ....................................................... 65 4.2.6. Thuật toán tìm chu trình Hamilton................................................ 66 5. Giới thiệu chương trình............................................................................. 66 5.1. Tổng quan về hệ thống........................................................................ 66 5.1.1. Các đối tượng xây dựng cấu trúc đồ thị ........................................ 67 5.1.2. Công cụ vẽ hình ảnh để mô phỏng................................................ 70 5.1.3.Chức năng chi tiết của các công cụ hỗ trợ cho quá trình mô phỏng 70 5.2. Giới thiệu các công cụ hỗ trợ mô phỏng do người dùng cài đặt .......... 71 Chương 4 KẾT LUẬN ..................................................................................... 80 1. Những kết quả đạt được ............................................................................ 80 2. Hướng phát triển ....................................................................................... 81 DANH MỤC TÀI LIỆU THAM KHẢO .......................................................... 82 PHỤ LỤC ........................................................................................................ 84 Trang 10 LỜI NÓI ĐẦU Cách đây gần ba thập kỉ (khoảng những năm 80 của thế kỉ XX), ở nhiều nước trên thế giới mô phỏng thuật toán đã được sử dụng trong việc giảng dạy các môn Khoa học máy tính như một công cụ hữu hiệu để mô tả thuật toán một cách trực quan, khoa học. Không những vậy nó còn cho người học biết chi tiết từng bước hoạt động của thuật toán cùng với cấu trúc dữ liệu đi kèm thông qua việc mô tả bằng đồ họa. Những năm gần đây, ở Việt Nam môn Tin học đã được đưa vào chương trình của học sinh trung học phổ thông như là một môn học chính thức. Tuy nhiên trên thực tế, một số trường chuyên trên cả nước đã tuyển sinh học sinh chuyên Tin từ cuối những năm 80 của thế kỉ XX. Những học sinh này cần nắm chắc kiến thức cơ bản về Tin học như: các cấu trúc dữ liệu trừu tượng: stack, queue, cây, cây nhị phân, cây nhị phân tìm kiếm, các chiến lược thiết kế thuật toán: tham lam, quay lui, quy hoạch động… Trong đó, lý thuyết về đồ thị và thuật toán trên đồ thị là một lĩnh vực rộng và phức tạp. Việc hiểu và cài đặt tốt các thuật toán đó đòi hỏi thời gian và công sức rất lớn. Hiện nay, việc truyền đạt các thuật toán trên đồ thị cho học sinh chuyên Tin gặp rất nhiều khó khăn. Có nhiều rất nhiều lý do: Các thuật toán đó khó hình dung, việc tổ chức dữ liệu cho nó cũng phức tạp, thời gian giảng dạy trên lớp có hạn, tài liệu tham khảo có thể tự đọc, tự học vẫn còn ít…. Trong khuôn khổ đề tài này, chúng tôi xây dựng một chương trình nhằm mô phỏng hoạt động của ba thuật toán giải ba bài toán cơ bản trên đồ thị theo phân phối chương trình của Bộ Giáo dục với hai mục đích: để học sinh có thể dễ dàng nắm bắt tư tưởng cũng như từng bước hoạt động cụ thể của các thuật toán, để giáo viên có thể làm cho bài giảng về các thuật toán này trở nên dễ hiểu, dễ tiếp thu hơn. Nội dung luận văn được chia thành 3 chương: Trang 11 Chương I. Những kiến thức cơ bản về thuật toán. Ở chương này, chúng tôi trích nêu khái niệm về bài toán và thuật toán. Các tính chất của thuật toán, xác định độ phức tạp của thuật toán…Cuối cùng, chúng tôi giới thiệu ba thuật toán quan trọng trên đồ thị mà học sinh THPT sẽ được học. Chương II. Mô phỏng thuật toán. Chương này chúng tôi trình bày khái niệm mô phỏng, các chức năng của mô phỏng và các vấn đề liên quan như: lịch sử mô phỏng, nghiên cứu về hiệu quả của nó trong giảng dạy và một số yêu cầu đối với việc mô phỏng thuật toán nói chung. Chương III. Phân tích thiết kế hệ thống mô phỏng một số thuật toán trên đồ thị. Ở chương 3, chúng tôi trình bày về quá trình phân tích, thiết kế và xây dựng hệ thống mô phỏng trên ba thuật toán: thuật toán tìm kiếm (tìm kiếm theo chiều sâu và tìm kiếm theo chiều rộng), thuật toán tìm đường đi ngắn nhất (thuật toán Dijsktra) và thuật toán tìm cây khung cực tiểu trên đồ thị vô hướng có trọng số (thuật toán Prim)… Trang 12 Chương 1 MỘT SỐ KIẾN THỨC CƠ BẢN VỀ THUẬT TOÁN 1. Khái niệm bài toán Tin học Trong phạm vi tin học, người ta quan niệm bài toán là một công việc nào đó mà con người muốn máy tính thực hiện. [xem 1] Khi dùng máy tính để giải bài toán, ta cần quan tâm tới 2 vấn đề: Dữ liệu cần được đưa vào máy tính (Input) là gì và cần lấy ra (Output) thông tin gì? Nói một cách khác, cho một bài toán là việc mô tả rõ Input và Output của bài toán. Vấn đề còn lại là: Làm thế nào để từ Input ta có được Output? 2. Khái niệm thuật toán Khác với Toán học (các yêu cầu của bài toán thường là chứng minh sự tồn tại đáp án chứ không yêu cầu tìm một cách chi tiết để tìm ra đáp án đó), giải một bài toán Tin học là việc đi tìm một lời giải cụ thể, tường minh để đưa ra Output của bài toán dựa trên Input đã cho. Việc chỉ ra một cách tìm Output của bài toán được gọi là một thuật toán. Có nhiều cách phát biểu khái niệm về thuật toán. Dưới đây là cách phát biểu được chọn để đưa vào sách giáo khoa Tin học phổ thông: Khái niệm về thuật toán: thuật toán là một dãy hữu hạn các thao tác được sắp xếp theo một trình tự nhất định để sau khi thực hiện dãy các thao tác đó, từ input ta có output cần tìm [xem 1]. Trong lĩnh vực máy tính, cụm từ “thuật toán” đôi khi người ta dùng bằng một từ khác: “giải thuật”. Ví dụ về một thuật toán: Nhập vào một số nguyên dương N, kiểm tra số đó có là số nguyên tố hay không? Lời giải: Input: Số nguyên dương N. Output: Có/không tương ứng với N có là nguyên tố hay không? Trang 13 Ý tưởng: Một số nguyên gọi là nguyên tố khi nó chỉ có ước là 1 và chính nó. Từ định nghĩa suy ra: - Nếu N = 1 thì thông báo là N không nguyên tố rồi kết thúc; - Nếu 1< N < 4 thì thông báo N là số nguyên tố rồi kết thúc; - Nếu N  4 và không có ước trong khoảng từ 2 đến ][ N thì N là nguyên tố. Thuật toán: Có nhiều cách mô phỏng khác nhau. Dưới đây là cách mô phỏng thuật toán dạng liệt kê các bước: Bước 1. Nhập số nguyên dương N; Bước 2. Nếu N = 1 thì thông báo là N không nguyên tố rồi kết thúc; Bước 3. Nếu N < 4 thì thông báo N là số nguyên tố rồi kết thúc; Bước 4. i  2; Bước 5. Nếu (*)][ Ni  thì thông báo N là nguyên tố rồi kết thúc; Bước 6. Nếu N chia hết cho i thì thông báo N không nguyên tố rồi kết thúc; Bước 7. i  i + 1 rồi quay lại bước 5; 3. Các tính chất của thuật toán Dựa trên khái niệm về thuật toán và ví dụ ở trên ta thấy các thao tác trong thuật toán phải được mô tả đủ chi tiết để một đối tượng cứ tiến hành thực hiện theo đúng thứ tự các thao tác đó là có thể cho ra output dựa trên input tương ứng. Một thuật toán phải đảm bảo được các tính chất sau: Tính xác định: Sau khi thực hiện một thao tác thì hoặc là thuật toán kết thúc hoặc là có đúng một thao tác xác định để thực hiện tiếp theo. Trang 14 Tính đúng đắn: Sau khi thực hiện thuật toán ta phải nhận được đúng Output cần tìm. Tính dừng: Thuật toán phải kết thúc sau một số hữu hạn lần thực hiện. Tính tổng quát: Thuật toán là đúng đắn với mọi bộ dữ liệu đầu vào của bài toán. Tính hiệu quả: - Hiệu quả về thời gian: Ta quan tâm tới thời gian cần thiết để thực hiện xong thuật toán đó. Thời gian đó phải nằm trong giới hạn cho phép. - Hiệu quả về không gian: Dung lượng bộ nhớ cần thiết để lưu trữ các đối tượng như bộ Input, bộ Output, kết quả trung gian và chương trình được dùng để thực hiện thuật toán. - Dễ cài đặt: thuật toán đó liệu có chuyển được thành chương trình bằng một ngôn ngữ lập trình nào đó hay không. Trước khi xây dựng thuật toán cho một bài toán nào đó, trước tiên phải xác định được Input và Output là gì, thử trên một số ví dụ cụ thể để định hướng cho việc xây dựng thuật toán. [xem 1] 4. Độ phức tạp và xác định độ phức tạp của thuật toán Một thuật toán chỉ có thể giải một bài toán, nhưng một bài toán có thể giải bằng nhiều thuật toán khác nhau. Làm thế nào để lựa chọn một thuật toán tốt để giải một bài toán đã cho? Tất nhiên, người lập trình thường chọn thuật toán dễ hiểu, dễ cài đặt. Theo đó, chương trình viết ra ít có khả năng có lỗi, việc nâng cấp chương trình dễ dàng và nhiều người có thể thực hiện được. Nhưng nếu hiệu quả của thuật toán (về mặt thời gian và không gian nhớ) là yêu cầu quan trọng thì cần chọn một thuật toán chạy nhanh và sử dụng tài nguyên có sẵn một cách hiệu quả. Như vậy dựa vào đâu để có thể kết luận thuật toán này “nhanh” hơn thuật toán kia? Trang 15 Có một cách để biết được thuật toán nào nhanh hơn bằng cách viết các chương trình bằng cùng một ngôn ngữ lập trình cho các thuật toán rồi so sánh trên các bộ Input giống nhau trên cùng một hệ thống để kết luận thuật toán nào nhanh, thuật toán nào chậm. Tuy nhiên cách này không chính xác và tốn nhiều thời gian. Một cách khác để đánh giá thuật toán là dựa vào tiêu chí mỗi câu lệnh của chương trình nguồn sẽ thực hiện bao nhiêu lần trên một tập dữ liệu vào. Việc đánh giá đó không chỉ đánh giá, so sánh trong việc lựa chọn thuật toán mà còn có thể hiệu chỉnh, cải tiến thuật toán đã có tốt hơn. Khi đánh giá thời gian thực hiện thuật toán ta chú ý đặc biệt đến các phép toán mà số lần thực hiện không ít hơn các phép toán khác – ta gọi là phép toán tích cực của thuật toán. Cách đánh giá thời gian thực hiện thuật toán độc lập với hệ thống máy tính dẫn đến khái niệm về Độ phức tạp của thuật toán. Thời gian thực hiện một thuật toán bằng chương trình máy tính phụ thuộc vào rất nhiều yếu tố. Một yếu tố cần chú ý nhất đó là kích thước của dữ liệu đầu vào. Dữ liệu càng lớn thì thời gian xử lý càng chậm. Nếu gọi n là kích thước dữ liệu đưa vào thì thời gian thực hiện của một thuật toán có thể biểu diễn một cách tương đối như một hàm của n: T(n). Thực tế, T(n) không những chỉ phụ thuộc vào kích thước n mà còn phụ thuộc vào đặc tính, tình trạng thực tế của bộ dữ liệu đầu vào. Ví dụ, với thuật toán sắp xếp dãy số đã cho thành dãy tăng dần thì thời gian sắp xếp còn phụ thuộc vào dãy đầu vào đã là dãy tăng dần, dãy được sinh ngẫu nhiên hay được sắp xếp theo thứ tự ngược lại. Vì thế cần phải xem xét các trường hợp tốt nhất, trung bình và xấu nhất. [Xem 2] Việc xác định độ phức tạp của một thuật toán bất kỳ có thể rất phức tạp. Tuy nhiên, trong thực tế, đối với một số thuật toán ta có thể phân tích bằng một số quy tắc đơn giản: 4.1. Quy tắc max Trang 16 Nếu thuật toán T có thời gian thực hiện T(n) =O(f(n)+g(n)) thì có thể coi T có độ phức tạp là O(max(f(n), g(n))) 4.2. Quy tắc tổng Nếu thuật toán T gồm hai đoạn thuật toán liên tiếp T1 và T2 và nếu T1 có thời gian thực hiện T1(n) = O(f(n)), T2 có thời gian thực hiện là T2(n) = O(g(n)) thì thời gian thực hiện T sẽ là: T(n) = T1(n) + T2(n) = O(f(n)+ g(n)) 4.3. Quy tắc nhân Nếu đoạn chương trình T có thời gian thực hiện là T(n) = O(f(n)). Khi đó, nếu thực hiện k(n) lần đoạn chương trình T với k(n) = O(g(n)) thì độ phức tạp sẽ là O(g(n).f(n)) 4.4. Một số tính chất Theo định nghĩa về độ phức tạp tính toán ta có một số tính chất: a) Nếu một thuật toán có độ phức tạp là hằng số, tức là thời gian thực hiện không phụ thuộc vào kích thước dữ liệu vào thì ta ký hiệu độ phức tạp tính toán của thuật toán đó là O(1). b) Với một thuật toán có độ phức tạp cấp logarit của f(n), người ta ký hiệu là O(logf(n)) mà không cần ghi cơ số của logarit. c) Với P(n) là một đa thức bậc k thì O(P(n)) = O(nk). Vì thế, một thuật toán có độ phức tạp cấp đa thức, người ta thường ký hiệu là O(nk) d) Một thuật toán có cấp là các hàm như 2n, n!, nn được gọi là một thuật toán có độ phức tạp hàm mũ. Những thuật toán như vậy trên thực tế thường có tốc độ rất chậm. Các thuật toán có cấp là các hàm đa thức hoặc nhỏ hơn hàm đa thức thì thườn