Hiện nay trong hầu hết các hệ lưu trữ, quản lý dữ liệu, thao tác tìm kiếm thường được thực hiện nhiều nhất để khai thác thông tin một cách nhanh chóng(ví dụ như : tra cứu từ điển, tìm sách trong thư viện.) và muốn việc tìm kiếm cách nhanh chóng thì dữ liệu cần phải được sắp xếp sẵn, ngăn nắp theo một trật tự, hệ thống nhất định sẽ cho phép chúng ta tìm kiếm nhanh, việc tìm kiếm, sắp xếp có ý nghĩa rất lớn trong việc quản lí và lưu trữ .
Do đó khi xây dựng một hệ quản lý thông tin trên máy tính, bên cạnh các thuật toán tìm kiếm, các thuật toán sắp xếp dữ liệu cũng là một trong những chủ đề được quan tâm hàng đầu.
Hiện nay đã có nhiều giải thuật tìm kiếm và sắp xếp được xây dựng, mức độ hiệu quả của từng giải thuật còn phụ thuộc vào tính chất của cấu trúc dữ liệu cụ thể mà nó tác động đến mà ta lựa chọn phương pháp sắp xếp sao cho phù hợp. Trong khoa học máy tính và trong toán học, một thuật toán sắp xếp là một thuật toán sắp xếp các phần tử của một danh sách (hoặc một mảng theo thứ tự tăng dần hoặc giảm dần). Người ta thường xét trường hợp các phần tử cần sắp xếp là các số. Hầu hết các bài toán đều có nhiều thuật toán khác nhau để giải quyết chúng.
Nội dung giới thiệu trình bày dưới đây là những thuật toán sắp xếp thông dụng nhất và đó cũng là nội dung mà nhóm chúng em nghiên cứu trong bài tập chủ đề lớn 1 này là:
1. Phương pháp chọn trực tiếp (Selection sort);
2. Phương pháp chèn trực tiếp( Insertion sort);
3. Phương pháp sắp xếp nổi bọt( Bubble sort);
4.Phương pháp sắp xếp trộn ( Merge sort);
5.Phương pháp sắp xếp nhanh ( Quick sort);
6.Phương pháp sắp xếp kiểu vun đống ( Heap sort);
36 trang |
Chia sẻ: tuandn | Lượt xem: 7318 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Đề tài Các phương pháp sắp xếp bằng Pascal, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MỤC LỤC 1
LỜI MỞ ĐẦU 2
A.VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI 4
B. TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP 5
C. NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP 7
PHIẾU NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN VÀ GIÁO VIÊN CHẤM 35
PHIẾU CHẤM ĐIỂM BÀI TẬP CHỦ ĐỀ LỚN 1 36
Hiện nay trong hầu hết các hệ lưu trữ, quản lý dữ liệu, thao tác tìm kiếm thường được thực hiện nhiều nhất để khai thác thông tin một cách nhanh chóng(ví dụ như : tra cứu từ điển, tìm sách trong thư viện...) và muốn việc tìm kiếm cách nhanh chóng thì dữ liệu cần phải được sắp xếp sẵn, ngăn nắp theo một trật tự, hệ thống nhất định sẽ cho phép chúng ta tìm kiếm nhanh, việc tìm kiếm, sắp xếp có ý nghĩa rất lớn trong việc quản lí và lưu trữ .
Do đó khi xây dựng một hệ quản lý thông tin trên máy tính, bên cạnh các thuật toán tìm kiếm, các thuật toán sắp xếp dữ liệu cũng là một trong những chủ đề được quan tâm hàng đầu.
Hiện nay đã có nhiều giải thuật tìm kiếm và sắp xếp được xây dựng, mức độ hiệu quả của từng giải thuật còn phụ thuộc vào tính chất của cấu trúc dữ liệu cụ thể mà nó tác động đến mà ta lựa chọn phương pháp sắp xếp sao cho phù hợp. Trong khoa học máy tính và trong toán học, một thuật toán sắp xếp là một thuật toán sắp xếp các phần tử của một danh sách (hoặc một mảng theo thứ tự tăng dần hoặc giảm dần). Người ta thường xét trường hợp các phần tử cần sắp xếp là các số. Hầu hết các bài toán đều có nhiều thuật toán khác nhau để giải quyết chúng.
Nội dung giới thiệu trình bày dưới đây là những thuật toán sắp xếp thông dụng nhất và đó cũng là nội dung mà nhóm chúng em nghiên cứu trong bài tập chủ đề lớn 1 này là:
1. Phương pháp chọn trực tiếp (Selection sort);
2. Phương pháp chèn trực tiếp( Insertion sort);
3. Phương pháp sắp xếp nổi bọt( Bubble sort);
4.Phương pháp sắp xếp trộn ( Merge sort);
5.Phương pháp sắp xếp nhanh ( Quick sort);
6..Phương pháp sắp xếp kiểu vun đống ( Heap sort);
Ngoài ra còn có nhiều thuật toán sắp xếp khác nữa như: Phương pháp sắp xếp cải tiến ( Shellsort).... Trong bài tập chủ đề lớn 1 này chúng ta sẽ được lần lượt tìm hiểu khảo sát từng thuật toán trên. Các thuật toán như Selection sort, Insertion sort, Bubble sort là những thuật toán đơn giản dễ cài đặt nhưng chi phí cao. Các thuật toán Merge sort, Quick sort, Heap sort, phức tạp hơn nhưng hiệu suất cao hơn nhóm thuật toán đầu. Các nhóm thuật toán trên đều có một điểm chung là đều được xây dựng dựa trên cơ sở so sánh giá trị của các phần tử trong mảng (hay so sánh các khóa tìm kiếm). Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán.
Mặt dù nhóm chúng em đã rất cố gắng và nổ lực để làm bài tập chủ đề lớn này do kinh nghiệm còn hạn chế và kiến thức chúng em nắm chưa sâu nên chúng em biết sẽ không tránh khỏi những thiếu sót. Nhóm chúng em rất mong nhận được sự thông cảm và đóng góp của các Thầy, Cô để lần sau làm bài tập chủ đề được tốt hơn.
Hoàn thành bài tập chủ đề lớn 1 này là niềm vui của cả nhóm, nhóm chúng em rất là biết ơn Thầy Huỳnh Dương Trung Trực đã hướng dẫn chúng em tận tình trong suốt thời gian chúng em làm bài tập chủ đề. Một lần nữa nhóm chúng em xin gửi lời cám ơn chân thành nhất đến Thầy.
Sóc Trăng, Ngày 16 Tháng 05 Năm 2010
A. VẤN ĐỀ, MỤC ĐÍCH VÀ PHẠM VI NGHIÊN CỨU CỦA ĐỀ TÀI
I. Nêu vấn đề :
Quá trình sắp xếp là quá trình bố trí lại các phần tử của một tập đối tượng điển hình như là một dãy số nào đó, một dãy chữ theo thứ tự của từ điển.v.v., nhằm sắp xếp theo một thứ tự nhất định theo thứ tự tăng dần (hoặc giảm dần) đối với một dãy số, thứ tự từ điển đối với một dãy chữ.v.v….
Bài toán sắp xếp thường được xuất hiện thường xuyên nhất trong các ứng dụng tin học như trong ngôn ngữ lập trình Pascal...,với những yêu cầu, mục đích khác nhau thì sắp xếp dữ liệu lưu trữ trong máy tính theo cách và các bước khác nhau….Nói chung, dữ liệu có thể xuất hiện dưới nhiều dạng khác nhau và thường phải lưu trữ một khối lượng dữ liệu đáng kể, nên việc xây dựng các giải thuật sắp xếp sẽ cho phép tìm kiếm nhanh sẽ có ý nghĩa rất lớn. Từ các vấn đề nêu trên giúp cho chúng em hiểu rỏ mục đích đề tài là: Để sắp xếp các dãy số theo một trật tự, thứ tự tăng dần (hoặc là giảm dần) tùy theo vào yêu cầu của người muốn sắp xếp, sắp xếp theo thự tự để giúp cho việc tìm kiếm được dễ dàng hơn, qua đó có thể giúp chúng em hiểu rỏ các ưu khuyết điểm của các phương pháp sắp xếp để so sánh tốc độ sắp xếp, từ đó để vận dụng các phương pháp đó trong việc sắp xếp theo yêu cầu cùa bài toán đặt ra một cách có hiệu quả và đó cũng là mục đích mà nhóm chúng em chọn đề tài về các sắp xếp để nghiên cứu.
II. Phạm vi nghiên cứu của đề tài :
Tìm hiểu và vận dụng các lý thuyết cơ bản về một số phương pháp sắp xếp như phương pháp chọn trực tiếp (Selectsort), chèn trực tiếp (Insertsort), sắp xếp nổi bọt (Bubblesort), sắp xếp kiểu vun đống (Heapsort), sắp xếp nhanh (Quicksort), sắp xếp trộn (Mergesort), để cài đặt chương trình Demo, cho phép sắp xếp một dãy số đã cho tuỳ ý thành một dãy số có thứ tự theo các thuật toán sắp xếp vừa nêu trên.
III. Mục tiêu của đề tài cần đạt được:
1. Đối với báo cáo :
- Mô tả quá trình thực hiện của tất cả các phương pháp sắp xếp.
- Tính được độ phức tạp của từng phương pháp.
- Thể hiện được tất cả các giao diện trong Demo.
- Mô tả các chức năng trong Demo.
2. Đối với Demo :
- Thiết kế giao diện hài hoà rõ ràng. Có sử dụng đồ hoạ.
- Demo phải có dữ liệu mẫu để test và có chức năng nhập dữ liệu để kiểm tra thủ công.
B. TÌM HIỂU VỀ BÀI TOÁN SẮP XẾP
I. Định nghĩa về bài toán sắp xếp:
1. Khái niệm về sắp xếp:
Sắp xếp là quá trình xử lý một danh sách các phần tử (hoặc các mẫu tin) để đặt chúng theo các thứ tự thỏa mãn một tiêu chuẩn nào đó dựa trên nội dung thông tin lưu giữ tại mọi phần tử.
Tại sao cần phải sắp xếp các phần tử thay vì để nó ở dạng tự nhiên (chưa có thứ tự vốn có? Ví dụ của bài toán tìm kiếm với phương pháp tìm kiếm nhị phân và tuần tự để trả lời câu hỏi này.
Khi khảo sát bài toán sắp xếp, ta sẽ phải làm việc nhiều với một khái niệm gọi là nghịch thế.
2:Khái niệm nghịch thế :
Xét một mảng các số a0,a1, …, an. Nếu có i aj, thì ta gọi đó là một nghịch thế.
Ví dụ : Mảng chưa sắp xếp sẽ có nghịch thế.
Mảng đã có thứ tự sẽ không chứa nghịch thế. Khi đó a0 sẽ là phấn tử nhỏ nhất rối đến a1, a2.
Như vậy, để sắp xếp một mảng, ta có thể tìm cách giảm số các nghịch thế trong mảng này bằng cách hoán vị các cặp phần tử ai, aj nếu có i aj theo một quy luật nào đó.
Cho trước một dãy số a1,a2, …, an được lưu trữ trong cấu trúc dữ liệu mảng.
A : array [1..100] of integer;
Sắp xếp dãy số a1,a2, …, an là thực hiện việc bố trí lại các phần tử sao cho hình thành được dãy mới ak1, ak2, …, akn có thứ tự (giả sử xét thứ tự tăng) nghĩa là aki > aki-1. Mà để quyết định được những tình huống cần thay đổi vị trí các phần tử trong dãy, cần dựa vào kết quả của một loạt phép so sánh. Chính vì vậy, hai thao tác so sánh và gán là các thao tác cơ bản của hầu hết các thuật toán sắp xếp.
Khi xây dựng một thuật toán sắp xếp cần chú ý tìm cách giảm thiểu những phép so sánh và đổi chổ không cần thiết để tăng hiệu quả của thuật toán. Đối với các dãy số được lưu trữ trong bộ nhớ chính, nhu cầu tiết kiệm bộ nhớ được đặt nặng, do vậy những thuật toán sắp xếp đòi hỏi cấp phát thêm vùng nhớ để lưu trữ dãy kết quả ngoài vùng nhớ lưu trữ dãy số ban đầu thường ít được quan tâm. Thay vào đó, các thuật toán sắp xếp trực tiếp trên dãy số ban đầu – gọi là các thuật toán sắp xếp tại chổ - lại được đầu tư phát triển. Phần này giới thiệu một số giải thuật sắp xếp từ đơn giản đến phức tạp có thể áp dụng thích hợp cho việc sắp xếp nội.
C. NỘI DUNG CỦA CÁC PHƯƠNG PHÁP SẮP XẾP
I. Phương pháp chọn trực tiếp (Selection sort):
1. Giải thuật:
- Phương pháp sắp xếp chọn trực tiếp - selection sort là phương pháp sắp xếp bằng cách chọn phần tử nhỏ nhất xếp vào vị trí thứ nhất, tương tự các phần tử nhỏ tiếp theo xếp vào vị trí tiếp theo lần lượt cho đến hết số phầm tử trong dãy.Ta thấy rằng, nếu mảng có thứ tự, phần tử ai luôn là min(ai, ai+1, .., an-1). Ý tưởng của thuật toán chọn trực tiếp mô phỏng một trong những cách sắp xếp tự nhiên nhất trong thực tế: chọn phần tử nhỏ nhất trong n phần tử ban đầu, đưa phần tử này về vị trí đúng là đầu dãy hiện hành; sau đó không quan tâm đến nó nữa, xem dãy hiện hành chỉ còn n – 1 phần tử của dãy ban đầu, bắt đầu từ vị trí thứ hai; lặp lại quá trình trên cho dãy hiện hành … đến khi dãy hiện hành chỉ còn một phần tử. Dãy ban đầu còn n phần tử, vậy tóm tắt ý tưởng thuật toán là thực hiện n-1 lượt việc đưa phần tử nhỏ nhất trong dãy hiện hành về vị trí đúng ở đầu dãy.
- Các bước tiến hành như sau :
+ Bước 1: Gán i bằng 1 (i:=1,bắt đầu từ phần tử đầu tiên của dãy);
+ Bước 2: Tìm phần tử a[min] nhỏ nhất trong dãy tiến hành từ a[i] đến a[n].
+ Bước 3: Hoán vị a[min] và a[i].
+ Bước 4: Nếu i < n-1 thì i := i + 1; Lặp lại Bước 2. Ngược lại: Dừng.( n-1 phần tử đã nằm đúng vị trí ).
- Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
12
2
8
5
1
6
4
15
I=1
5
12
6
4
15
1
2
8
I=2
15
4
6
12
5
8
2
1
I=3
8
6
12
5
4
2
1
15
I=4
8
6
12
5
4
2
1
15
I=5
15
8
12
6
5
4
2
1
I=6
12
8
6
5
4
2
1
15
I=7
2. Đánh giá giải thuật:
- Đối với giải thuật chọn trực tiếp, có thể thấy rằng ở lượt thứ i, bao giờ cũng cần ( n-1) lần so sánh để xác định phần tử nhỏ nhất hiện hành. Số lượng phép so sánh này không phụ thuộc vào tình trạng của dãy số ban đầu, do vậy trong mọi trường hợp có thể kết luận :
Số lần so sánh bằng =
- Số lần hoán vị ( một hoán vị bằng 3 phép gán ) lại phụ thuộc vào tình trạng ban đầu của dãy số, ta chỉ có thể ước lược trong từng trường hợp như sau:
Trường hợp
Số lần so sánh
Số phép gán
Tốt nhất
n(n-1)/2
0
Xấu nhất
n(n-1)/2
3n(n-1)/2
Begin
Đổi chổ
a[j] & a[j-1];
i = 1
j = n
j >= i+1
i<=n-1
Đúng
Sai
Sai
End
a[j]<a[j-1]
Đúng
Đúng
Sai
Xuất dãy số
3. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn
II. Phương pháp chèn trực tiếp (Insert sort):
1. Giải thuật:
Giả sử có một dãy a1, a2, …, ai-1 đã có thứ tự. Ý tưởng của giải thuật sắp xếp bằng phương pháp chèn trực tiếp là tìm cách chèn phần tử ai vào vị trí thích hợp của đoạn đã được sắp xếp để được dãy mới a1, a2, …, ai trở nên có thứ tự. Vị trí này chính là vị trí giữa hai phần tử ak-1 và ak thỏa ak-1 < ai < ak
Cho dãy ban đầu a1, a2, …, an ta có thể xem như đã có đoạn gồm một phần tử a1 đã được sắp xếp, sau đó thêm a2 vào đoạn a1 sẽ có đoạn a1, a2 được sắp xếp; tiếp tục thêm a3 vào đoạn a1, a2 để có đoạn a1, a2, a3 được sắp; tiếp tục cho đến khi thêm xong aN vào đoạn a1 a2, …aN-1 sẽ có dãy a1 a2… aN được sắp.
- Các bước tiến hành như sau:
+ Bước 1: i = 2; (giả sử có đoạn a[1] được sắp)
+ Bước 2: x:= a[i]; tìm vị trí pos thích hợp trong đoạn a[1] để chèn a[i] vào;
12
+ Bước 3: Dời chổ các phần tử từ a[pos đến a[i-1] sang phải một vị trí để dành chổ cho a[i];
+ Bước 4: a[pos] := x; (có đoạn a[1]…a[i] đã được sắp)
+ Bước 5: i := i+1 ; nếu i < n : lặp lại bước 2. Ngược lại : Dừng
- Ví dụ : Xét dãy số gồm các số hạng :
12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
I=2
15
4
6
1
5
8
12
2
I=3
15
4
6
1
5
12
8
2
I=4
15
4
6
1
12
8
5
2
I=5
15
4
6
12
8
5
2
1
I=6
15
4
12
8
6
5
2
1
I=7
15
12
8
6
5
4
2
1
I=8
2. Đánh giá giải thuật :
Đối với giải thuật chèn trực tiếp, các phép so sánh xảy ra trong mỗi vòng lặp while tìm vị trí thích hợp pos, và mỗi lần xác định vị trí đang xét không thích hợp, sẽ dời chỗ phần tử a[pos] tương ứng. Giải thuật thực hiện tất cả n -1 vòng lặp while, do số lượng phép so sánh và dời chỗ này phụ thuộc vào tình trạng dãy số ban đầu, nên chỉ có thể ước lược trong từng trường hợp như sau :
Trường hợp
Số phép so sánh
Số phép gán
Tốt nhất
Xấu nhất
3. Lưu đồ thuật toán:
Xem như dãy số cần sắp xếp đã được nhập vào sẵn:
Begin
Đổi chổ
a[j] & a[j-1];
j = j – 1;
i = 2
j = i
j >1 và a[j] <a[j-1]
i < = n
Đúng
Sai
Sai
Đúng
End
Xuất dãy số
III. Phương pháp sắp xếp nổi bọt (Bubble sort):
1. Giải thuật :
- Sắp xếp nổi bọt (bubble sort) là một thuật toán sắp xếp đơn giản, so sánh hai phần tử đầu, nếu phần tử đứng trước lớn hơn phần tử đứng sau thì đổi chỗ chúng cho nhau. Tiếp tục làm như vậy với cặp phần tử tiếp theo cho đến cuối tập hợp dữ liệu. Sau đó, quay lại với hai phần tử đầu cho đến khi không còn cần phải đổi chỗ nữa. Nó có tên gọi này từ hình ảnh của các "bọt" khí nhẹ hơn được nổi lên trên. Nó sử dụng phép so sánh các phần tử nên là một sắp xếp kiểu so sánh.
- Các bước tiến hành như sau :
+ Bước 1: i := 1 ; // Lần xử lí đầu tiên.
+ Bước 2: j : = n ; // duyệt từ cuối dãy ngược về vị trí i .
Trong khi ( j > i) thực hiện :
Nếu a[j]<a[j-1] : a[j] : = a[j-1]; // Xét cặp phần tử kế cận j = j-1;
+ Bước 3: i = i + 1; // Lần xử lí kế tiếp
Nếu i > n-1 : hết dãy. Dừng.
Ngược lại : Lặp lại bước 2 . Cho đến khi j=i thì dừng thuật toán.
- Ví dụ : Cho dãy số a gồm các phần tử sau :
12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
I=1
J=7
15
6
4
1
5
8
12
2
J=5
I=1
15
6
4
5
1
8
12
2
1
2
4
5
6
8
12
15
l = 8
1
2
5
6
8
12
4
15
l = 7
J=4
I=1
15
6
4
5
8
1
12
2
I=1
J=3
15
6
4
5
8
12
1
2
I=1
J=2
15
6
4
5
8
12
2
1
I=2
J=6
15
6
5
4
8
12
2
1
I=2
J=5
15
6
5
8
4
12
2
1
J=4
I=2
15
6
5
8
12
4
2
1
J=6
I=3
Cứ tiếp tục như vậy và tăng dần i lên cho đến khi i > n-1 thì dừng và dãy đã được sắp xếp xong.
Dãy khi sắp xếp xong là : 1 2 4 5 6 8 12 15
2. Đánh giá giải thuật :
Đối với giải thuật nổi bọt, số lượng các phép so sánh xảy ra không phụ thuộc vào tình trạng của dãy số ban đầu, nhưng số lượng phép toán hoán vị thực hiện tuỳ thuộc vào kết quả so sánh, có thể ước lượt trong từng trường hợp như sau:
Trường hợp
Số lần so sánh
Số lần hoán vị
Tốt nhất
0
Xấu nhất
à Nhận xét:
Bubblesort có các khuyết điểm sau : không nhận diện được tình trạng dãy đã có thứ tự hay có thứ tự từng phần. Các phần tử nhỏ được đưa về vị trí đúng rất nhanh, trong khi các phần tử lớn lại được đưa về vị trí đúng
rất chậm.
3. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn.
Begin
Đổi chổ
a[j] & a[j-1];
i = 1
j = n
j >= i+1
i<=n-1
Đúng
Sai
Sai
End
a[j]<a[j-1]
Đúng
Đúng
Sai
Xuất dãy số
IV. Phương pháp sắp xếp vun đống (Heap sort):
1. Định nghĩa heap :
Giả sử xét trường hợp sắp xếp tăng dần, khi đó heap được định nghĩa là một dãy các phần tử a1, a2, …, ar thỏa các quan hệ sau với mọi i [l,r] :
1/. ai >= a2i
2/. ai >= a2i+1 {(ai, a2i), (ai, a2i+1) là các cặp phần tử liên đới}
Heap có các tính chất sau :
Tính chất 1: Nếu a1, a2, …, ar là một heap thì khi cắt bỏ một số phần tử ở hai đầu của heap, dãy con còn lại vẫn là một heap.
Tính chất 2: Nếu a1, a2, …, an là một heap thì phần tử a1 (đầu heap) luôn là phần tử lớn nhất trong heap.
Tính chất 3: Mọi dãy a1, a2, …, ar với 2l > r là một heap.
2. Giải thuật Heapsort:
- Giải thuật hepsort trải qua hai giai đoạn:
Giai đoạn 1: Hiệu chỉnh dãy số ban đầu thành heap;
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
Bước 1: Đưa phần tử nhỏ nhất về vị trí đúng ở cuối dãy :
r : = n ; Hoán vị (a1, ar);
Bước 2: Loại bỏ phần tử nhỏ nhất ra khỏi heap : r : = r – 1;
Hiệu chỉnh phần còn lại của dãy từ a1, a2, …, ar thành một heap.
Bước 3: Nếu r > 1 (heap còn phần tử): Lặp lại bước 2. Ngược lại :Dừng.
- Ví dụ :Cho dãy số a : 12 2 8 5 1 6 4 15
15
4
6
1
5
8
2
12
Phần tử liên đới
I= 4
Giai đoạn 1 : Hiệu chỉnh dãy ban đầu thành heap
5
4
6
1
15
8
2
12
Phần tử liên đới
I= 3
5
4
6
1
15
8
2
12
I= 2
Phần tử liên đới
5
4
6
1
2
8
15
12
Lan truyền việc hiệu chỉnh
I = 1
2
4
6
1
5
8
15
12
Phần tử liên đới
I = 1
2
4
6
1
5
8
12
15
Giai đoạn 2: Sắp xếp dãy số dựa trên heap :
2
4
6
1
5
8
12
15
r=8
Hiệu chỉnh lại heap
15
4
6
1
2
8
5
12
15
4
6
1
2
8
5
12
r=7
Hiệu chỉnh lại heap
15
12
4
1
2
6
5
8
15
12
4
1
2
6
5
8
r=6
Hiệu chỉnh lại heap
15
12
8
1
2
4
5
6
15
12
8
1
2
4
5
6
r=5
Thực hiện tương tự cho r =5, 4, 3, 2 ta được :
15
12
8
6
5
4
2
1
3. Đánh giá giải thuật :
Việc đánh giá giải thuật heapsort rất phức tạp, nhưng đã chứng minh được trong trường hợp xấu nhất độ phức tạp là O(nlog2n).
4. Lưu đồ thuật toán :
Xem như dãy số cần sắp xếp đã được nhập vào sẵn.
* Hiệu chỉnh Heap :
Begin
i = l ; j = 2*i ;
x = a[i] ;
cont = true ;
Sai
j <= r & Cont
Đúng
Sai
j < r
Đúng
Sai
a[j] < a[j+1]
Đúng
j = j + 1
Sai
a[j] < x
Đúng
a[i] = a[j] ;
i = j ;
j = 2*j ;
Cont = false
a[i] = x
End
* Sắp xếp vun đống:
Begin
Hiệu chỉnh dãy a1, a2,...,an thành Heap ;
r = n ;
Sai
r > 0
Đúng
Đổi chổ a[l] và a[r];
r = r – 1 ;
Hiệu chỉnh dãy al, al+1,...,ar thành Heap;
Xuất dãy số
End
V. Phương pháp sắp xếp nhanh (Quick sort):
1. Giải thuật :
Để sắp xếp dãy a1, a2, …, an giải thuật Quick sort dựa trên việc phân hoạch dãy ban đầu thành 2 phần:
Dãy con 1: Gồm các phần tử a1.. ai có giá trị không lớn hơn x.
Dãy con 2: Gồm các phần tử ai.. an có giá trị không nhỏ hơn x.
Với x là giá trị của một phần tử tùy ý trong dãy ban đầu. Sau khi thực hiện phân hoạch, dãy ban đầu được phân thành 3 phần :
1. ak < x , với k = 1.. i
2. ak = x , với k = i.. j
3. ak > x , với k = j.. n
ak < x
ak = x
ak > x
Trong đó, dãy con thứ 2 đã có thứ tự, nếu các dãy con 1 và 3 chỉ có một phần tử thì chúng cũng đã có thứ tự, khi đó dãy ban đầu đã được sắp. Ngược lại, nếu các dãy con 1 và 3 có nhiều hơn một phần tử thì dãy ban đầu chỉ có thứ tự khi các dãy con 1 và 3 được sắp. Để sắp xếp dãy con 1 và 3, ta lần lượt tiến hành việc phân hoạch từng dãy con theo cùng phương pháp phân hoạch dãy ban đầu vừa trình bày.
Giải thuật phân hoạch dãy al, al+1, .., ar thành hai dãy con :
Bước 1: Chọn tùy ý một phần tử a[k] trong dãy là giá trị mốc, l < k < r: x : = a[k]; i:=l; j : = r ;
Bước 2: Phát hiện và hiệu chỉnh cặp phần tử a[i], a[j] nằm sai chỗ :
Bước 2a: Trong khi (a[i] < x) i : = i+1;
Bước 2b: Trong khi (a[j] > x) j : = j-1;
Bước 2c: Nếu i x > a[j] mà a[j] đứng sau a[i] thì hoán vị (a[i],
a[j]);
Bước 3: Nếu i < j : Lặp lại bước 2. // chưa xét hết mảng
Nếu i > j : Dừng.
Giải thuật phân hoạch dãy sắp xếp dãy al , al+1, …, ar :
Có thể phát biểu giải thuật sắp xếp một cách đệ quy như sau :
Bước 1: Phân hoạch dãy a1 . ar thành các dãy con :
Dãy con 1 : a1.. aj <x
Dãy con 2: aj+1.. ai-1 = x
Dãy con 1: ai.. ar >x
Bước 2: Nếu (l < j) // dãy con 1 có nhiều hơn 1 phần tử
Phân hoạch dãy a1.. aj
Nếu (i < r) // dãy con 3 có nhiều hơn 1 phần tử
Phân hoạch dãy ai.. ar
Ví dụ : Cho dãy số a : 12 2 8 5 1 6 4 15
Phân hoạch đoạn l =1, r = 8, x =A[4]=5
15
4
6
1
5
8
2
12
r=8
l=1
15
12
6
8
5
1
2
4
Phân hoạch đoạn l =1, r = 3, x =A[2]=2
15
12
6
8
5
1
2
4
r=3
l=1
15
12
6
8
5
4
2
1
Phân hoạch đoạn l =5, r = 8, x =A[6]=6
12
6
8
5
4
2
1
15
r=8
l=5
15
12
8
6
5
4
2
1
15
12
8
5
4
2
1
Phân hoạch đoạn l =7, r = 8, x =A[7]=6
6
l=7
r=8
12
8
6
5
4
2
1
15
Dừng.
2. Đánh giá giải thuật :
Hiệu quả thực hiện của giải thuật Quicksort phụ thuộc vào việc chọn giá trị mốc. Trường hợp tốt nhất xảy ra nếu mỗi lần phân hoạch đều chọn được phần tử median (phần tử lớn hơn (hay bằng) nữa số phần tử, và nhỏ hơn (hay bằng) nữa số phần tử còn lại) làm mốc, khi đó dãy được phân chia thành hai phần bằng nhau và cần log2n lần phân hoạch thì sắp xếp xong. Nhưng nếu mỗi lần phân hoạch lại chọn nhằnm phần tử có giá trị cực đại (hay cực tiểu) là mốc, dãy sẽ bị phân chia thành hai phần không đều : một phần chỉ có 1 phần tử, phần còn lại gồm (n-1) phần tử, do vậy cần phân hoạch n lần mới sắp xếp xong.
à Ta có bảng tổng kết sau:
Trường hợp
Độ phức tạp
Tốt nhất
n*log(n)
Trung bình
n*log(n)
Xấu nhất
n2
3