1. KHÁI NIỆM
a) Sắp xếp là một quá trình tồ chức lại một dãy các dữ liệu theo một trật tự nhất định.
b) Mục đích của việc sắp xếp là nhằm giúp cho việc tìm kiếm dữ liệu được dễ dàng và nhanh chóng.
Sắp xếp là một việc làm hết sức cơ bản và được dùng rộng rãi trong các kĩ thuật lập trình nhằm xử lí một dãy các dữ liệu.
c) Các giải thuật sắp xếp được phân chia thành hai nhóm chính là:
- Sắp xếp trong (hay sắp xếp mảng).
Toàn bộ dữ liệu cần sắp xếp phải được đưa vào bộ nhớ chính của máy tính, do đó nó thường được sử dụng khi khối lượng dữ liệu không vượt quá dung lượng bộ nhớ chính.
Nhóm sắp xếp trong bao gồm các phương pháp:
• Phương pháp đếm.
• Phương pháp chèn.
• Phương pháp chọn.
• Phương pháp đổi chỗ.
• Phương pháp trộn.
- Sắp xếp ngoài (hay sắp xếp tập tin).
Áp dụng trong trường hợp ta phải sắp xếp các tập tin chứa nhiều mẫu tin và mỗi mẫu tin có chiều dài tương đôi lớn, do đó ta không thể nạp toàn bộ tập tin này vào bộ nhớ chính để sắp thứ tự. Vì vậy ta phải có những phương pháp thích hợp cho việc sắp thứ tự tập tin.
2. SẮP XẾP TRONG
a) Khái niệm
Cấu trúc dữ liệu thích hợp cho các phần tử cần sắp thứ tự là record. Mỗi phần tử có hai vùng đặc trưng là: vùng key để chứa khóa của phần tử và được sử dụng trong các giải thuật tìm kiếm, vùng info dùng đề chứa dữ liệu của phần tử.
Ta khai báo:
Type
item = record
key: integer;
info: integer;
end; 1
Var
a: array[1..n] of intern;
Khóa của phần tử có thể là chữ hoặc số.
Yêu cầu của giải thuật là dùng ít vùng nhớ và thời gian thực hiện nhanh.
b) Phương pháp đếm (Counting sort)
* Giải thích:
Nội dung của phương pháp này là đếm phần tử có khóa nhỏ hơn hay bằng khóa của phần tử a[i]. Nếu có j phần tử có khóa nhỏ hơn khóa của phần tử a[i] thì phần tử a[i] sẽ có vị trí thứ (j + 1) trong dãy đã có thứ tự.
Trong giải thuật, ta dùng mảng count(i) (i = 1, 2, ..., n) với count[i] cho biết số phần tử có khóa nhỏ hơn khóa của phần tử a[i]. Như vậy count[i + 1] là vị trí của phần tử a[i] trong dãy đã có thứ tự.
* Ví dụ:
Sắp xếp dãy 3 1 5 2 7 6 9 4
i: 1 2 3 4 5 6 7 8
a: 3 1 5 2 7 6 9 4
Count: 2 0 4 1 6 5 7 3
Như vậy phần tử có khóa 9 ở vị trí thứ 8 vì Count[9] = 7
* Thể hiện bằng PASCAL:
Procedure Counting_Sort;
Var
Count: array[1..n] of integer;
s: array[1..n] of item;
i, j: integer;
Begin
For i:= 1 to n do count[i]:= 0
For i:= n down to 2 do
For j:= i - 1 down to 1 do
if a[i]. Key < a[j]. Key then
Count[j]:= Count[i] + 1
else count[i]:= count[i] + 1;
For i:= 1 to n do s[count[i] + 1] := a[i];
For i:= 1 to n do a[i]:= s[i];
End;
c) Phương pháp chèn (Insertion Sort)
* Giải thích:
Nội dung của phương pháp này là giả sử ta có dãy a[l]..a[i -1] đã có thứ tự, ta phải xác định vị trí thích hợp của phần tử a[i] trong dãy a[l]..a[i -1] bằng phương pháp tìm kiếm tuần tự từ a[i -1] bằng phương pháp tìm kiếm tuần tự từ a[i -1] trở về phía a[l] để tìm ra vị trí thích hợp của a[i]. Ta chèn a[i] vào vị trí này và kết quả là dãy a[l]..a[i] có thứ tự. Ta áp dụng cách làm này với i = 2, 3, n.
* Ví dụ:
Ta phải sắp xếp dãy số:
39 50 7 37 89 13 1 62
i = 2 39 50 7 37 89 13 1 62
i = 3 39 50 7 37 89 13 1 62
i = 4 7 39 50 37 89 13 1 62
i = 6 7 37 39 50 89 13 1 62
i = 5 7 37 39 50 89 13 1 62
i = 7 7 13 37 39 50 89 1 62
i = 8 1 7 13 37 39 50 98 62
1 7 13 37 39 50 62 89
* Thể hiện bằng Pascal:
Procedure Insertion-Sort;
Var
x: item;
i, j: integer;
Begin
For i:= 2 to n do
Begin
x:= a[i];
a[0] := x;
j := j - 1;
While x. key < a[j]. key do
begin
a[j + 1] := a[j];
j := i - 1;
end;
a[j + 1]:= x;
end;
End;
d) Phương pháp chọn (Selection Sort)
* Giải thích:
Nội dung của phương pháp này là ở bước thứ i (i = 1, 2, n-1) ta lựa chọn phần tử nhỏ nhất trong dãy a[i]..a[n] rồi đổi chỗ phần tử này với phần tử a[i]. Cuối cùng ta sẽ có dãy a[l]..a[n] có thứ tự.
* Ví dụ:
Ta phải sắp xếp dãy số:
39 50 7 37 89 13 1 62
i = 1 39 50 7 37 89 13 1 62
i = 2 1 50 7 37 89 13 39 62
i = 3 1 7 50 37 89 13 39 62
i = 4 1 7 13 37 89 50 39 62
i = 5 1 7 13 37 89 50 39 62
i = 6 1 7 13 37 39 50 89 62
i = 7 1 7 13 37 39 50 89 62
1 7 13 37 39 50 89 62
* Thể hiện bằng PASCAL:
Procedure Selection_Sort;
Var
i, j, k: integer;
x: item;
min: interger;
Begin
For i := 1 to n - 1 do
begin
min:= a[i]. key;
k := i;
For:= i;
For j:= i + 1 to n do
If a[j]. key < min then
Begin
min:= a[j]. key;
k:= j;
end;
x:= a[k] ;
a[k]:= a[i];
a[i]:= x;
end;
end;
e) Phương pháp đổi chỗ
Có rất nhiều phương pháp sắp xếp dựa trên việc đổi chỗ giữa 2 phần tử của dãy. Sau đây chúng ta sẽ xét các phương pháp:
- Bubble Sort.
- Shake Sort.
- Sell Sort.
- Quick Sort.
* Bubble Sort
* Giải thích:
Nội dung của phương pháp này là ta duyệt dãy a[1], ..., a[n]. Nếu a[i].Key > a[i + l].Key > ai = 1, 2, ..., n - 1) thì ta đổi chỗ phần tử a[i] với phần tử a[i + 1]. Lập lại quá trình duyệt dãy này cho đến khi không có xảy ra việc đổi chỗ của hai phần tử.
Chú ý rằng bất kì lúc nào phần tử nhỏ nhất cũng gặp trước tiên, nó như những bọt khí nhẹ sẽ nổi lên trên khi ta đun nước. Sau đó ở thứ hai phần tử nhỏ thứ 2 sẽ được đặt vào đúng vị trí. Vì vậy sắp xếp nổi bọt thao tác như một kiểu sắp xếp chọn, mặc dù nó không làm nhiều việc hơn để đưa từng phần tử vào đúng vị trí.
* Ví dụ:
Ta phải sắp xếp:
39 50 7 37 89 13 1 62
Bước 0 1 2 3 4 5 6 7
———————————————————————
39 1 1 1 1 1 1 1
50 39 7 7 7 7 7 7
7 50 39 13 13 13 13 13
37 7 50 39 37 37 37 37
89 37 13 50 39 39 39 39
13 89 37 37 50 50 50 50
1 13 89 62 62 62 62 62
62 62 62 89 89 89 89 89
* Thể hiện bằng PASCAL:
Procedure Bubblej_Sort;
Var
i, j : integer;
x : item;
Begin
For i:= 2 to n do
For j:= n down to i do
If a[j - 1]. key > a[j], key then
Begin
x := a[j - 1];
a[j - 1] := a[j];
a[j] := x;
end;
end;
* Cải tiến:
Ta nhận thấy rằng nếu ở một lần duyệt dãy nào đó mà không có xảy ra sự đổi chỗ giữa hai phần tử thì dãy đang sắp đã có thứ tự và giải thuật kết thúc.
Ta có thể đặt cờ để ghi nhận điều này và co chương trình sau:
Procedure Bubble_Sort2;
Var
Flag : Boolean;
i : integer;
x : item;
Begin
flag := true;
While flag do
Begin
flag := false;
for i := 1 to n - 1 do
if a[i]. Key > a[i + 1].Key then
Begin
x := a[i];
a[i]:= a[i + 1];
a[i + 1] := a;
flag:= true;
end;
end;
end;
* Shake Sort
* Giải thích:
Phương pháp này là một cải tiến của phương pháp Bubble Sort theo hướng không những phần tử nhẹ nổi lên trên mà cả phần tử nặng cũng xuống dưới giống như khi ta “rung” một cái nồi và thuật toán sắp xếp phải điều khiển cả hai quá trình “nổi lên” và “chìm xuống” này một cách tự giác. Muốn vậy ta phải ghi nhớ lần đổi chỗ cuối cùng khi duyệt dãy từ dưới lên và khi duyệt dãy từ trên xuống để quyết định trong chu trình kế tiếp sẽ chỉ duyệt từ đây đến đâu.
* Ví dụ:
Sắp xếp dãy số:
39 50 7 37 89 13 1 62
d = 2 3 3 4 4
c = 8 8 7 7 4
39 1 1 1 1
50 39 39 7 7 .
7 50 7 39 13
37 7 37 13 37
89 37 50 37 39
13 89 13 50 50
1 13 62 62 62
62 62 89 89 89
Thể hiện bằng PASCAL:
Procedure Shake_Sort;
Var
i, k, d, c: integer;
x : item ;
Begin
d:= 2;
c:= n;
k:= n;
Repeat
For i:= c down to d do
if a[i - l].Key > a[i].Key then
Begin
x:= a[i - 1]
a[i - 1] := [a] ;
a[i] := x ;
k := i;
end;
d := k + 1;
For i:= d to c do
If a[i - 1]. key > a[i].Key then
Begin
x:= a[i - 1];
a[i - 1]:= a[i] ;
a[i] := x;
k := i;
end;
c := k - 1
Until d > c
end;
* Shell Sort
* Giải thích:
Các phương pháp sắp xếp đã trình bày ở trên nói chung đều di chuyển mỗi phần tử đi một vị trí trong mỗi bước. Phương pháp Shell Sort dựa trên ý tưởng chính là hoán vị các phần tử ở xa nhau. Để làm được việc đó ta cần phải sắp xếp lại tập tin để cho nó có tính chất là việc lấy mọi phần tử thứ h (bắt đầu từ bất cứ vị trí nào) cũng đều cho ra một tập tin đã sắp. Một tập tin như vậy được gọi là sắp theo độ dài bước h. Nói một cách khác, một tập tin được sắp theo độ dài h là tập tin được sắp độc lập với nhau, đan xen vào nhau. Bằng cách sắp xếp theo độ dài bước h ứng với vài giá trị h khá lớn, chúng ta có thể di chuyển các phần tử ở những khoảng cách xa trong mảng và vì vậy dễ dàng hơn để sắp xếp độ dài bước h cho các giá trị h nhỏ hơn. Dùng thủ tục này cho bất kì một dãy các giá trị của h tận cùng là 1 sẽ cho ra một tập tin đã sắp cho xong: Đó chính là Shell Sort.
* Ví dụ:
Ta phải sắp xếp dãy:
39 50 7 37 89 13 1 62
Bước 1: 4-Sort
39 50 7 37 89 13 1 62
39 13 1 37 89 50 7 62
Bước 2: 2-Sort
39 13 1 37 89 50 7 62
1 13 7 37 39 50 89 62
Bước 3: 1-Sort
1 13 7 37 39 50 89 62
1 7 13 37 39 50 89 62
* Thể hiện bằng PASCAL:
CHÚ Ý:
- Ta dùng dãy phụ chứa độ tăng h[1], ..., h[t| để điều khiển quá trình sắp thứ tự với h[t]= 1. Việc chọn các độ tăng thích hợp sẽ làm giảm thời gian sắp thứ tự.
Đặt hl = h[l] ta phải khai báo lại dãy a như sau:
a: array [h1..n] of item;
các phần tử a[i] (i <= 0) là các lính canh. Sau đây ta chọn: h[1] = 9, h[2] = 5, h[3] = 3, h[4] = 1
Procedure Shell_Sort;
Const
t = 1
Var
i, j, k, s: integer;
x: item;
m: integer;
h: array[l..t] of integer;
Begin
h[1] := 9;
h[2] := 5;
h[3] := 3;
h[4] := 1;
For m := 1 to t do
Begin
k := h[m|;
s := -k;
For i:= k + 1 to n do
Begin
x:= a[i];
j := i - k;
If s = 0 then s := -k;
x := s + 1
a[s] := x;
while x.key < a[j].key do
Begin
a[j + k]:= a[j];
j := j - k;
end;
a[j + k] := x
end;
end;
end;
• Quick Sort
* Giải thích:
Nội dung của phương pháp này là chọn phần tử x ở giữa của dãy làm chuẩn để so sánh. Ta phân hoạch dãy này thành 3 dãy con liên tiếp nhau:
- Dãy con thứ nhất gồm các phần tử có khóa nhỏ hơn x.key.
- Dãy con thứ hai gồm các phần tử có khóa bằng x.key.
- Dãy con thứ ba gồm các phần tử có khóa lớn hơn x.key.
Sau đó áp dụng giải thuật phân hoạch này cho dãy con thứ nhất và dãy con thứ ba, nếu các dãy con này có nhiều hơn một phần tử (đệ qui).
Cụ thể là xét một đoạn của dãy từ thành phần thứ L đến thành phần thứ R.
- Lấy giá trị của thành phần thứ (L+R) dir 2 gán vào biến X.
- Cho i ban đầu là L.
- Cho J ban đầu là R.
- Lặp lại.
• Chừng nào còn A[i] < X thì tăng i
• Chừng nào còn A[j] > X thì giảm j
• Nếu i <= j thì
+ Hoán vị A[i] và A[j]
+ Tăng i
+ Giảm j
Cho đến khi i > j
+ Sắp xếp đoạn từ A[L] đến A[j]
+ Sắp xếp đoạn từ A[i] đến A[R]
* Ví dụ:
Sắp xếp dãy số:
39 50 7 37 89
X = 37
Sau 2 lần đổi chỗ ta được dãy:
1 13 7 37 89
Xử lí dãy con
1 13 7
Ta được:
1 7 13
Xử lí dãy con
89 50 39 62
Ta được
39 50 89 62
39 50 62 89
Vậy dãy đã sắp xếp là:
1 7 13 37 39 50 62 89
Ta nhận thấy ý tưởng chính ở đây là “chia để trị”.
* Thể hiện hằng PASCAL:
Để đơn giản ta viết thủ tục sắp một mảng số nguyên được truyền bằng tham biến.
Procedure Quick_Sort (Var A: Array[1..n] of integer);
Procedure Sort (L, R: integer);
Var i, j, TG, X: integer
Begin
X:= A[(L + R div 2]; i := L; j := R;
Repeat
while (A[i] < X) do inc (i);
while (A[j] > X) do dec(j);
if i <= j then
Begin
TG:= A[i];
A[i]:= A[j];
A[j]:= TG;
Inc(i);
Dec(j);
end;
Until i > j;
if L < j then sort (L, J);
if i < R then sort [I, R];
Begin
sort (1, n);
End.
....
(Còn nữa)