快排和归并是使用比较广泛的两种排序算法,他们的性能都可以达到O(nlgn),这也是基于排序的算法能达到的最佳的性能。
快速排序
快速排序的递归描述如下:
对序列L排序时
- 如果L为空,则排序结果为空
- 否则,在L中任选一个元素作为pivot,然后递归的将L中不大于pivot的元素排序,将结果置于pivot左侧,同时递归地将所有大于pivot的元素排序,将结果置于pivot的右侧。
递归的基本快速排序算法实现如下:
package main
import "fmt"
func quickSort(source []int, l, u int) {
if l < u {
m := partition(source, l, u)
quickSort(source, l, m-1)
quickSort(source, m, u)
}
}
func partition(source []int, l, u int) int { //划分
var (
pivot = source[l]
left = l
right = l+1
)
for ;right<u; right++ {
if source[right] <= pivot {
left++
source[left], source[right] = source[right], source[left]
}
}
source[l], source[left] = source[left], source[l]
return left+1
}
func main() {
s := []int{10, 6, 7, 4, 2, 5}
quickSort(s, 0, len(s))
fmt.Println(s)
}
快速排序性能分析
最好情况
总共分为lgn层递归。 第一层划分,处理n个元素, 花费的时间复杂度为O(n);第二层进行了2次划分,处理了n/2个元素,总体执行时间为2O(n/2)=O(n); 第三层进行了4次划分,处理了n/4个元素, 总体的执行时间为4O(n/4)=O(n);...。将上述时间想加,可以得到快速排序最快的时间复杂度是O(nlgn)。
最差情况
在最坏的情况下, 划分过程大部分时间把序列划分成了两个不平衡的部分。其中一部分的长度为O(1),另一部分的长度为O(n)。 如果我们用图来表示, 最好的情况下,快速排序的过程形成了一颗平衡二叉树, 最坏的情况下, 快速排序的过程退化成了链表。
最坏情况下的时间复杂度也就是O(n^2)。
最坏情况下何时发生?
1、 序列中元素都相同或者大部分相同
2、 需要排序的序列处于相反的序列
3、其他一些情况也可能导致性能很差
平均情况
快速排序在平均情况下性能良好,甚至每次划分时总体得到1:9的两部分,总体性能仍然为O(nlgn)。
双向划分
在所有元素都相等的极端情况下, 双向划分可以将数组划分为两段长度相等的子数组, 虽然发生了n/2次不必要的交换,但因为总体划分是平衡的, 所以总体的时间复杂度还为: O(nlgn)
双向划分的代码如下:
package main
import "fmt"
func quickSort(source []int, l, u int) {
if l < u-1 {
m := partition(source, l, u)
quickSort(source, l, m-1)
quickSort(source, m, u)
}
}
func partition(source []int, l, u int) int { //双向划分
var (
pivot = source[l]
left = l
right = u
)
for {
left++
for left<u && source[left]<pivot {
left++
}
right--
for right>=l && source[right]>pivot {
right--
}
if left>=right {
break
}
source[left], source[right] = source[right], source[left]
}
source[l], source[right] = source[right], source[l]
return right+1
}
func main() {
s := []int{10, 6, 7, 4, 2, 5, 10}
quickSort(s, 0, len(s))
fmt.Println(s)
}
三路划分
显然, 我们应该避免对重复元素进行不必要的交换。 我们可以利用“三路划分”思路来改进算法,所有严格小于pivot的元素放在左侧子序列片段, 严格大于pivot的元素放入右侧, 而中间部分包含等于pivot的元素。
具体算法实现如下:
func quickSort2(source []int, l, u int) {
var (
i, j, p, q, pivot int
)
if l < u-1 {
i, p = l, l
j, q = u, u
pivot = source[l]
for {
i++
for i<u && source[i]<pivot {
i++
}
j--
for j>=l && source[j]>pivot {
j--
}
if i>=j {
break
}
source[i], source[j] = source[j], source[i]
if source[i] == pivot {
p++
source[p], source[i] = source[i], source[p]
}
if source[j] == pivot {
q--
source[q], source[j] = source[j], source[q]
}
}
if i==j && source[i] == pivot { //特殊情况
j--
i++
}
for k:=l; k<=p; k++ {
source[k], source[j] = source[j], source[k]
j--
}
for k:=u-1; k>=q; k-- {
source[k], source[i] = source[i], source[k]
i++
}
quickSort2(source, l, j+1)
quickSort2(source, i, u)
}
}
上面的代码在处理的时候要考虑很多边界条件, 下面是精简版本的代码,但交换操作增加了:
func quickSort3(source []int, l, u int) {
var (
i, j, k, pivot int
)
if l < u-1 {
i = l
j = u
pivot = source[l]
for k=l+1; k<j; k++ {
for pivot<source[k] {
j--
source[j], source[k] = source[k], source[j]
}
if source[k] < pivot {
source[k], source[i] = source[i], source[k]
i++
}
}
quickSort3(source, l, i)
quickSort3(source, k, u)
}
}