快速排序的原理

对于一个数组,从中随机选择一个数字(一般选取第一个),然后把整个数组中小于它的元素放在左侧,大于它的元素放在右侧,然后递归执行。

快速排序-js实现方法1

按照上面的原理,快速排序也没有那么难嘛,我每次新建2个数组,left,和right,然后遍历原数组,从而将小于它的push进left,大于它的push进right,然后再进行递归即可。代码如下:

function quick(arr) {
  if (arr.length <= 1) {
    return arr;
  }
  var left = [];
  var right = [];
  var base = arr[0];
  for (var i=1; i<arr.length; i++) {
   // 判决条件
    if (arr[i] > base) {
      right.push(arr[i]);
    } else {
      left.push(arr[i])
    }
  }
  return quick(left).concat(base,quick(right));
}
// console.log(quick([3,2,0,1]));

照着上面的写法实现的排序,是有可能发生相同元素的改变的,比如[1,2,1,0],第一次遍历之后,left = [1,0],right = [2],base = 1.从而新组成的数组就是1,0,1,2.原本处于第一个位置的1跑到了第三个1的右侧,顺序发生了改变,从而是不稳定的。事实上,如果我将上述代码的判决条件换成>=,这样,第一次排序之后,left = [0] base = 1,right = [2,1],从而就变成稳定的了。

所以,快速排序到底是稳定还是不稳定的?我也不是很确定,看了教课书之后,我认为上述的算法严格来讲算是快速排序的一个变种,在快速排序的过程中新建了一些辅助数组,对空间的占用率更高。下面介绍实现手段2,这个是严格按照快排的定义来的。

快速排序-js实现方法2

快速排序的实现,其实不用新建一些辅助数组,只需要在原数组中进行操作就可以实现,当然,js中可以先复制一份出来,以免改变原数组。关于真正的快排的实现,在这里我就不赘述了,相关的文章解释的很清楚,核心的思想就是在原数组上进行交换,在不新建数组的情况下实现左小右大的排序。代码如下:

function quick_sort2(arr) {
  var _arr = arr.slice();//复制一份,以免影响之前的arr
  return quick_sort(_arr,0,_arr.length-1);//进行排序
}
function quick_sort(arr,i,j) {
  //如果数组长度小于1,不用排序
  if ((j-i) <= 1) {
    return arr;
  }
  var left = i;
  var right = j;
  var base = left;
  var center = arr[left];
  while (left < right) {
    //从右向左扫描是否存在比基数小的数字
    while (left < right && arr[right] >= center){
      right--;
    }
    if (left < right) {
      //将小于基数的数字放置到左侧
      arr[left] = arr[right];
      left++;
    }
    //从左向右扫描是否存在比基数大的数字
    while(left < right && arr[left] < center) {
      left++;
    }
    if(left < right) {
      //将大于基数的数字放置到右侧
      arr[right] = arr[left];
      right--;
    }
  }
  //更新基数
  base = left;
  arr[base] = center;
  quick_sort(arr,i,base-1);//递归对左侧进行排序
  quick_sort(arr,(base+1),j);//递归对右侧进行排序
  return arr;
}
小结

相比之下,第一种算法更加清晰易懂,但是其实第一种算法新建了很多辅助数组,消耗的内存比较多,而第二种算法,没有新建数组(除了最开始的复制一份),没有新建新的数组,消耗的内存少,但是在操作的过程中,因为左右的交替扫描,虽然基数和相同元素的位置不会发生改变(主要保证>=即可),但是别的非基数的相同元素很有可能发生位置颠倒的情况,所以说这种方式的快速排序是不稳定的。

稳定性的好处

关于这一点,如果数组的元素是纯数字,那么顺序真心没有什么意义,但是如果是一个对象,假设是学生,如果希望先按照学号排个序,然后再按照成绩排个序,如果第二次的排序是稳定排序算法,那么对于相同成绩的学生,其学号必定是按照之前的次序,而如果采用非稳定的排序算法,相同成绩的学生的学号有可能发生改变,这个时候就需要对相同成绩的学生进行重新按照学号排序。也就是说: 排序算法如果是稳定的,那么从一个键(学号)上排序,然后再从另一个键上(成绩)排序,第一个键排序的结果可以为第二个键排序所用。