闲来无事,翻了翻《算法图解》,觉得收获颇多,所以会陆续整理成笔记,纪录学习过程。嗯,第一篇先来看看二分查找和大O表示法吧。

一、二分查找

二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回 null

一般而言,对于包含 n 个元素的列表,用二分查找最多需要 log2 n 步,而简单查找最多需要 n 步。

很多童鞋可能忘了倒数如何计算,这里我们先复习一下:对数运算是幂运算的逆运算。看看下面的公式,是不是有点回忆起来了。
log

我们通过 JS 来实现一下思路:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
/**
* @msg: 二分查找
* @param {Array} 数组
* @param {String} 数值
* @return: index
*/
const binarySearch = (arr, val) => {
let start = 0;
let end = arr.length - 1;
let guess;
while (start <= end) {
let mid = Math.ceil((start + end) / 2);
guess = arr[mid];
if (guess === val) return mid;
if (guess > val) {
end = mid - 1;
} else {
start = mid + 1;
}
}
return -1;
}
binarySearch([1, 3, 5, 7, 9], 3);

一般而言,应选择效率最高的算法,以最大限度地减少运行时间或占用空间。

按照上面的思路,我们使用二分查找实现了这个函数。嗯,看起来不错,我们来看看他的运行时间。

二、运行时间

先来看一个概念:
线性时间(linear time):最多需要猜测的次数与列表长度相同,这被称为线性时间。
我们举个例子来说:简单查找逐个地检查数字,如果列表包含 100 个数字,最多需要猜 100 次。如果列表包含 40 亿个数字,最多需要猜 40 亿次。

二分查找则不同:如果列表包含 100 个元素,最多要猜 7 次;如果列表包含 40 亿个数字,最多需猜 32 次。
binary

可以看出来,对比线性查找来说,二分查找效率出奇的高。

既然提到运行时间,那么我们一般如何来计量呢?

三、大O表示法

大O表示法:是一种特殊的表示法,指出了算法的速度有多快。。

大O

通过上图,我们不难看出来:
随着元素数量的增加,二分查找需要的额外时间并不多,而简单查找需要的额外时间却很多。因此,随着列表的增长,二分查找的速度比简单查找快得多。

有鉴于此,仅知道算法需要多长时间才能运行完毕还不够,还需知道运行时间如何随列表增长而增加。这正是大O表示法的用武之地。使用大O表示法,这个运行时间为 O (n )。单位秒呢?没有——大O表示法指的并非以秒为单位的速度。

大O表示法让你能够比较操作数,它指出了算法运行时间的增速。

需要注意:大O表示法计算的是操作数。

这里有个问题:
如果要查找的是 Adit ——电话簿中的第一个人,一次就能找到,无需查看每个条目。考虑到一次就找到了 Adit,请问这种算法的运行时间是 O(n) 还是 O(1) 呢?

大O表示法说的是最糟的情形。

因此,你可以说,在最糟情况下,必须查看电话簿中的每个条目,对应的运行时间为 O(n)。这是一个保证——你知道简单查找的运行时间不可能超过 O(n)

四、5种常见大O运行时间

  • 对数时间:O (log n ),二分查找
  • 线性时间:O (n ) ,简单查找
  • O (n * log n ),快速排序——一种速度较快的排序算法
  • O (n 2 ),选择排序——一种速度较慢的排序算法
  • O (n !),旅行商问题的解决方案——一种非常慢的算法

我们来举个例子,绘制一个包含 16 格的网格,且有 5 种不同的算法可供选择,下面按从快到慢的顺序列出了使用这些算法绘制网格所需的时间:
大O

这就有意思了,通过上面的图示,我们得到几点启示

1.算法的速度指的并非时间,而是操作数的增速。
2.谈论算法的速度时,我们说的是随着输入的增加,其运行时间将以什么样的速度增加。
3.算法的运行时间用大O表示法表示。
4.O (log n )O (n ) 快,当需要搜索的元素越多时,前者比后者快得越多。

五、旅行商问题

上面提到了一种运行时间为 O (n !) 的算法,提到了旅行商问题,这里我们来扩展一下。

这着实困扰着很多人,一位旅行商要去往 5 个城市,如何确保旅程最短,5 个城市有 120 种不同的排列方式。涉及 n 个城市时,需要执行 n!n 的阶乘)次操作才能计算出结果。因此运行时间为 O(n!),即阶乘时间。

5 个城市,有 5 种选择,去到一个城市之后,还有 4 种选择,以此类推:5*4*3*2*1 = 5! = 120

旅行商问题(TravelingSalesmanProblemTSP )是一个经典的组合优化问题。经典的 TSP 可以描述为:一个商品推销员要去若干个城市推销商品,该推销员从一个城市出发,需要经过所有城市后,回到出发地。应如何选择行进路线,以使总的行程最短。

从图论的角度来看,该问题实质是在一个带权完全无向图中,找一个权值最小的 Hamilton 回路。

由于该问题的可行解是所有顶点的全排列,随着顶点数的增加,会产生组合爆炸,它是一个 NP 完全问题。

由于其在交通运输、电路板线路设计以及物流配送等领域内有着广泛的应用,国内外学者对其进行了大量的研究。早期的研究者使用精确算法求解该问题,常用的方法包括:分枝定界法、线性规划法、动态规划法等。

但是,随着问题规模的增大,精确算法将变得无能为力,因此,在后来的研究中,国内外学者重点使用近似算法或启发式算法,主要有遗传算法、模拟退火法、蚁群算法、禁忌搜索算法、贪婪算法和神经网络等。

突然发现,算法的世界真的很大,而很多实际问题都是通过算法解决的。

所以,花些时间了解一下经典算法,也算是提高自己的核心竞争力。

六、文末彩蛋:原来小蜜蜂一直在解决旅行商问题!

进行研究的奈杰尔·雷恩博士说,蜜蜂每天都要在蜂巢和花朵间飞来飞去,为了采蜜而在不同花朵间飞行是一件很耗精力的事情,因此实际上蜜蜂每天都在解决「旅行商问题」。尽管蜜蜂的大脑只有草籽那么大,也没有电脑的帮助,但它已经进化出了一套很好的解决方案,如果能理解蜜蜂怎样做到这一点,对人类的生产、生活将有很大帮助。