关于二分:终极找-bug-大法-二分

52次阅读

共计 2084 个字符,预计需要花费 6 分钟才能阅读完成。

大家好,我是 lucifer。明天给大家分享我的日常工作中罕用的 debug 杀器!

二分代码

当我发现一个难以了解和发现的 bug 的时候,我的 终极方法 就是二分代码。

比方先删去文件 a 的一半代码(大概),而后测试问题是否还在。

  • 如果问题不在了,那么咱们就找到了出问题的代码。
  • 如果问题还在,那么咱们持续应用同样的方法,持续删去文件 a 的一半代码(大概),而后测试问题是否还在。
  • 反复上述步骤,直到找到出问题的代码

这个办法在我一时没有思路或者帮忙他人定位问题的时候十分有用。因为这种做法工夫复杂度大抵是 logn,因而只须要短短几次咱们就能够大抵定位到问题代码。相似地,咱们也能够在多个文件中同时进行二分。

二分提交

更多的时候,咱们是在两次公布之间发现了一个 bug。而这两个公布之间是有若干 commit 的,并且 commit 还不少(几十个甚至上百个)。

咱们也能够应用相似的办法。

  • 先切换到两次公布之间的两头提交 x(即便得提交 x 绝对于两次公布之间的间隔差最小)。

实际上这个最小间隔差要么是 0,要么是 1

  • 验证问题是否存在。如果不存在,咱们不能确定就是这个提交的问题,无妨先标记以后提交 c 为 good。如果存在,无妨标记以后提交 c 为 bad。

  • 通过下面的标记,咱们就能够找到最早出现 bad 的那次提交,并且最要害的是复杂度为 logn,其中 n 为咱们须要验证的提交的总次数。显然,这个工作量比一一查看 commit 要快很多。

不了解其中原理?稍后咱们会讲。

Git 中的二分查找

git 的开发者也想到了这一点,因而提供了 bisect 命令来帮忙咱们做下面这个事件。

应用 bisect 进行问题查找次要依赖于上面的三个命令:

  1. git bisect start

启动一个查找,start 前面能够加上 good 和 bad 的提交点:

git bisect start [rev bad] [rev good]

如果不加 good 和 bad 的提交点,那么 git 将会等到咱们应用 good 和 bad 命令指定对应的提交点后开始进行查找

  1. git bisect good

用来标记一个提交点是正确的,前面能够加上 rev 来指定某个特定的提交点,如果不加,则默认标记以后的提交点。

  1. git bisect bad

用来标记一个提交点是蕴含问题的,如果 bad 后能够加上 rev 来指定某个特定的提交点,如果不加,则默认标记以后的提交点。

背地原理

咱们来补后面的坑。为什么通过这样的标记,咱们就能够找到第一个有问题(标记 bad)的提交?并且工夫复杂度为 $O(logn)$。

正好力扣有一道原理,咱们间接用它来讲吧。

题目地址(278. 第一个谬误的版本)

https://leetcode-cn.com/probl…

题目形容

你是产品经理,目前正在率领一个团队开发新的产品。可怜的是,你的产品的最新版本没有通过品质检测。因为每个版本都是基于之前的版本开发的,所以谬误的版本之后的所有版本都是错的。假如你有 n 个版本 [1, 2, ..., n],你想找出导致之后所有版本出错的第一个谬误的版本。你能够通过调用 bool isBadVersion(version) 接口来判断版本号 version 是否在单元测试中出错。实现一个函数来查找第一个谬误的版本。你应该尽量减少对调用 API 的次数。示例 1:输出:n = 5, bad = 4
输入:4
解释:调用 isBadVersion(3) -> false
调用 isBadVersion(5) -> true
调用 isBadVersion(4) -> true
所以,4 是第一个谬误的版本。示例 2:输出:n = 1, bad = 1
输入:1


 

提醒:1 <= bad <= n <= 231 - 1

思路

能够看出,这个过程和咱们下面的形容是一样的。并且咱们的指标都是找到第一个出错的提交。

须要明确的是:

  • 如果一个版本 x 是 good 的,那么 [1, x] 之间的所有提交必定都是 good 的,因而待检测版本变为 [x+1,n]
  • 如果一个版本 x 是 bad 的,那么 [x, n] 之间所有的提交必定都是 bad 的。因为咱们要找到的是第一个有问题的版本,因而待检测版本变为 [1,x-1]

因而无论咱们检测的版本是 good 还是 bad,咱们都能够将待检测的版本数量变为一半,也就是说咱们能够在 $logn$ 次内找到第一个有问题的版本。

如果你看过我的二分专题,应该晓得这就是我总结的 最左二分

  • 二分专题(上)
  • 二分专题(下)

代码

  • 语言反对:Python3

Python3 Code:


class Solution:
    def firstBadVersion(self, n):
        l, r = 1, n
        while l <= r:
            mid = (l + r) // 2
            if isBadVersion(mid):
                # 膨胀
                r = mid - 1
            else:
                l = mid + 1
        return l

复杂度剖析

  • 工夫复杂度:$O(logn)$
  • 空间复杂度:$O(1)$

总结

二分大法在日常工作中利用还是蛮多的,二分找 bug 是其中一个很实用的技巧。最简略的二分找 bug 能够通过删除文件内容的形式进行。而如果文件很多,就很不不便了,这个时候咱们能够应用二分提交来实现。

其中的原理其实也很简略,就是一个奢侈的最左二分。如果大家对此不相熟,强烈建议看下文章中提到的二分专题,两万字总结相对让你有所播种。

正文完
 0