关于操作系统:操作系统虚拟化进程调度

58次阅读

共计 4142 个字符,预计需要花费 11 分钟才能阅读完成。

介绍

工作负载假如

探讨可能的策略范畴之前,咱们先做一些简化假如。这些假如与零碎中运行的过程无关,有时候统称为工作负载(workload)。在这里咱们对工作负载所做的假如是不切实际的,但未来会放宽这些假如。当初,咱们对操作系统中运行的过程(有时也叫工作工作)做出如下的假如:

  1. 每一个工作运行雷同的工夫。
  2. 所有的工作同时达到。
  3. 一旦开始,每个工作放弃运行直到实现。
  4. 所有的工作只是用 CPU(即它们不执行 IO 操作)。
  5. 每个工作的运行工夫是已知的。

调度指标

除了做出工作负载假如之外,还须要一个货色能让咱们比拟不同的调度策略:调度指标。指标是咱们用来掂量某些货色的货色,在过程调度中,有一些不同的指标是有意义的。

当初,让咱们简化一下,只用一个指标:周转工夫(turnaround time)。工作的周转工夫定义为工作实现工夫减去工作达到零碎的工夫。

周转工夫是一个性能(performance)指标,另一个乏味的指标是偏心(fairness),性能和偏心在调度零碎中往往是矛盾的。

先进先出(FIFO)

咱们能够实现的最根本的算法,被称为先进先出(First In First Out 或 FIFO)调度,有时候也称为先到先服务(First Come First Served 或 FCFS)。

FIFO 有一些踊跃的个性:它很简略,而且易于实现,然而在某些状况下的性能很差。

假如咱们有 3 个工作(A、B 和 C),A 运行 100s,而 B 和 C 运行 10s。而且都简直同时达到,A 比 B 早一点点,而后 B 比 C 早达到一点点。此时零碎的均匀周转工夫是比拟高的:110s((100 + 110 + 120)/ 3 = 110)。

这个问题通常被称为护航效应(convoy effect),一些耗时较少的潜在资源消费者被排在重量级的资源消费者之后。

最短工作优先(SJF)

事实证明,一个非常简单的办法解决了这个问题。这个新的调度准则被称为最短工作优先(ShortestJob First,SJF):先运行最短的工作,而后是次短的工作,如此上来。

事实上,思考到所有工作同时达到的假如,咱们能够证实 SJF 的确是一个最优(optimal)调度算法。然而咱们的假如依然是不切实际的,让咱们放宽另一个假如。咱们能够针对假如 2,当初假如工作能够随时达到,而不是同时达到,这会导致什么问题?

举个例子,假如 A 在 t = 0 时达到,且须要运行 100s。而 B 和 C 在 t = 10 达到,且各须要运行 10s。即便 B 和 C 在 A 之后不久达到,它们依然被迫等到 A 实现,从而遭逢同样的护航问题。

最短实现工夫优先(STCF)

为了解决这个问题,须要放宽假如条件(工作必须放弃运行直到实现)。咱们还须要调度程序自身的一些机制。鉴于咱们先前对于时钟中断和上下文切换的探讨,当 B 和 C 达到时,调度程序当然能够做其余事件:它能够抢占(preempt)工作 A,并决定运行另一个工作,或者稍后持续工作 A。依据咱们的定义,SJF 是一种非抢占式(non-preemptive)调度程序,因而存在上述问题。

有一个调度程序齐全就是这样做的:向 SJF 增加抢占,称为最短实现工夫优先(ShortestTime-to-Completion First,STCF)或抢占式最短作业优先(Preemptive Shortest Job First,PSJF)调度程序。每当新工作进入零碎时,它就会确定残余工作和新工作中,谁的剩余时间起码,而后调度该工作。因而,在咱们的例子中,STCF 将抢占 A 并运行 B 和 C 以实现。只有在它们实现后,能力调度 A 的剩余时间。和以前一样,思考到咱们的新假如,STCF 可证实是最优的。

新度量指标:响应工夫

如果咱们晓得工作长度,而且工作只应用 CPU,而咱们惟一的掂量是周转工夫,STCF 将是一个很好的策略。然而,引入分时系统扭转了这所有。当初,用户将会坐在终端后面,同时也要求零碎的交互性好。因而,一个新的度量规范诞生了:响应工夫(response time)。响应工夫定义为从工作达到零碎到首次运行的工夫。

STCF 和相干办法在响应工夫上并不是很好。例如,如果 3 个工作同时达到,第三个工作必须期待前两个工作全副运行后能力运行。这种办法尽管有很好的周转工夫,但对于响应工夫和交互性是相当蹩脚的。

轮转

为了解决这个问题,咱们将介绍一种新的调度算法,通常被称为轮转(Round-Robin,RR)调度。根本思维很简略:RR 在一个工夫片(time slice,有时称为调度量子,schedulingquantum)内运行一个工作,而后切换到运行队列中的下一个工作,而不是运行一个工作直到完结。它重复执行,直到所有工作实现。

工夫片长度对于 RR 是至关重要的。越短,RR 在响应工夫上体现越好。然而,工夫片太短是有问题的:忽然上下文切换的老本将影响整体性能。上下文切换的老本不仅仅来自保留和复原大量寄存器的操作系统操作,程序运行时,它们在 CPU 高速缓存、TLB、分支预测器和其余片上硬件中建设了大量的状态。切换到另一个工作会导致此状态被刷新,且与以后运行的作业相干的新状态被引入,这可能导致显著的性能老本。

如果响应工夫是咱们的惟一指标,那么带有正当工夫片的 RR,就会是十分好的调度程序。如果周转工夫是咱们的指标,那么 RR 却是最蹩脚的策略之一。更一般地说,任何偏心(fair)的政策(如 RR),即在小规模的工夫内将 CPU 平均调配到流动过程之间,在周转工夫这类指标上体现不佳。

其余因素

首先,咱们得放宽假如 4:因为简直所有的程序都要执行 I /O。调度程序显然要在工作发动 I / O 申请时做出决定,应该在 CPU 上安顿另一项工作,调度程序还必须在 I / O 实现时做出决定。

有了应答 I / O 的根本办法,咱们来看最初的假如:调度程序晓得每个工作的长度。如前所述,这可能是能够做出的最蹩脚的假如。事实上,在一个通用的操作系统中,零碎通常对每个作业的长度知之甚少。

实现:多级反馈队列

咱们将介绍一种驰名的调度办法——多级反馈队列(Multi-level Feedback Queue,MLFQ)。该调度程序通过多年的一系列优化,呈现在许多古代操作系统中。多级反馈队列须要解决两方面的问题。首先,它要优化周转工夫。其次,MLFQ 心愿给交互用户(如用户坐在屏幕前,等着过程完结)很好的交互体验,因而须要升高响应工夫。

根本规定

MLFQ 中有许多独立的队列(queue),每个队列有不同的优先级(priority level)。任何时刻,一个工作只能存在于一个队列中。MLFQ 总是优先执行较高优先级的工作(即在较高级队列中的工作)。

当然,每个队列中可能会有多个工作,因而具备同样的优先级。在这种状况下,咱们就对这些工作采纳轮转调度。

至此,咱们失去了 MLFQ 的两条根本规定:

  • 规定 1:如果 A 的优先级 > B 的优先级,运行 A(不运行 B)。
  • 规定 2:如果 A 的优先级 = B 的优先级,轮转运行 A 和 B。

尝试 1:如何扭转优先级

咱们必须决定,在一个工作的生命周期中,MLFQ 如何扭转其优先级(在哪个队列中)。要做到这一点,咱们必须记得工作负载:既有运行工夫很短、频繁放弃 CPU 的交互型工作,也有须要很多 CPU 工夫、响应工夫却不重要的长时间计算密集型工作。上面是咱们第一次尝试优先级调整算法。

  • 规定 3:工作进入零碎时,放在最高优先级(最上层队列)。
  • 规定 4a:工作用残缺个工夫片后,升高其优先级(移入下一个队列)。
  • 规定 4b:如果工作在其工夫片以内被动开释 CPU,则优先级不变。

然而,这种算法有一些十分重大的毛病。

首先,会有饥饿(starvation)问题。如果零碎有“太多”交互型工作,就会一直占用 CPU,导致长工作永远无奈失去 CPU。

其次,聪慧的用户会重写程序,愚弄调度程序(game the scheduler)。愚弄调度程序指的是用一些卑劣的伎俩坑骗调度程序,让它给你远超偏心的资源。例如过程在工夫片用完之前,调用一个 I / O 操作(比方拜访一个无关的文件),从而被动开释 CPU。如此便能够放弃在高优先级,占用更多的 CPU 工夫。

最初,一个程序可能在不同工夫体现不同。一个计算密集的过程可能在某段时间体现为一个交互型的过程。用咱们目前的办法,它不会享受零碎中其余交互型工作的待遇。

尝试 2:晋升优先级

一个简略的思路是周期性地晋升(boost)所有工作的优先级。能够有很多办法做到,咱们就用最简略的:将所有工作扔到最高优先级队列。于是有了如下的新规定:

  • 规定 5:通过一段时间 S,就将零碎中所有工作重新加入最高优先级队列。

新规定解决了两个问题。首先,过程不会饿死——在最高优先级队列中,它会以轮转的形式,与其余高优先级工作分享 CPU,从而最终取得执行。其次,如果一个 CPU 密集型工作变成了交互型,当它优先级晋升时,调度程序会正确对待它。

不过,增加时间段 S 导致了显著的问题:S 的值应该如何设置?如果 S 设置得太高,长工作会饥饿;如果设置得太低,交互型工作又得不到适合的 CPU 工夫比例。

尝试 3:更好的计时形式

当初还有一个问题要解决:如何阻止调度程序被愚弄?能够看出,这里的首恶是规定 4a 和 4b,导致工作在工夫片以内开释 CPU,就保留它的优先级。那么应该怎么做?

这里的解决方案,是为 MLFQ 的每层队列提供更欠缺的 CPU 计时形式(accounting)。调度程序应该记录一个过程在某一层中耗费的总工夫,而不是在调度时从新计时。只有过程用完了本人的配额,就将它降到低一优先级的队列中去。

因而,咱们重写规定 4a 和 4b:

  • 规定 4:一旦工作用完了其在某一层中的工夫配额(无论两头被动放弃了多少次 CPU),就升高其优先级(移入低一级队列)。

MLFQ 调优及其他问题

对于 MLFQ 调度算法还有一些问题。其中一个大问题是如何配置一个调度程序,例如,配置多少队列?每一层队列的工夫片配置多大?为了防止饥饿问题以及过程行为扭转,应该多久晋升一次过程的优先级?这些问题都没有不言而喻的答案,因而只有利用对工作负载的教训,以及后续对调度程序的调优,才会导致令人满意的均衡。

例如,大多数的 MLFQ 变体都反对不同队列可变的工夫片长度。高优先级队列通常只有较短的工夫片(比方 10ms 或者更少),因此这一层的交互工作能够更快地切换。相同,低优先级队列中更多的是 CPU 密集型工作,配置更长的工夫片会获得更好的成果。

正文完
 0