随着网络规模的扩充和构造越来越简单,传统的网络管理模式遇到了重大挑战。本文提出常识立体作为下一代网络管理的外围组件,依赖人工智能和认知技术满足网络管理的不确定性和复杂性需要。原文: A Knowledge Plane for the Internet
摘要
本文提出了新的网络钻研指标,即建设一种齐全不同的、能够在高级指令下自行构建、在需要变动是被动重构、主动发现并修复问题的网络,并且当问题无奈修复时,能够给出解释。
想要实现这一指标,仅仅对明天所知的技术和算法进行渐进式改良是远远不够的。相同,咱们提出了新的构造,即常识立体 (Knowledge Plane),作为网络中的通用零碎,负责构建并保护网络的高级模型,以便向其余网络元素提供服务和倡议。常识立体的新鲜之处在于其依赖于人工智能和认知零碎,咱们认为,认知技术(而不是传统的算法办法) 最适宜用于满足咱们指标的不确定性和复杂性。
1. 简介
互联网现在获得了巨大成功,但咱们不能因为互联网的胜利而对其局限性熟视无睹。互联网强调通用性和异构性,简略、通明的网络与丰盛的终端零碎通过相似 ” 沙漏 ” 这样的模式组合在一起,对于深刻网络体系的去中心化、多头管理构造的假如是其要害劣势,但当呈现故障时,却须要大量手动配置、诊断和设计带来的昂扬治理开销,使用户感到丧气。
用户和运营商的挫败感都源于互联网的根本设计准则: 放弃外围网络简略、通明,在边缘解决智能业务逻辑 [1,2]。网络只负责传输数据,但不晓得这些数据是什么,也不晓得其目标是什么。如果产生了某些事件使数据无奈通过,边缘可能会意识到有问题,但外围并不知道本来应该产生什么,因而无奈判断哪里出了问题。边缘了解应用程序及其预期行为,外围只解决数据包。相似的,网络运维人员以十分低级的形式与外围交互,例如配置每个路由器的路由和策略。运维人员没有方法表白(网络也没有方法建模) 高级指标,也没有方法将低级决策与高级指标相关联。
当咱们设计新网络时,不能失去使互联网胜利的特色,即对新利用的开放性、对协定的适应性,以及实质上的可塑性。然而,咱们必须设计出一种技术,将这些长处与新的指标联合起来: 网络须要有能力晓得要做什么,这样就能越来越多的本人关照本人,而不必依赖他人的关照。如果网络对其设计指标和可承受配置的束缚有一个高级视图,那就能够本人做出许多低级决策。网络能够与网络设计人员沟通,以理解多大程度上曾经满足了指标,而不必显示大量路由配置表,同时也能够通过重新配置本人来解决高层需要的变动。
咱们认为,传统算法办法不太可能反对所需的简单行为。咱们采取的办法必须提供从低级口头中形象和隔离高级指标的能力,对不欠缺和抵触的信息进行整合和采取行动,并从过来的口头中学习以进步将来的体现。这些个性正是在互联网环境中无效运作所须要的,互联网环境具备多样化和相互竞争的指标,管制扩散,环境简单且动态变化。
本文提出了一种基于人工智能和认知零碎工具的网络设计办法,具体来说是提出了一种散布在网络中的认知零碎架构,咱们称之为 常识立体(knowledge plane)。
本文其余部分组织如下。第 2 节介绍了常识立体的概念,并将这一概念与其余选项进行比照,认为咱们应该采纳认知办法。第 3 节将探讨这个架构可能为咱们做什么,例如如何使网络更好。第 4 节探讨了常识立体架构的一些重要设计束缚和思考事项。第 5 节概述了后退路线上的次要挑战。
2. 常识立体
以上探讨暗示了一种解决方案,在这种解决方案中,网络对其目标有一个高级视图,即网络设计者的指标、运行在下面的应用程序的指标以及用户的指标。在特定于应用程序的网络中,一种办法可能是在网络的外围设计中利用和嵌入特定畛域常识,就像在电话网中所做的那样。但这违反了互联网的根本指标: 承载宽泛且一直变动的应用程序的能力。与其通过向互联网的简略通明的数据传输立体增加 ” 一点点 ” 应用程序常识来取悦他人,还不如设计一个独自的构件来创立、协调和保护高级视图的各个方面,而后依据须要向网络的其余元素提供服务和倡议。这就是常识立体(KP)。
了解实现这一指标的最佳准确门路是重要钻研问题,本文既不能也没有提出常识立体的残缺技术形容。然而,作为一个开始,咱们将勾画出常识立体的某些潜在外围属性,并思考与当初的实际有何不同。这些属性包含:
- 边缘相干(Edge involvement): 端到端准则表明,无关网络性能的许多有价值的信息不是来自网络,而是来自应用它的设施和应用程序。这是互联网通用数据立体的必然和可取的后果。然而,这意味着大多数常识立体中的 ” 常识 ” 能够在网络的 ” 传统 ” 边缘或者说内部产生、治理和生产。因而常识立体的范畴比传统的网络管理更广。
- 全局视角(Global perspective): 大多数管理系统都是区域性的,运维人员治理他所负责的局部。但真正有用的问题辨认可能取决于相干的网络不同局部的察看后果。要想齐全了解事件,不仅须要联合边缘数据和来自网络 ” 外部 ” 的数据,还须要网络不同局部的数据。现实状况下,常识立体可能依据须要将其视角扩大到整个全局网络。
- 组合架构(Compositional structure): 如果 KP 的影响范畴是全局性的,那么设计时必须思考到咱们能够粗略称之 ” 组合 ” 的架构。一个最根本的例子是两个未连贯网络的 KP 应该可能在网络连接后合并它们的观点和流动。
组合问题的必然结果是须要在不欠缺和互相抵触的状况下操作,比如说某些区域心愿保持数据的私密性。一些网络运营商和服务提供商之间的互相不信赖(事实上,任何抢夺经济劣势的各方之间的互相不信赖),间接导致了明天对高度纯熟的人工判断的需要,用以推断和模仿网络行为。KP 面临着相似问题,即不能假如共享指标和共享信息的同质网络。
- 对立办法(Unified approach): 人们可能会猜想,咱们旨在解决的各种问题最容易利用不同的机制来解决,通过自下而上的组合,兴许在顶部涣散的分割在一起。相比之下,咱们构想的 KP 是一个繁多、对立的零碎,领有独特的规范和 ” 常识 ” 框架。这种对立的办法是必要的,因为事实世界的常识并没有严格依照工作划分。咱们倡议常识立体的架构应该相似,基于常识,而不是工作。咱们认为,尽管单点解决方案可能更容易制订,但从久远来看,综合计划将更有功效。
- 认知框架(Cognitive framework): 常识立体须要在部分或抵触信息存在的状况下做出判断,要意识到并调解政策和指标的抵触,在比人工更优的工夫框架内应对问题和攻打,在人工或剖析解决方案无奈解决的简单高维度环境中执行优化,自动化那些当初必须由多数高度纯熟的网络技术人员来实现的工作。因而,咱们冀望认知技术作为常识立体的根底,通过示意、学习和推理,让常识立体 ” 意识到 ” 网络及其在网络中的行为。
接下来咱们进一步探讨三个要害概念: 新架构的必要性,对立常识立体的可取性,以及认知工具的价值。
2.1. 为什么要有新架构?
大多数对于网络架构的探讨都抵赖两类架构划分 (或立体): 数据立体(内容在其上转发) 和管制或治理立体(用于领导、测量和修复数据立体)。通过议论 ” 常识立体 ”, 咱们倡议引入一个全新的架构,而不是将常识放入现有立体中(大略是治理立体)。为什么咱们认为须要新的架构?
如果察看现有的两类立体,咱们会发现两种齐全不同的架构。数据立体 (在简直所有驰名的数据传输体系架构中) 应用某种模式的分层来暗藏复杂性,并反对可扩展性、互操作性和可伸缩性。相比之下,管制和管理系统的设计总是要逾越各个档次,使网络的所有方面都具备可观测性和拜访权,从而对这些方面进行必要的监测和治理。事实上,因为治理立体是无所不知的,往往难以扩大,也难以扭转。
常识立体显然处于不同的地位。它不是数据立体,不会间接挪动数据,此外与治理立体不同,它偏向于突破边界以提供对立的视图,而不是将世界划分为受治理的飞地。它在性能上也不同于治理立体,很难设想 KP 治理统计记录(兴许偶然会读取它们,但不会收集、存储和解决它们)。
2.2. 为什么采纳对立办法?
思考这样一个例子: 用户试图装置一个新利用,但发现它不能工作。一个起因可能是用户的 ISP 阻止了这类流量。为了让 KP 给各方最无效的反馈,它须要拜访 ISP 设置的配置束缚,因而能够确定背地的规定,并通知用户这意味着什么。因而,有必要将网络配置信息和用户看到的问题信息放在一个框架内。
一个相干的例子波及 overlay 网络,如 CDN。很容易设想 KP 的一个组成部分是拓扑和性能信息,CDN 能够应用这些信息使它的交付节点 ” 靠近 ” 用户。这些信息可能有多种起源,如 ” 网络天气 ” 服务、用户报告的体验和 ISP,因而不仅包含流量测量,还包含无关治理流量限度和本地防火墙限度的信息 (可能 ” 用户 ” 无奈接管某些类型的内容)。将这些信息集成并以对立的形式出现,将使相干方(用户、CDN) 都能受害。
在某些状况下,KP 可能可能本人解决问题。如果发现问题的起因是低级决策,而低级决策对运维人员的高级指标不重要,它可能会扭转该决策。然而为了确定更改是否适合,KP 须要理解设置背地的起因。所以对于布局的常识须要和修复问题放在同一个背景下思考。
当网络的一个组成部分对可能的异样进行低级察看时,并不知道理论的相关性是什么。这个察看后果可能会触发修复、重新配置、向网络其余局部的网络运维人员发出通知、平安警报或其余齐全不同的货色。所以对网络条件的察看不能被认为是繁多问题空间的一部分,而是 KP 的一部分。
咱们意识到,特定问题的单点解决方案可能比这里假如的通用解决方案更快达到局部目标。但咱们假如的外围是要达到最终目标: 网络能够配置、解释、修复本人,并且不让用户被神秘的货色所蛊惑,因而基于单点解决方案组合的办法是不会胜利的。
2.3. 为什么是认知零碎?
常识立体的指标意味着须要迎接一系列重大挑战:
- 必须在不残缺、不统一、可能具备误导性或歹意的信息存在时无效发挥作用。系统故障、出于隐衷或竞争起因的信息过滤以及无限的网络资源都是造成这种需要的起因之一。
- 必须在互联网的不同利益相关者之间存在抵触或不统一的更高层次指标时执行适当的行为,这是 [12] 中探讨的角力窘境的体现。
- 必须在保障通用性的同时无效运行,包含反对新技术和设计时没有构想的利用,以及面对高度动静的环境,包含架构和根底网络的复杂性的短期、长期的变动。
咱们假如这些挑战不能用解析解来解决,因为解析解通常须要残缺的信息、准确的问题公式和绝对动态的操作环境。相同,咱们倡议采纳 ” 认知 ” 技术,该技术的要害益处是在简单、不统一、动静和演进的环境中无效执行的后劲,以及评估和改良本人性能的能力。接下来咱们探讨认知常识立体的两个定义特色。
首先,KP 必须最终像一般控制系统那样在网络上 ” 闭合回路 ”。当咱们取得教训和信赖时,常识立体将首先为许多治理工作启动 辨认 - 解释 (recognize-explain) 回路,而后是 辨认 - 解释 - 倡议 (recognize-explain-suggest) 回路,最初是 辨认 - 口头 (recognize-act) 回路。因为常识立体必须比规范控制系统更通用、更灵便,咱们从其余中央寻找额定灵感。受到人类认知实践[18] 启发的架构曾经获得了一些胜利,并暗示了一种办法。在常识立体环境下,认知架构当然会是分布式和去中心化的,并且会在肯定水平上影响分区,以反对网络利益相关者的不同利益。
第二,KP 必须可能学习和推理。学习是有准则的常识积攒,能够通过多种形式进行: 试错、领导、演绎、类比、解决问题和脑力搜寻等等。有些学习办法须要人的参加,有些则不须要。在动态的问题环境中,有足够简略的解析解,因而学习是无关紧要的。然而从 IP 网络的设计和用意来看,各个方面都在一直倒退,并且潜在配置是有限的。在可能状况下,当意识到新的状况或执行和评估新的口头时,常识立体应失去改良,其知识库应以有用的形式增长。学习的第一个和最间接的挑战是通过咱们现有的通明数据立体的含糊面纱来建模应用程序的行为、依赖关系和需要。
推理是将现有常识组合起来,得出新推论和新理念的过程。推理过程能够将陈说性知识 (无论是教训的还是学习的) 转化为对察看后果的解释和对口头的决策。如果咱们心愿将来的网络反对高层次的指标和束缚,将须要可能在这些形象上操作的推理方法。
从久远来看,推理在常识立体的一个乏味而重要的性能将是反对在用户和运维人员之间进行调解,这些用户和运维人员的指标可能互相抵触,或与固定的设计束缚相冲突。这种不可避免的抵触表明,必须开发新的技术来示意和推理束缚和政策。最后,这些示意须要从低级配置和操作中推断进去,但最终目标是在高层次上表白指标和策略,并生成低级配置。
即便在短期内,也能够利用现有研究成果设计和构建常识立体。认知架构 [18] 的教训,最近在多智能体零碎 [22] 的工作,以及新兴的算法博弈论畛域可能可能间接拿过去用。然而,网络环境也提出了许多挑战,这将延长以后的认知零碎状态,并以新的和乏味的形式从新决定钻研方向[19、20]。
3. 常识立体的益处是什么?
在较高的档次上,咱们为 KP 提出了对立的指标: 通过让它理解本人应该是什么,以及应该做什么,来建设新一代的网络。为了实现这一指标,须要反对更多特定的问题域。这里咱们将更具体探讨其中的局部内容。
故障诊断和缓解: 明天,如果互联网的一部分产生故障,终端用户简直不可能晓得产生了什么,也不可能找出应该告诉谁,或者采取什么措施来纠正错误。如果咱们以明天的互联网为终点,设想一下,当某些货色呈现故障时,用户能够运行一条命令来要求解释,这是很有吸引力的。这就是 WHY(problem-x)命令: 为什么 x 坏了?例如,用户可能会问:” 为什么我不能拜访 www.acm.org 了?”
然而,WHY 的提法不够大胆。一个过于大胆的代替计划是,如果 KP 足够智能,网络应该永远不会失败。在这种状况下,就不须要 WHY 了。但这种雄心在基本上是有缺点的。在某些状况下,只有人类才有足够的常识来确定正在产生的事件是否真的是一个谬误。当 Dave 拔掉笔记本电脑的插头并把它放进公文包时,可能会有一些应用程序忽然进行工作,但这不是故障。这就是 Dave 的用意,如果每次断开笔记本电脑的连贯时,某个半智能的 KP 醒过来询问是否想从新连贯,这会是一场噩梦,而不是胜利。因而,有时只有人类能够给 KP 领导。这是 FIX(问题 -x),而不是 WHY(问题 -x)。用户是在表白有什么货色坏了,把它修好。
这是否足以领导 KP 纠正错误?事实上,乏味的例子是,” 问题 ” 是由来自不同人的互相抵触的标准或束缚引起的。有人可能会说 FIX(我刚刚装置的游戏无奈运行),失败的起因是 ISP 屏蔽了该游戏。你可能会说 FIX(蹩脚的带宽),但问题是你曾经超过了本人的应用限额,而 ISP 限度了速率。在这些状况下,KP 可能无奈解决问题。然而,咱们可能想要这么一个 KP,它既能够解决问题,也能够阐明为什么无奈解决问题。因而,FIX(问题 -x)的答案可能是 CANNOT(理由 -y)。如果零碎的确修复了一些货色,它可能想要通知他人产生了这种状况,因为兴许只有人类能够采取进一步口头。
此示例表明,用户和 KP 须要双向沟通和表白。当然,KP 可能会就一个问题与许多实体进行沟通。来自用户的 FIX(游戏中断)的申请可能会触发一条音讯,通知用户游戏被阻止了,但也可能会触发一条音讯,通知 ISP 它有一个不称心的用户。
这个故事的进一步扩大是 KP 能够为用户和管理者提供一个助手、一个代理,察看人们在做什么,并随着工夫的推移学习什么是失常的,什么是不失常的。所以 Dave 笔记本电脑上的 KP 代理可能会晓得 Dave 总是拔掉它,而 Dave 桌面计算机上的代理可能会意识到他素来没有断开过,并冒着打搅 Dave 的危险问他是否无意这样做。这样,故障诊断和缓解问题就有了学习的成分。
一旦在 KP 中实现 FIX(问题 -x)的性能,程序和人们都能够应用。随着用户代理的学习,它应该越来越频繁的收回本人的信号。而其余程序,比方利用程序代码,可能会检测并收回出错的信号。KP 将不得不依据信号的起源决定给予这些信号多大程度的信赖。
FIX 命令将在幕后触发 KP 中的一系列流动,从运行在用户机器上的本地组件开始,而后与 KP 替换信息以找出问题所在。诊断性能能够检测出所有级别的性能,从报文转发到利用性能。目前有几个钻研我的项目能够作为该利用的根底[13,14]。
一旦终端节点执行了所能进行的诊断,下一阶段是工具将其发现内容的断言增加到共享常识立体,并向 KP 询问相干信息。这种对常识立体的奉献容许网络上的所有用户独特构建网络和服务状态的全局视图。这些数据能够与来自互联网上正在进行的测量工作的信息联合起来,这些测量工作试图建设网络状态的整体模型[9,15]。如果失败影响到很多用户,那么这种聚合就很重要。
主动 (重) 配置: 原始互联网的动静路由配置没有思考治理和策略束缚,所以明天的路由越来越多的由动态策略表定义,这意味着路由器等设施越来越须要人工配置和治理。动态表和手动配置会使网络容易出错,难以更改,甚至更难进行全局推理。设想一下,作为 KP 的一部分,互联网一个区域的配置管理器接管对于网络组件如何安顿本人的高级断言,并相应领导理论的具体配置。用例包含管制家庭用户网络的部署,反对疾速部署的自组织网络,或用于小型企业的网络。该项目标胜利实现能够大幅缩小配置和操作网络所需的人力。
KP 配置管理器应该对底层架构有足够的理解,以检测网络是否依据高层束缚正确配置,检测是否有更好的配置代替计划,以及检测零碎是否呈现损坏。推理必须是双向的。也就是说,管理者必须可能在给定高级指标、优先级和束缚的状况下取得低级设置,并且必须可能查看现有低级设置,并通过高级术语形容后果行为。
此外,一个乏味的问题 (一旦咱们有了可工作的根底零碎) 是当零碎遇到不同相干方提出的互相抵触的断言时。网络管理员可能会提出 ROUTING_PREFERENCE(低成本链接),而终端用户的机器可能会提出 FIX(低带宽)。同样,KP 可能可能解决其中的一些问题,并且随着时间推移,可能会晓得什么时候能够平安的本人采取行动,什么时候必须以有意义的形式把问题退回给相干人员。(顺便说一下,这个例子阐明了为什么 KP 必须被视为一个对立零碎,而不是作为故障治理和配置的独立零碎。)
配置工作不是在部署网络时才会产生的事件,而应该是一直产生的事件,关注一直变动的网络条件、应用程序需要和一直变动的束缚,也是一个能够递归运行的工作。寰球网络不是自上而下建设的,而是自下而上,一个区域接一个区域的建设。每个区域将首先应用其本地指定的指标和束缚来配置本人,但当两个区域连接起来时,其中一个可能会对另一个施加进一步的限度。因而,供应商网络可能会对订户网络说: NO_MULTICAST,从而可能导致用户网络更改其外部组织,禁用某些最终用户应用程序,等等。
反对 overlay 网络: 如果 KP 有足够信息来配置网络,这些信息对正在配置本人的应用程序也很有用。例如,咱们越来越多看到互联网上特定于应用程序的 overlay 网络的倒退。每个 overlay 网络应用基于边缘的机制来评估互联网上不同可能门路的性能,并试图建设一组传输门路,这些门路能够将应用程序数据包无效的路由到看起来最适宜利用需要的网络局部。目前,因为没有机制让利用理解网络外围的能力,因而利用网络必须探测互联网。KP 将可能聚合利用和网络衍生的对于网络性能的常识,为应用程序提供比通过探测理解到的更好的对于网络的信息,以及对控制点的拜访和批改,以帮忙更好的满足利用的需要。因而,KP 反对对每个利用的流量进行管制,而不须要在整个网络中构建每个利用的基础设施。
常识加强的入侵检测: 有许多我的项目 (和许多产品) 执行某种类型的剖析来检测网络入侵。一般来说,他们观测网络某处的数据并寻找模式。以后这一代工具会触发误报和误报。据揣测,下一代入侵检测工具要求网络中几个点的观测必须互相关联,以便取得更持重和有用的信号。常识立体的开发为实现数据的收集和关联提供了根底。
4. 常识立体架构
本文曾经概述了常识立体的指标,本节咱们将思考其零碎架构的其余方面。咱们的探讨是揣测性的: 任何胜利的 KP 架构都将受到许多要求和束缚的影响,而这些要求和束缚在明天并不都是不言而喻的。在 KP 的最高档次上,两种宽泛的力量将在很大水平上塑造 KP 的架构: 其分布式的组成架构,以及多尺度的、潜在的全局知识视角。
咱们的最终目标是,网络系统应该在内部输出的束缚和领导下组织起来,以满足其利益相关者的指标。即便在短期内,KP 也必须尊重并基于网络具备的外部架构和动静 (大型网络由相互连接的小型网络组成,参与者来来去去,即便物理构造没有扭转,不同网络的所有者、运营商和用户之间的关系也可能会发生变化) 的事实。
这意味着服务于网络的常识立体不是全局工程实体,而是一个自主创立的构造,递归、动静、间断的从更小的子立体组成和合成本人。这一要求认为 KP:
- 是分布式的,KP 性能对于网络的不同区域在物理上和逻辑上是扩散的。
- 是自下而上的,简略实体 (如网络服务器) 能够依据须要组成更大、更简单的实体(如网络池),并依据须要从零碎中合成本人。这是一个递归过程,能够在不同档次上进行。
- 是束缚驱动的,根本准则是零碎能够 (也可能) 采纳 (或不采纳) 任何没有特地束缚的行为。
- 从简略到简单。一般来说,将一组网络组成一个更大的网络的行为对每个网络的行为提出了更多的要求或束缚。一个简略的例子是,一个独立的 IP 网络能够应用宽泛的地址范畴,然而将它连贯到一个更大的网络会限度在这方面的选项范畴。
咱们对 KP 零碎架构的第一个指标是反对这种分布式、组合的视角,提供必要的使能形象和性能。
与 KP 的分布式组织相比,咱们在后面章节中曾经探讨过,KP 通常能够受害于采取全局视角,从网络中的许多单点综合察看并得出结论,其中要害含意是:
- 数据和常识整合是 KP 的外围性能。KP 必须可能从网络的不同局部收集、过滤、演绎和路由察看、断言并得出结论。
- KP 必须在信息不残缺的状况下胜利运行。因为这个全局视角在物理上是微小的,并且逾越多个治理实体,所以 KP 的认知算法必须筹备好在无限和不确定的输出中操作。
- KP 必须思考信息衡量。有时候,全局视角可能很要害,其余时候,可能并不重要或只是有些有用。KP 必须筹备好对应用不同范畴的数据所波及的衡量进行推理。例如,诊断可能的 web 服务器故障,或者更有可能的是,防止从很远的中央轮询用户体验。在这种状况下,KP 可能须要应用内省的元推理来做出最无效的口头。
咱们对 KP 体系架构的第二个指标是,在对解决问题无利的任意可能范畴内开发、利用和推理信息。
4.1. 性能和架构需要
上述指标,连同常识立体的外围指标,将咱们引向几个顶级的性能和体系架构需要,上面探讨其中的四个。
4.4.1. 外围根底
常识立体的外围是将行为模型和推理过程集成到分布式网络环境中的能力,其第一个组成部分是反对各种信息的创立、存储、流传和发现,可能包含形容以后条件的 察看 (observations),捕获网络经营高层指标、用意和束缚的 断言 (assertions),还有对于常识自身如何具化的 解释(explanations),解释的作用是将察看和断言映射到论断中。
为了理解和扭转环境,常识立体必须拜访和治理认知界所称的 传感器 (sensors) 和 执行器(actuators)。传感器是产生观测的实体,执行器是扭转行为的实体(例如,变更路由表或关上 / 敞开链接)。例如,一个常识利用心愿依据特定策略操作网络,它可能会应用传感器收集网络上的观测数据,应用断言来确定网络的行为是否合乎策略,如果有必要,还能够应用执行器来扭转网络的行为。
常识立体最外围的局部是其对认知计算的反对。这是一个很有挑战性的问题,因为动静和分布式 KP 环境不能很好的匹配经典常识算法和代理架构,而这些算法和架构撑持了以后大部分 AI。大多数 AI 算法都不是为在高度分布式环境下工作而设计的,而构建具备嵌入式认知能力的大型分布式数据管理系统的直接经验很无限 [1]。对于高度动静、局部可观测、随机和容易出错的环境,咱们须要的是高鲁棒性、可跟踪的在线算法。只管迄今为止所解决的问题通常不足常识立体所需的动态性,但多代理零碎(MultiAgent Systems)[22] 畛域在解决这些问题方面获得了一些初步停顿。因而,常识立体架构的这一部分的细化,基础设施对一系列适宜的认知算法的反对,很可能与认知零碎自身的进一步钻研相结合。
[1] 一个晚期的相干尝试,DARPA 资助的自动化网络管理 (ANM, Automated
Network Management) 我的项目,寻求建设一个联合 AI 的全网络 MIB 收集器工具[7]。ANM 的教训是,收集数据绝对容易,但将数据送到正确的中央却很艰难,如果信息流传过于强烈,链接很容易被大量治理流量吞没。
4.1.2. 跨域和多域推理
KP 在哪里运行?其组成和区域构造兴许表明,对于某个地区的推理能够由一个特定的服务器反对,相似互联网 AS。一种可能是 AS 的管理者将运行 KP,执行对 AS 的监控。在更形象的档次上,人们可能会将这种结构化策略形容为 ” 每个区域负责对本身进行推理 ”。
这不是个好主见,起因如下。如果 AS 宕机,可能导致出错时无法访问相干 KP 信息。AS 的管理者可能心愿管制 KP 得出的论断,兴许他们不想看到那些看起来不讨喜、但会被其他人所承受的常识和论断。这些例子表明对于 AS 的推理可能独立于 AS 产生,这一事实应该反映在零碎架构中,即 KP 的不同局部可能独立的对 AS 进行推理,并比拟答案,以检测该局部 KP 是否受损。这表明,网络的某个区域和与其相干的 KP 推理引擎之间不应该存在特定的物理关系。
一种更激进的可能性是,多个实体竞争提供对于给定 AS 的信息。每个实体都收集本人的数据,并发售本人的察看后果。KP 能够从它认为能提供最精确、最及时 (或最具老本效益) 的信息的一个或多个实体中寻求信息。这个 ” 常识市场 (knowledge
marketplace)” 带来了一系列架构上的挑战,从如何推断来自多个供应商的信息(即便三个不同的公司通知你对于 AS 的雷同信息,后果也可能是他们都在转售来自同一个互联网天气服务的数据: 如果你真的想要第二个意见,怎么能力找到第二个天气服务?) 到如何设计 KP 协定,以阻止不同的常识公司奇妙 ” 加强 ”KP 协定或数据,使用户难以同时应用其余常识提供商的服务?
本探讨展现了 KP 信息流潜在的丰富性。音讯须要流到多个地位,以便产生冗余推理,音讯如何流动可能取决于提出申请的人。KP 的不同局部可能会得出不同的论断,协调这些论断与解决不残缺的输出数据一样重要。
4.1.3. 数据和常识路由
咱们认为,KP 将受害于取得其服务网络的全局视角。思考这种观点是如何产生的是很有用的。在一个很小的网络中,实践上有可能收集所有相干信息,并将这些信息发送到网络中的每个节点(更精确的说是在分布式 KP 中)。
这种想法在更大的网络中显然不切实际。首先,海量信息在技术上令人生畏,须要高度可扩大的解决方案。除此之外,竞争和隐衷等因素也开始发挥作用。在任何规模的网络中,都须要限度和优化信息的收集和路由,因而须要更简单的技术。
咱们倡议 KP 架构应该作为常识治理和路由这两个属性的框架,由常识驱动,路由零碎自身整合对于不同常识在不同状况下最有用的信息,并应用可扩大的分布式技术过滤察看后果,获取与潜在客户最相干的察看后果。它可能做出取舍(可能蕴含品质概念),通过或多或少的致力、不同的工夫、不同的带宽等来推理出品质不一的答案,而不仅仅是产生 ” 一个答案 ”。
4.1.4. 对于信赖和鲁棒性的推理
KP 的组成构造和全局视角的联合为实现持重和值得信赖的设计带来了挑战。因为相干网络的组合在任何时候都能够造成无效的 KP,因而体系架构必须反映出这样的事实: KP 的某些局部可能损坏或被毁坏,一些参与者可能扯谎或成心输入有缺点的推理,零碎操作不得不基于可能是部分的、过期的或谬误的输出。
这表明,KP 可能须要建设、保护和推理其组成部分和参与者之间的信赖关系。行为不端的 KP 局部可能被其余局部认为是不可信的,并且这个信息可能会在决定相互信任的局部之间流传。通过这种形式,能够建设一个信赖网络,辨认仿佛值得信赖的 KP 组件,避开不值得信赖的组件。这种自省可能须要开发信赖模型,并应用可伸缩技术 (例如所谓的 ” 小世界 ” 模型[10]) 来搜寻可信网络。
5. 创立常识立体
5.1. 可能的构建模块
大量根底钻研可能与创立 KP 无关。示例包含用于散发数据的风行算法 [5]、用于学习[4] 的贝叶斯网络、启用信赖网络 [6] 的秩聚合、束缚满足算法 [21] 和基于策略的治理技术[23,24]。所有这些技术都曾经在其余网络环境中开发进去了,并且可能与本文相干。
5.2. 挑战
如果要创立胜利的常识立体,必须解决和解决一些挑战性问题。因为常识立体的指标之一是赋予应用程序学习和推理环境的能力,因而许多问题都处于网络和人工智能的边界上[2],本节概述了贯通这些问题的一些要害主题。
[2] 对于常识示意问题的个别概述,读者可能心愿浏览[16]。
如何示意和利用常识? 咱们心愿常识立体反对推理 (找出 John 无法访问 www.example.edu 的起因) 和学习 (上次 www.example.edu 无法访问是因为 DNS 问题,所以让咱们查看 DNS 性能)。以后的推理和学习技术通知咱们,须要建设试图了解的实体的形象模型,而后应用信息来推理,并可能更新这些模型。以后对示意计划的钻研,如 DAML Project[3],可能会让咱们对如何示意能够推理的信息有一些见解。然而,还必须确定如何提取和解决所有有价值的信息,这些信息可能不在 DAML(或咱们抉择的任何模式) 中,而是在 SNMP MIB、系统日志和其余中央。咱们应该如何构建、示意和散布驱动推理的模型呢?
[3] DARPA 代理标记语言 (DARPA Agent Markup Language) 是对可扩大标记语言 (XML) 和资源形容框架的一组扩大,以反对 web 对象的本体(对象之间关系的申明)。参见 www.daml.org。
如何实现可扩展性? 常识立体是构建更牢靠、更强壮的网络的基石。如果施行切当,应该可能继续改善网络,即便网络变得更大,常识立体自身也将变得更大。随着咱们在常识立体上增加更多常识和新的应用程序,它应该会变得更有价值、更有用,这些都是硬指标。而随着数据量的减少,或者零碎中组件数量的减少,咱们常常会发现瓶颈并发现算法无奈伸缩。例如,如果某个网络故障触发大量音讯进入 KP,那么如何聚合和管制这些音讯,从而使 KP 的某些局部不会过载?咱们可能会发现自己面临形象数据的挑战,并在常识立体的各个局部强行划分或层次结构,以容许其扩大,那么如何确保形象和划分可能减少而不是缩小价值?
如何传递常识? 假如常识立体学习到一个有价值的新事实,或有价值的认知。这个事实或意识是如何流传的?是否向所有相干方推送?如果是这样,咱们如何晓得谁对此有趣味?事实是否被简略标记并搁置在常识立体中,以供感兴趣的各方发现?如果是这样,感兴趣的人怎么能力晓得去找它?有没有办法能够智能总结数据,让衡量变得更容易?
如何提供正确的经济激励? 网络社区曾经意识到,分布式系统的胜利在很大水平上取决于零碎设计中嵌入的经济激励因素 [11,12]。常识畛域充斥着经济挑战,如何激励人们把信息放到常识立体?常识立体中的很多数据都是有价值的,是否应该为人们交易信息(或者更好的说法是 ” 常识 ”) 提供机制?如何防止使常识立体协定成为经济竞争点(例如,防止厂商绑定的 HTML 加强)?
如何解决歹意和不可信的组件? 咱们不可能冀望 KP 中的所有节点都是可信、称职、牢靠的。被毁坏的节点可能会注入谬误的察看,某些节点可能会对本人的行为扯谎,某些参与者可能会试图毁坏或混同 KP,从而作为某种攻打整个网络的形式,或者取得某些劣势。KP 算法如何爱护本人,过滤不良信息,并在存在不确定性和谬误的状况下得出无效论断?KP 零碎将不得不依附诸如共识、评级和穿插查看等办法来检测畸形或歹意行为。对于不统一的输出来说,一个强壮的设计是胜利的必要条件。
如上所述,信赖模型应该是 KP 的外围组成部分。建设可信赖的模型,须要对身份有某种长久而无力的表白。不要求该身份与理论的人分割在一起(只管在某些目标下这可能是最好的),但最根本要求是身份不能被伪造或窃取,这样人们就能够依据对该身份的当时察看建设统一的信赖模型。
6. 总结
本文提出用常识立体来扩大网络,常识立体是一种新的更高层次的工件,用于解决网络中 ” 晓得正在产生什么 ” 的问题。在抽象层次上,这是一个收集 察看 (observations)、 束缚 (constraints) 和 断言 (assertions),并对其利用规定以生成 察看 (observations) 和 响应(responses) 的零碎。在物理级别上,是由运行在网络中的主机和服务器上的局部构建的零碎,是一个涣散耦合的全局分布式系统。
更雄伟的指标是建设新一代网络,一个能够驱动本人的部署和配置的网络,能够诊断本人的问题,并就如何解决这些问题做出牢靠的决策。
以前做 ” 高层网络管理(“high-level network management)” 的尝试都不是很胜利,一个可能的起因是以前的我的项目没有可能找到正确的高层形象。KP 背地的假如是,存在适合的办法来形象具体的行为,并在高层次上探讨指标、打算、束缚和办法。常识立体不仅仅是一个事实数据库,还是一个蕴含认知工具和学习的架构。
7. 致谢
这项钻研由美国国防高级钻研计划局 (e U.S. Defense Advanced
Research Projects Agency ) 局部反对,合同为 F30602-00-2-0553 和 F30602-00-C-0087(该文件被批准公开公布,不受限制的散发)。作者感激 SIGCOMM 的审稿人和 DARPA 常识立体钻研的泛滥参与者,他们的探讨和评论对咱们的观点的倒退做出了很大的奉献。
8. 参考文献
[1] D.D. Clark,“The Design Philosophy of the DARPA Internet Protocols,”Proc. ACM SIGCOMM’88, pp. 102-111.\
[2] D.S. Isenberg,“The Rise of the Stupid Network,”Computer Telephony, Aug 1997, pp. 16-26.\
[3] J. Pearl, Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann, San Mateo, CA, 1988.\
[4] T. Bayes,“An Essay towards solving a Problem in the Doctrine of Chances,”Philosophical Trans. Royal Society of London 53 (1763), pp. 370-418.\
[5] A. Demers, D. Greene, C. Hauser, W. Irish, J. Larson, S. Shenker, H. Sturgis, D. Swinehart and D. Terry,“Epidemic Algorithms for Replicated Database Management,”Proc. ACM PODC’87, pp. 1-12.\
[6] C. Dwork, R. Kumar, M. Naor, and D. Sivakumar,“Rank aggregation methods for the Web,”Proc. 10th Intl. Conference on World Wide Web, pp. 613-622 (2001).\
[7] J. Wescott, Automated Network Management, BBN Report No. 5641. BBN Technologies (1984).\
[8] L. Page, S. Brin, R. Motwani, and T. Winograd, The PageRank Citation Ranking: Bringing Order to the Web. Stanford Digital Library Project (1998).\
[9] V. Paxson, J. Mahdavi, A. Adams and M. Mathis,“An Architecture for Large Scale Internet Measurement,”IEEE Communications Magazine 36 (1998), pp. 48-54.\
[10] J. Kleinberg,“The small-world phenomena: an algorithmic perspective,”Proc. 32nd ACM Symp. Theory of Computing (2000), pp. 163-170.\
[11] L. McKnight and J. Bailey, ed. Internet Economics. MIT Press (1997).\
[12] D.D. Clark, J. Wroclawski, K.R. Sollins, and R. Braden,“Tussle in Cyberspace: Defining Tomorrow’s Internet,”Proc. ACM SIGCOMM 2002, pp. 347-356.\
[13] M. Mathis,“Diagnosing Internet Congestion with a Transport Layer Performance Tool,”Proc. INET‘96.\
[14] J. Padhye and S. Floyd,“Identifying the TCP Behavior of
Web Servers,”Proc. ACM SIGCOMM 2001.\
[15] V.N. Padmanabhan, L. Qiu and H.J. Wang,“Passive Network
Tomography Using Bayesian Inference”, Proc. Internet Measurement Workshop 2002.\
[16] R. Davis, H. Shrobe, and P. Szolovits,“What is a Knowledge Representation?”AI Magazine, 14(1):17-33 (1993).\
[17] S. Hangal and M. Lam,“Tracking down software bugs using
automatic anomaly detection,”Proc. International Conference on Software Engineering’02.\
[18] P. Langley and J. E. Laird,“Cognitive Architectures: Research Issues and Challenges”. Draft of October 31, 2002.\
[19] T. Dietterich and P. Langley,“Machine Learning for Cognitive Networks: Technology Assessment and Research Challenges”. Draft of May 11, 2003.\
[20] T. Dietterich,“Learning and Reasoning”. Unpublished article of May 26, 2003.\
[21] V. Kumar,“Algorithms for Constraint Satisfaction Problems: A Survey”. The AI Magazine, 13, pp. 32-44 (1992).\
[22] P. Stone and M. Veloso,“Multiagent Systems: A Survey from a Machine Learning Perspective”, Autonomous Robots, 8(3):345-383 (2000).\
[23] M. Sloman,“Policy Driven Management for Distributed Systems,”Jour. Network and Systems Management, vol 2, no 4, Dec 1994, pp. 333-360.\
[24] R. Chadha, G. Lapiotis, S. Wright, guest eds., “Policy-Based Networking”, IEEE Network special issue, March/April 2002, Vol. 16 Issue 2.
* 你好,我是俞凡,在 Motorola 做过研发,当初在 Mavenir 做技术工作,对通信、网络、后端架构、云原生、DevOps、CICD、区块链、AI 等技术始终保持着浓重的趣味,平时喜爱浏览、思考,置信继续学习、一生成长,欢送一起交流学习。\
微信公众号:DeepNoMind*
本文由 mdnice 多平台公布