芯片界震动Arm-杀入自定义指令集成立自动驾驶计算联盟

46次阅读

共计 4462 个字符,预计需要花费 12 分钟才能阅读完成。

芯潮(ID:aichip001)编 | 心缘

芯潮 10 月 9 日消息,今日凌晨,在加利福尼亚州圣何塞举行的 Arm TechCon 2019 活动上,Arm 宣布在部分 CPU 内核引入自定义指令功能,即客户能够编写自己的定制指令来加速其特定用例、嵌入式和物联网应用程序。

从 2020 年开始,使用 Cortex-M33 内核及之后的 Cortex-M CPU 内核系列的所有客户都可以免费使用自定义指令功能。

▲Arm CEO Simon Segars 讨论未来 Arm CPU 内核上的新自定义指令集功能。

Simon Segars 表示,在公司重返公开市场之前,仍有许多事情需要安排到位。不过软银 CEO 孙正义为 Arm 设定的在 2023 年重返证券市场的目标仍保持不变。

在本次大会上,Arm 还宣布更改其免费的开源物联网操作系统 Mbed OS 的合作伙伴治理模型,允许开发人员对 Mbed OS 的特性产生更直接的影响。另外,Arm 成立自动驾驶汽车计算联盟,并宣布与 Unity 合作以支持各种 3D 内容创作。

01 将自定义指令引入 CPU 内核


本次大会上,Arm 首席执行官 Simon Segars 宣布,从 Cortex-M33 起,Arm 将在 CPU 内核中集成一个特殊的块,允许客户对 Armv8-M 指令集体系结构(ISA)进行自定义指令。从 2020 年开始,使用 Cortex-M33 及此后 Cortex-M CPU 内核系列的所有客户都可以免费使用自定义指令功能。

Arm Cortex-M 内核是功耗优化的内核,可与智能手机和 PC 等应用程序中的 Cortex-A 性能内核结合使用。该内核还是数十亿个低功率嵌入式 / IoT 应用程序的主要处理内核,应用领域覆盖烤面包机、冰箱、电机控制、传感器处理等各类终端设备,占每年数十亿 Arm 核出货量的绝大部分。

ARM 汽车和物联网业务高级总监 Thomas Ensergueix 表示,Arm 始终有一系列的加速选项,从其内存映射架构开始,通过总线和当今的神经处理器单元进行连接,这使得 CPU 和加速器可并行运行,但与此同时总线成为瓶颈,客户还可以选择直接连接到 CPU 的协处理器。

而今天新发布的自定义指令功能允许 Arm 客户创建自己的加速算法,然后直接在 CPU 上运行,这意味着客户可以更快的智能集成和快速开发完全集成的自定义 CPU 指令,而不会产生软件碎片,也不像内存映射解决方案那样并行运行。

由于现有 CPU 功能没有中断,此设置为集成客户工作负载加速提供了更低的成本和风险,并且仍允许其客户使用他们所熟悉或已使用的现有标准工具。

当前 Arm 已经与许多合作伙伴合作以支持自定义指令,包括 IAR Systems、恩智浦、芯科科技、ST 意法半导体等。

这是今年 Arm 为使其产品和技术更加灵活所发布的第二项公告。此前在今年夏天,Arm 宣布了一项新许可计划,为客户提供更低价的大量 IP 访问权限,在生产出芯片前无需签署许可协议。

在 Arm 灵活访问服务的帮助下,客户每年只需支付 7.5 万美元即可购买单个芯片,而无需支付 20 万美元即可购买无限数量的芯片。

这些新的措施有助于解决 Arm 架构的两个局限性,一是开发芯片的成本,二是使用非常规硬件的灵活性。许可的变更和开发自定义指令的能力使当前和潜在客户可以更轻松地开始利用 Arm IP 开发芯片,同时利用其优势或 Arm 工具和广阔的生态系统。

02 改变 Mbed OS 合作伙伴治理模式


除了发布自定义指令功能,Arm 还宣布改变其免费开源嵌入式操作系统 Mbed OS 的合作伙伴治理模式。Mbed OS 做为物联网(IoT)的基础,正帮助日常物品变得更加智能互连。

在将近 30 年的时间里,由 1000 多个合作伙伴组成的 Arm 生态系统合作开发了一个模型,已交付了超过 1500 亿个芯片,助力数百个合作伙伴打造数十亿个基于 Arm 芯片的 IoT 设备。

Arm 表示,在解决开发和部署物联网的挑战时,Arm 生态系统模型是紧密结合在一起的。

为了简化物联网开发,过去十年,Arm 围绕免费的开源物联网操作系统 Mbed OS 建立了一个广阔的生态系统,其中包括超过 42.5 万个第三方软件开发人员、150 多个启用 Mbed 的主板及模块。

当前,Arm 正在将 Mbed OS 改成协作型治理方式,建立每月的产品工作组会议,在该会议上,Arm 将确定优先级并进行投票,然后将新功能添加到 Mbed OS 中。任何 Mbed Silicon 合作伙伴计划成员均可参加。

Analog Devices、赛普拉斯、Maxim Integrated、Nuvoton、恩智浦、瑞萨电子、瑞昱半导体、三星、芯科科技、u-blox 等多家 Arm 芯片合作伙伴已经积极参加了该工作组。

▲Arm 计划成为所有技术的粘合剂。

此前大多数商业物联网操作系统是由单个供应商开发的,没有关于硬件合作伙伴如何贡献的清晰模型。Arm 表示,产品工作组讨论的结果将最终使更广泛的 Arm IoT 生态系统受益,以帮助硅芯片合作伙伴能够保持强大的商业领导地位,加大构建新功能、特性和功能的力度,这对于扩展至数万亿连接的设备至关重要。同时,它也有助于塑造和确定 Mbed OS 的未来方向。

例如,Arm 正在根据合作伙伴的初步贡献进行新的低功耗电池优化,这将延长设备在现场的电池寿命。

随着物联网市场规模扩大到数千亿、万亿个互联设备,Arm 表示,只有合作伙伴能够继续合作,生态系统模型才会成功。这是朝着推动物联网生态系统内不断创新和差异化迈出的重要一步。

03 成立自动驾驶汽车计算联盟


在大会上,Arm 汽车和嵌入式产品高级副总裁 Dipti Vachani 宣布成立自动驾驶汽车计算联盟,以协作的方式解决各种安全和计算问题。

联盟成员包括通用汽车、NVIDIA、电装、丰田、博世、Arm、德国大陆集团和恩智浦。

Vachani 说,很多人对人类驾驶和自动驾驶汽车的安全性感到担忧,为了确保来自不同提供商的技术能很好协同工作,该联盟将就安全性、计算、软件等问题进行合作。她表示,此前没有任何一家公司能做到这一点。

04 合作 Unity 支持 3D 应用


本次大会上,Arm 宣布将与 Unity 合作,以确保 3D 应用程序在使用 Arm 架构的硬件上流畅运行。该公告是硬件和软件设计中更大的全计算(Total Compute)协作方法的一部分,开发人员可以轻松访问除 CPU 内核之外的其他内核。

Arm 客户业务部门市场营销副总裁 Ian Smythe 说,Arm Total Compute 代表了一种 IP 设计的新方法,重点是用例驱动的优化系统解决方案。

基于该解决方案,开发人员将借助软件开发套件编写他们的软件,从而可以找出在 CPU、GPU 或机器学习(ML)硬件上处理该软件的最佳方法,了解如何优化以获得最佳渲染和性能。Arm 的客户小组副总裁 Paul Williamson 表示,这取决于在给定的功率范围内处理软件的最佳方法。

作为 Total Compute 的一部分,Arm 和 Unity Technologies 正在扩展战略合作伙伴关系,以进一步提高性能。

Williamson 说,Arm 和 Unity 正将合作扩展到各种 3D 内容,尤其是 VR 和 AR,要使其在具有计算约束的所有平台上达到最佳状态,需要进行大量工作。双方已在工程上合作了几个月,并将在未来几年继续这样做。Arm 的技术将针对 Unity 实时 3D 开发平台进行优化,反之亦然。

Unity Technologies 平台副总裁 Ralph Hauwert 表示很高兴与 Arm 合作,这将确保全球最大的创作者群体—— Unity 开发人员——为数十亿 Arm 驱动的设备提供经过独特优化的工具。

▲Unity 渲染游戏和娱乐图形。

Smythe 认为,从过程扩展和数据隐私方面的挑战,到 CPU 以外的非常分散的生态系统,都正在发生多种转变。尽管 5G 将创造一个充满机遇的世界,但硬件制造商仍将需要为下一代的沉浸式体验提供强大的功能、性能和效率,Total Compute 将努力试图在 5G 连接性和处理屏幕图形的需求之间找到平衡。随着 5G 的到来,AI、xR 和 IoT 的加速正在改变计算需求,数字沉浸所需的性能将必须超越当今的水平。

“这要求我们设计知识产权(IP)的方法截然不同,重点是优化性能、安全性和开发人员访问权限。毫无疑问,这不会完全一样,而只是思维方式的转变。”Smythe 说,“通过从 IP、软件和工具内部以及跨 IP、软件和工具进行优化,以提供安全的基础并提供应对未来工作负载的复杂计算挑战所需的性能,我们正在从单一产品开发重点转向用例和经验驱动的系统解决方案。”

05 持续提升机器学习性能和安全功能


自 Arm 推出 Cortex-A73 以来,Arm 逐步提高了机器学习(ML)的性能,今天,Arm 希望大幅扩展 ML 在 CPU 中的使用。

Smythe 说:“为了实现这个新的数字世界,我们需要将计算推向更高的水平,这就是为什么我们在我们的下一代 Cortex CPU Matterhorn 中添加了 Matrix Multiply(MatMul)的原因,从而使 ML 性能有效地比以前提高了一倍世代。”

据他介绍,除了 CPU 之外,Arm 还需关注 Total Compute 方法并将其应用于系统中的每个计算元素及其基础架构。无论是 Arm CPU、GPU、NPU、互连模块还是系统 IP,都必须对其进行优化以作为集成解决方案。而这要依靠实现这一目标的软件和工具,包括 Arm NN、Arm 计算库、开源社区和开放标准等,它们全都建立在安全的基础上。

▲Ian Smythe 公布 Total Compute 所做的努力。

由于人们正越来越依赖于手机作为所有个人信息、隐私和安全事宜的中心,Arm 现已开始作为 Total Compute 的一部分推出诸如存储标签扩展(MTE)之类的创新安全功能,以满足客户的各种需求。
Arm 希望,Total Compute 成为所有开发人员的首选平台。

最近,谷歌宣布了与 Arm 合作设计用于 Android 设备的 MTE 的计划。这些功能与平台安全体系结构(PSA)相结合,将有助于对整个生态系统的安全性进行标准化和碎片整理。

Smythe 说,任何 Total Compute 解决方案都涉及很多要素,无论是用于 VR 头显还是可穿戴设备,智能手机或 DTV,其目标是为未来的计算平台提供基础,并采用全面计算方法,简化安全性,提高性能和效率,并为开发人员提供整个 Arm 生态系统更多的性能访问机会,最终实现真正的数字沉浸式体验。

06 结语:顺应开发定制芯片的大势


过去一年,开源指令集 RISC-V 的兴起、以及老牌 MIPS 宣布开源,都对于 Arm 发起了冲击。从 Arm 今年以来的一系列举措,我们可以看出 Arm 正迅速适应市场变化,消解竞争压力。

新发布的自定义指令功能,解决了使用第三方 IP 内核的一大限制,迎合了电子行业中不断发展的趋势,即开发定制芯片以优化性能、降低成本。对于 Arm 来说,这是拥抱指令集定制化的重要一步,同时仍保持其内核的安全性、可预测性和可靠性。

开发定制芯片仍需付出巨大的成本和风险,但随着这一门槛逐渐降低,消费电子设备、汽车 OEM 等越来越多的公司正在开发或考虑在内部或通过合作伙伴开发定制芯片。

原文来自:VentureBeat,Forbes,Techcrunch

正文完
 0