现实工作中经常可以听到这样的说法:框架的升级带来协议性能的提升、编程模式的变革带来业务的飞跃 …… 姑且不论这些表述是否有问题,实际上如果系统地看待事物整体,可能会有不一样的发现。以 LINUX 为例,尽管其内核大获成功,但如果不是遵循 POSIX、并成为一个开源、精简的 UNIX 实现,很难想象其最终会有何种发展。因此,对事物进行全局和一定深入的探究有时会有更多启发。
今天,阿里高级无线开发专家所为将结合自己多年的经验,为你深入阐述整个 Android 技术域及移动研发生态,期待与大家共同探讨。
Android 设计的现实意义
架构的工程意义在于:定义并解决一类问题,为需求到实现的平稳过渡提供保障。传统意义的 Android 架构(图 1)已被人熟知,但不同角色的视角不同,例如认为 Runtime 和框架是其核心、或者将 Android 看做是一种特异性 JVM 平台、还有从嵌入式出发将其看做是 Linux…… 实际上,Android 是极少数几个用设计来解决自身发展问题的系统,其核心在于通过硬件抽象、组件化、接口层三种能力来为发展提供基础,并为诸多变数预留大量可操作、斡旋的空间。
1.1 发展的前提:硬件抽象
2008 年,我国迈入 3G 时代前夜,基础设施的变革让移动领域充满变数,无论设备、硬件还是软件都均未定型。擅长架构和软件的 Google 在这一领域要获得生存和长足发展,需要团结一切可能的、甚至是未知的力量,取得移动运营商、芯片供应商、手机制造商的支持则是生存的第一步。
硬件抽象层(HAL)在一定程度上起到这样的目的:它为移动领域五花八门、标准不统一的硬件驱动定义标准接口,避免 Android 过分依赖 Linux,让后续的扩展和整机集成更加高效,满足了手机制造商的重要诉求;同时还起到隔离 Linux 内核的作用,避免厂商充满硬件秘密的驱动源码受 GPL 协议影响而开源,保障了芯片等硬件制造商的核心利益。传统手机 OS 的定制和集成流程需要修改大量代码,负担不少,从这个角度来看 Android HAL 其设计是领先的。结合 AOSP 优良的代码分支、模块管理,加上基于 GNU automake 巨集形成的 Android build system,厂商享受到超越以往的便捷。
然而 HAL 并无固定做法(如图 2 所示),Android 8.0 之前,最初大量采用 HAL 旧版方式,表现为 framework 直接加载 *.so 并依赖,主要集中在网络、蓝牙等模块;旧版方式导致 framework 与具体驱动接口耦合过紧,后来形成 HAL 传统方式,即提供一定规范和接口进行改进,从而减少直接耦合,但每次厂商支持新版 Android 依旧有大量改动和适配;为更有效地解决这一问题,Android 8.0 开启 Treble 项目,从此芯片厂商能通过基于 Binder 的 HIDL 提供稳定接口,制造商则可不受芯片厂商影响而直接更新 Framework,甚至获得无需重新编译 HAL 即可 OTA 的能力。
受益于 HAL 这一设计,Google 在全球获得更广泛的支撑,尤其是 Android 8.0 在国内厂商的迅速适配可见一斑。HAL 为 Android 设备量的持续增长提供了基础,并促进有实力的厂商向设备上层及基础设施两个领域纵深发展(图 3),体现在掌握核心技术的厂商(如高通、华为、MTK),通过不断建设系统能力来强化竞争力(支持 5G 标准、硬件能力、软硬结合以及系统能力的深度定制等),而具备渠道和资源整合优势的手机制造商(华为、OPPO、小米、VIVO 等),则立足 OS 持续构建更高效的应用来拓展版图(UI、推送、商店、轻应用等),这都体现出 Android HAL 对整个产业的凝聚和影响,间接弥补 Android 自身的诸多不足。
1.2 能力的枢纽:组件化
对能力进行如何组织和复用是架构的最大挑战,借鉴现有能力是发展的捷径。无论是 Mircosoft 的 COM,还是 OMG 的 CORBA,或是从 EJB 到 Spring、从 SOA 到 Serverless,随着基础设施如网络、终端设备的能力提升,这些技术的发展呈现出从重量到轻量、从对中心 (总线) 的重度依赖到轻量级依赖的趋势。Android 充分结合各领域先进技术,并基于移动端资源受限这一最大特色,形成了自身的技术特色:AIDL 衍生自复杂的 CORBA IDL,组件由 SOA 精简而来,各独立生老病死的 System Service 类似一个个微服务,Binder 可以看做是对一种弱化总线、性能更好、可点对点通信的 DBUS,UI 布局系统则极大程度受到 SWING 的影响、manifest 实际上就是 APP 与系统通信所必须的组件接口描述文件 ……
上面提到的领域技术的确有利于 Android 发展,但远远不够。回想之前谈到的 HAL 以及整体架构,我们看到 Android 实际上就是个大杂烩,使用的是诸多技术的混合。过去除 Palm 等 Web OS 外,无论是基于 Linux/Unix 构建的系统如 Meego,还是 Symbian、MTK、UCOS、WindowsCE,无论是实时系统还是非实时系统,这些移动端系统都以 C /C++ 为主且小巧精悍,对内存使用和要求极为考究,虽然满足了资源受限设备的使用诉求但带来了门槛;虚拟机类的平台如 KJava、.NET on Windows Phone 虽然内存使用和能耗方面比较大方,却胜在研发效率和容错性,因而受到不少开发者欢迎。
所以选择混合架构对于缺乏完整移动领域产业链支撑的 Google 既符合其自身技术理念、又胜算最大,于是量身定制的组件化能力便肩负起这一使命,使得各组件得到有机组合、应用之间以及应用和系统的沟通更为明确和有约束,最终帮助整个系统灵活运转,能力被迅速放大。
观察 Android 系统的启动运行流程(图 4)以及 APP 对系统能力的使用(图 5),可以发现其各类能力已按照组件化标准和粒度进行组织(能力的注册发现、接口和通信的标准化、运行空间的隔离等),让快速迭代的手机硬件和持续升级的系统能力以最小代价透出,将复用的价值在移动设备系统上具体化并最大化,从而具备更高的灵活性和兼容性;其背后软件工程的意义在于为软件需求、设计之间架起一座桥梁,解决了系统结构和研发需求向实现平坦过渡的问题。
当然,历史上其他公司面临这类挑战时也有不一样的想法,例如 Windows Phone 8.0 选择了另外一条路,无论是提供媲美 JAVA 的 C# 及 VB.NET 框架、还是基于 Sliverlight Dependency Property + XAML 的 UI 系统、甚至是为了支持 C ++ 研发出来的 C ++/CX 及一套运行时,都仿佛无时无刻标榜着其系统技术的多样化与复杂性,算得上是一场技术盛宴。
Meego 则是另外一个例子,被期待救 Nokia 于危难,并由 Intel 联袂推出,通过各种开源能力的组合来完成系统的建设,如 Linux 内核 +QEMU 模拟器 +QT+QML 界面,但实际上昙花一现。
1.3 应用的基础 - 接口层
系统能力基本就绪,如何迎来更多开发者对 Android 长远发展至关重要。选择 JAVA 作为上层语言,既需要勇气又足够彰显其野心;为迎合资源受限这一移动领域过去、现在也是未来的最大客观事实,其设计了基于寄存器架构、可执行文件更小的 Dalvik 虚拟机,并通过净室工程来高质量实现,同时结合诸多工具对外提供了流畅的 JAVA 编程方式,摆脱类似 MTK feature phone 只能用 KJava 写些小游戏的局限,使得 Android 研发兼具 JAVA 的便利和不错的性能。
天有不测风云,SUN 在 09 年 4 月被 Oracle 收购,距离 Android 1.0 发布还不到一年。虽然最初选择 Apache Harmony 来提供 JAVA API 十分明智,但却遭遇到技术上不支持 JAVA 7/8、版权上 Oracle 诉讼纷至沓来等诸多挑战。为应对这一切,Google 从 Android N 开始,将 JAVA 的支持变更为 OpenJDK。另外,Kotlin 因为特性相近、又可被编译为 class 或者 dx 字节码,也获得了 Google 青睐和收编(图 6)。
实际上,之所以 Android 敢这么做,还是因为有其设计基础的支撑,根据个人的一点粗鄙了解,从 Android API 的调用链路(图 7)上能发现端倪:无论底层依赖、实现和流程如何变化,上层的使用形式并不会改变。
这意味着几乎所有系统能力的核心,已在 native library 被实现殆尽,并结合上层提供良好屏蔽。这为其他语言实现 Framework 提供了可能,尤其是一门特性与 JAVA 相近的语言。所以是什么语言、是不是 kotlin 都只事先设计规范下的一种合适的选择。
对于我们的象征意义和实践
综上所述,Android 从三个方面来解决其发展的关键问题:
硬件驱动:形成厂商的合作基础,并反过来对整个产业施加影响。组件化:高效组织各种内部能力,寻求自身的更快发展。接口层:满足上层对系统和硬件能力的各种使用诉求。移动互联网产业巨头发展因为起点以及执行理念不同而有所不同,Apple 围绕着其 App Store 构建其整个体系并精心维护,而且在现代化 API 编程、整机体验、垂直领域技术如网络 / 算法等各纵深领域走在前列;Google 则用 Android 带路,需要在各个层面维护和团结不同力量来形成自己的发展特色。所以,Android 为系统如何发展提供了另外一种答案:除关注系统自身能力的发展,如何维护好系统不断发展的基础和前提、如何更好地暴露和让外界使用系统能力也至关重要(见图九)。
回到我们自身,在重用户、重交互、手机即人的今天,我们的产品有理由也有必要用其内涵延展并放大服务的价值。要做到这一点并非易事。首先,业务迭代越来越快,各种应用层出不穷对中间件意味着广泛的需求;其次,环境在改变,无论是运行硬件和设备的五花八门、还是对接集群的复杂多样,都对阿里原有端侧中间件带来巨大冲击;再次,在基础技术发展变缓的今天,技术的价值需要被持续放大,我们希望基于自身能力来构建服务和业务的泛连接基础, 并将其作为发展愿景。这要求我们基于集团背景以及核心 APP 发展的主要目标下,来综合思考这个发展问题(图 10)。
通过 Android 的启发,结合环境和现状,在满足业务目标的同时我们从三个层面不断演进网络能力(图 11)。
首先,通过覆盖线上线下、各类场景、形态各异的设备,不断打造高效私有、支持通用标准的协议,并提供部分其他端侧网络不能或者及其难以提供的特殊能力,来帮助我们构建设备和服务、用户与业务的泛连接基础。其次,自底向上地抽象,将非阻塞的 IO 复用、用户态网络栈支持、通道能力扩展以及可支持混合集群的多实例架构进行高效组织,从而保障了数据在不通层面的流转和管理诉求。最后,基于 SDK 矩阵和接入能力的建设,我们实现了服务接入到业务、业务透出给用户的目的,并通过提供丰富的数据带来更多价值。
基于以上的不断沉淀,目前我们已能触达海量设备和用户,成为接入阿里内外各服务和平台的接口,并为终端和服务分别屏蔽集群的多元化及设备的多样性,实现新零售系统能力与用户的泛连接(图 12)。
小结
结合传统的 C / S 观念,服务端获取的信息来源于各网络终端,网络 + 协议屏蔽或规范了外界对服务输入的多样性,使得服务端过去关注的是集群和高并发,但现在无论是上云还是利用率,背后都是业务、成本规模和边际效应在驱动,这里面发展的代际主旨鲜明。但回到客户端,由于受到环境和交互等多样性直接影响,即便是动态性的技术也难以代表端侧的全部甚至是主流。所以在某种局部技术比拼武功,成为过去客户端的一种行业“潮流”。
在局部技术和单点深入的确有其意义,笔者也曾有过一些班门弄斧,如非轮询方式获取手机栈顶 Activity、面向阿里特有复杂集群的 SDK 多实例设计、Sophix 热修复及云上产品等。但结合过往经验及 Android 设计,可以更系统性地看待这一现象:即除了满足业务核心诉求(因为投入大量资源,必须、肯定要成,至少小成),更应该关注技术如何更好地服务业务以及如何持续挖掘能力护城河这两头的问题。所以要打造和发展好一个系统,除构建系统各中坚能力外,还需维护好系统发展的前提、组织好各系统能力的内聚、满足好外部对系统的诉求。
原文链接本文为云栖社区原创内容,未经允许不得转载。