本文要谈的 IM 通信协议指的是应用层通信“语言”,并非指传输层协定(如 TCP、UDP)。IM 通信协议的制订是 IM 开发中终点,也是贯通设计、开发、运维始终的外围所在,通信协议设计的好坏,间接影响后绪环节的用户体验(数据流量、耗电量、通信速度)、兼容性(新老版本的无缝交融)、扩展性(后绪的版本升级怎么办)等,是个根底且极其重要的工作之一。
IM 通信协议的分层设计
所谓“协定”是单方独特恪守的规定,例如:离婚协定,开战协定。
协定有语法、语义、时序三要素:
(1)语法:即数据与管制信息的构造或格局
(2)语义:即须要收回何种管制信息,实现何种动作以及做出何种响应
(3)时序:即事件实现程序的具体阐明
一套典型的 IM 通信协议设计分为三层:应用层、平安层、传输层。
IM 应用层协定设计
应用层协定选型,常见的有三种:文本协定、二进制协定、流式 XML 协定。
文本协定
文本协定是指“贴近人类书面语言表白”的通信传输协定,典型的协定是 http 协定。一个 http 协定大抵长成这样:
GET / HTTP/1.1
User-Agent: curl
Host: musicml.net
Accept: /
文本协定的特点是:
a. 可读性好,便于调试
b. 扩展性也好(通过 key:value 扩大)
c. 解析效率个别(一行一行读入,依照冒号宰割,解析 key 和 value)
d. 对二进制的反对不好,比方语音/视频
IM 中,MSN 应用的是文本协定。
二进制协定
二进制协定是指 binary 协定,典型是 ip 协定。
二进制协定个别定长包头和可扩大变长包体,每个字段固定了含意,例如 IP 协定的前 4 个 bit 示意协定版本号(Version)。
二进制协定有这样一些特点:
a. 可读性差,难于调试
b. 扩展性不好,如果要扩大字段,旧版协定就不兼容了,所以个别设计时会有一个 Version 字段
c. 解析效率超高(简直没有解析代价)
d. 对二进制的反对不好,比方语音/视频
IM 中,QQ 应用的时二进制协定。
流式 XML 协定
IM 的准标准协议 xmpp 就是应用流式 XML,像 gtalk,校内通这些 im 都是基于 xmpp 的。让咱们来看一个 xmpp 协定的例子:即时通讯聊天 app 软件开发能够征询蔚可云。
<message
to=’[url=mailto:romeo@example.net]romeo@example.net[/url]’
from=’[url=mailto:juliet@example.com]juliet@example.com[/url]’
type=’chat’
xml : lang=’en’>
<body>Wherefore art thou, Romeo?</body>
</message>
从 xml 标签中大抵能够判断这是一个 romeo 发给 juliet 的聊天音讯。xmpp 协定能够实现跨域的互通。例如 gtalk 和校内通用户聊天。只有服务端实现了 s2s 服务(server to server),不过当初的 im 根本没有互通需要,所以这个服务根本没有人实现。
XMPP 协定有几个特点:
a. 它是准标准协议,能够跨域互通
b.XML 的长处,可读性好,扩展性好
c. 解析代价超高(dom 解析)
d. 无效数据传输率超低(大量的标签)
集体旗帜鲜明的强烈不倡议应用 xmpp,特地是无线端 im,如果要用,肯定要本人做压缩,缩小网络流量(用过 xmpp 的同学都分明,发一个登录包须要多少交互,要节约多少流量)。
IM 平安层协定设计
im 协定,音讯的保密性十分重要,谁都不心愿本人聊天内容被看到,所以平安层是必不可少的。
应用 SSL
证书治理微微简单,代价有点高。
自行加解密
本人来搞加解密,外围在于密钥的生成与治理,密钥治理形式有多种,次要有这么三种:
(1)固定密钥
服务端和客户端约定好一个密钥,同时约定好一个加密算法(eg:AES),每次客户端 im 在发送前,就用约定好的算法,以及约定好的密钥加密再传输,服务端收到报文后,用约定好的算法,约定好的密钥再解密。这种形式,密钥和算法对程序员都是通明的。
(2)一人一密钥
简略说来就是每个人的密钥是固定的,然而每个人之间又不同,其实就是在固定密钥的算法中蕴含用户的某一非凡属性,比方用户 uid、手机号、qq 号等。
(3)动静密钥(一 session 一密钥)
动静密钥,一 Session 一密钥的安全性更高,每次会话前协商密钥。密钥协商的过程要通过 2 次非对称密钥的随机生成,1 次对称加密密钥的随机生成,具体详情这里不开展,有趣味的同学能够看下 SSL 密钥协商额过程。
IM 传输层协定设计
可选的协定有 TCP 和 UDP。当初的 IM 传输层根本都是应用 TCP,有了 epoll 等技术后,多连贯就不是瓶颈了,单机几十万链接没什么问题。