关于直播:我用chatGPT做直播技术选型卷死了同事

近两年即时通讯 / 直播产品煊赫一时，市场上针对 ToB 的产品日益增多，企业该如何去选型呢？本文分享了笔者对于直播产品的思考，将从直播 SDK 实例性能个性、常见业务场景、注意事项及最佳实际等方面介绍如何进行实例选型，旨在帮忙您理解应如何结合实际业务场景选购音视频产品。

近期，ChatGPT 火遍寰球，作为冲浪第一线的开发者可不能错过。刚好在做“音视频技术选型”的调研，不如找 ChatGPT 来聊聊，看看它怎么答复？

在同质化竞争如此强烈的明天，尽管各厂商都有本人的差异化劣势，但开发者在选型时并没有辨认或比照出差别，要想实现直播产品稳固应用的目标，在直播选型的时候有个好的开始是十分必要的。置信很多企业或团队在选型时面临过以下问题

各家厂商直播 SDK 差别都有哪些？
什么样的直播 SDK 才适宜本人的企业或团队？
直播 SDK 接入之后的落地状况怎么样？

上面联合企业立场来推导直播 SDK 产品选型的外围因素，以市面上几家厂商为例便于大家更全面的比照衡量，心愿对面临选型的开发者有所帮忙。

实例选型剖析过程如下图所示：

临时无奈在飞书文档外展现此内容

对于开发者来说，开发一款产品首先面临的第一个抉择就是：自研还是应用第三方音视频服务？目前大部分专一于业务的公司都会应用第三方音视频服务，少部分大厂前期会抉择自主研发。特地一些技术门槛高、行业业余度高的模块还是会洽购第三方音视频服务，例：强互动性的多人实时连麦。

自主研发与应用第三方音视频服务优缺点如下：

	第三方音视频服务	自主研发
团队建设老本 / 难度	低	高
业务上线周期	接入 sdk 可疾速上线	搭建音视频技术体系长则 3～5 年，最短周期也需半年
音视频体验	业务实现成果较优，通过大量市场用户验证	短期内成果个别，很难跟第三方 SDK 比照，头部客户例抖音后期也是应用第三方厂商
团队应用业务变动能力	高，多年技术积攒、多种场景解决方案	差，需一直学习新技术、学习周期长
业务差异化新需要	中，可通过选型成熟的厂商提供场景解决方案或业余定制化计划解决。例：即构、腾讯云团队	高，可按需定制、个性化调整
投入费用	低，依据理论业务规模按需付费	高，研发人力、经营保护老本

综上，若处于业务晚期初创开发团队，要求疾速上线、专一业务、同时业务方向不稳固，同时业务方向为社交娱乐、近程办公、在线教育等惯例类利用，倡议抉择第三方音视频 SDK 疾速集成。

第三方直播 SDK 服务的价值在于：为开发者提供实现音视频能力的一站式技术计划，目标在于能够升高 App 开发的技术门槛、人力和研发老本、晋升开发效率。

上面我将针对“如何选型一款好的直播 SDK”开展聊聊，分享选型的办法和避坑教训。

音视频技术能够赋能上百种利用场景，开发者该如何抉择最敌对的音视频厂商成为一大课题，开发者须要理解实时音视频技术选型中的坑，以便进步开发集成效率。可从以下 6 个方向进行综合思考。

选大厂还是垂直畛域的音视频厂商？

云计算大厂个别都提供 laas 到 paas、saas 的整体服务，在销售 laas 服务时搭配音视频服务。产品生态较丰盛，不仅音视频能力，还有 CDN、推送、测试等服务，提供一整套从 laas 到 paas 的服务，开发者可一站式洽购较为省事。

垂直厂商因教训积攒、技术专一、研发实力全副 all in 在音视频赛道。故劣势在于：更聚焦通信和视频云，更重视 PaaS 平台自身的服务，提供更业余的一体化产品与服务。比方：垂直厂商即构去年公布了 Express SDK3.0& 星图，由实时通信 RTC 全面升级成实时互动 RTI，实现了能力与服务的新逾越。画质、音质增益更显著，终端客户体验全面降级、场景实用更多元丰盛 …

RTI 代表所有实时互动场景下所需的产品和技术能力综合，蕴含 RTC+IM+ 直播 +Avatar+AI+ 状态同步等，更强调互动。实用于元宇宙、社交娱乐、办公会议、电商直播、游戏竞技等场景，满足开发者疾速搭建对应场景的音视频利用，实现业务快速增长。

云计算大厂跟垂直音视频厂商各有劣势，开发者可结合实际业务需要从技术、产品、服务等多个维度综合思考。

基于多年的音视频开发教训以及联合身边开发者的反馈，音视频 SDK 的产品外围性能是选型的要害，以下有一份性能自检清单。

一个好的 SDK 的衡量标准有以下几点：产品性能生态完整性，技术指标绝对强弱，解决方案成熟度，胜利案例 / 单干客户数等。

第一步开发者需明确：需利用在什么业务场景？外围实现什么能力？

音视频在各行各业的利用越来越宽泛，成为互联网产品的标配。有大家熟知的生产互联网畛域，近几年疫情带来的近程交换合作的需要，使实时音视频在产业互联网场景减速浸透。比方：近程交换、合作，企业数字化与工业数字化场景 …

随着音视频技术迅速倒退，除根底音视频能力外各大厂商推出多种新鲜玩法。上面列举支流场景中所需的音视频能力要求，按根底、进阶、特色三个维度进行分类，便于开发者查阅。

社交娱乐场景

生产互联网畛域是音视频技术浸透最宽泛的场景，音视频性能成为社交娱乐产品的标配。

社交娱乐畛域的场景含：语聊房、在线 KTV、秀场直播、社交小游戏等，将社交娱乐所需性能分为：根底性能、进阶性能、特色性能。市面上的 SDK 根本都笼罩了根底性能，随着社交娱乐场景的倒退，对互动 / 玩法上衍生了更多要求。如在线 K 歌场景需正版曲库，秀场直播场景更看重主播与用户之间的互动，实时音讯，送礼物，VIP 用户权利等。

	产品性能	性能形容	业务场景
根底性能	音视频通话	用户退出同一个房间，并进行音视频通话。	1v1 视频通话多人视频会议
音视频直播	同一个房间，蕴含主播及观众，主播能够进行音视频直播，该房间内的观众能够观看直播。	秀场直播游戏直播电商直播
进阶性能	直播连麦	一个房间内，能够呈现多个主播，进行同屏连麦直播。	多主播跨区连麦多人 KTV 独唱多人连麦直播
房间实时音讯	实时音讯次要提供纯文本音讯的收发性能，可向同一房间内的其余用户发送播送音讯和弹幕音讯，或者对某些指定用户发送自定义音讯，并能够依据须要自行实现点赞、送礼物、答题等互动性能。	秀场直播语聊房
特色性能	变声	通过扭转用户的音调，使输入的声音在感官上与原始声音不同。如男声变女声、机器人音效、外国人音效等。	匿名社交游戏娱乐角色扮演
音乐版权 / 音效	反对通过获取正版曲库资源，播放背景音乐，并展现变声混响多种趣味成果。	在线 KTV
美颜美型	基于 AI 视觉服务，提供美白、磨皮、锐化、红润等根底的美颜性能，反对大眼、瘦脸、小嘴、亮眼、白牙、瘦鼻等美型成果，打造独特天然的直播成果。	秀场直播音视频通话社交小游戏
送礼物	反对用户向房间内主播或其余指定用户赠送礼物。	秀场直播社交小游戏
小游戏	提供直播间内的实时 PVP、语音互动、桌游、秀场互动等多种小游戏类型，助力客户进步产品沉闷、留存、应用时长及营收能力	社交 + 小游戏

在线教育场景

在线教育畛域的场景含：职业教育、K12 教育、素质教育、学历考试等，在线教育场景因比拟成熟，各细分场景的性能要求也比拟类似，围绕着老师与学生在教学过程中的互动，丰盛课堂内容晋升教学质量。如屏幕共享、超级白板等性能。

	SDK 或服务	性能形容	业务场景
根底性能	实时音频	为课堂里的老师和学生提供实时的音视频互动性能。	职业教育、K12 教育、素质教育、学历考试
实时音视频	提供高清晦涩、多平台互通、低提早、高并发的音视频服务。	职业教育、K12 教育、素质教育、学历考试
屏幕共享	老师能与学生之间共享课件，丰盛课堂教学内容。	职业教育、K12 教育、素质教育、学历考试
文件共享	能将支流的文件格式类型转码为平台无关的格局，并无损还原原文档内容、格局、布局、动画。	职业教育、K12 教育、素质教育、学历考试
进阶性能	超级白板	能提供实时的白板互动，做到音画同步，进步课堂教学品质。	职业教育、K12 教育、素质教育、学历考试
云端录制回放	疾速实现音视频通话及会议直播的录制性能，反对录制回放	职业教育、K12 教育、素质教育、学历考试
即时通讯 IM	丰盛的 API 接口，疾速实现单聊、群聊、房间、零碎告诉能力	职业教育、K12 教育、素质教育、学历考试
特色性能	AI 美声美颜	基于当先的 AI 算法，提供包含美颜、美型、美妆、滤镜、贴纸、智能宰割、人脸检测等性能，实现美颜实时渲染，打造天然美颜成果	职业教育、K12 教育、素质教育、学历考试
百万大房间	房间内反对百万用户同时观看直播，秒级平滑扩容	职业教育、K12 教育、素质教育、学历考试

元宇宙 场景

随着互动技术矩阵逐步欠缺，沉迷式体验降级，音视频向元宇宙进阶。

虚构形象、虚构直播、虚构语聊等元宇宙新场景，对实时音视频互动也提出了更高要求，要求更低的提早和音视频交互品质，为用户提供更沉迷式的应用体验。

	次要性能	性能形容	业务场景
根底性能	音视频通话	预留灵便、敌对的扩大接口，疾速接入即构实时音视频服务。让音视频无处不在，满足用户在元宇宙里实时交换	虚构直播虚构语聊虚构 K 歌虚构会议
实时音视频	超低延时下，观众实时接管主播的音视频流，直播晦涩不卡顿。	虚构直播虚构语聊虚构 K 歌虚构会议
进阶性能	实时音讯互动	通过房间实时音讯性能，实时展现房间内的音讯，例如发消息、进退房提醒、互动告诉等。	虚构语聊
实时录制	疾速实现音视频通话及会议直播的录制性能，反对录制回放	虚构会议
超低提早独唱	超低提早独唱体验，端到端提早低于 70 ms，达到人体无感官提早程度，寰球用户均可享受真正实时的体验	虚构 K 歌
音乐音效	200 万 + 首词库版权，笼罩热门歌曲，疾速实现 k 歌业务。通过获取正版曲库资源，播放背景音乐，并展现变声混响多种趣味成果。	虚构 K 歌
送礼物	反对用户向房间内主播或其余指定用户赠送礼物。	虚构直播虚构语聊虚构 K 歌
范畴语音	让声音具备距离感，超出限定范畴则无奈听到声音	虚构 K 歌虚构语聊房虚构会议虚构演唱会虚构发布会
特色性能	焦点语音	最高 50 人同时开麦，反对焦点语音，提供优质稳固的根底体验	虚构语聊
Avatar 虚构形象	自定义捏脸换装，塑造个性化形象。疾速生成专属形象，提供 200+ 素材，反对表情随动和肢体随动手势辨认等 AI 能力。	虚拟人虚构 K 歌虚构语聊房虚构会议虚构演唱会虚构发布会
3D 场景	无需 Unity 开发教训，半天疾速实现 3D 虚构场景的渲染。丰盛的场景拓展能力，反对疾速搭建虚构场景。	虚构 K 歌虚构语聊房虚构会议虚构演唱会虚构发布会
3D 空间音效	反对 20+ 模仿实在 K 歌体验，进行 3D 空间音效渲染，声音将会随间隔的减少而衰减，直至超出所设置的范畴，则不再有声音。	虚构 K 歌虚构语聊房虚构会议虚构演唱会虚构发布会
万人实时状态同步	提供多人同屏下，人物位移、动作、场景交互等状态的实时同步，反对万人量级高并发的场景，保障稳固的帧数据同步服务。	虚构发布会虚构会议
人物管制与场景交互	提供摇杆管制人物在场景中自在挪动。提供丰盛多样的预置人物动作库，提供第一视角、第三视角等多种视角切换能力。提供人与人，人与场景的互动能力。	虚构 K 歌虚构语聊房虚构会议虚构演唱会虚构发布会

技术指标的强弱间接影响后续的开发成本和用户体验，所以在做音视频选型时需关注三类个性指标，体验指标、底层技术指标、其余指标。

不同利用场景对外围个性指标的要求不同，次要体现在用户对实时性、互动性两大生产习惯。培训直播要求双向互动，延时秒级即可。互动直播 PK 连麦则超过两个用户间的互动，时延要求更严格毫秒级别。

图例：音视频利用场景对实时性和互动性的要求

外围个性指标：

体验指标：端到端提早、晦涩度、音画品质、首帧耗时
底层技术指标：抗丢包率、3A 解决、网络传输、CPU 内存占有率
其余指标：包体积大小、单房间容量

以音视频厂商声网、即构为例，指标数值来自各厂家官网链接

	个性	即构	声网
体验指标	端到端提早	均匀 300ms	端到端小于 400ms
晦涩度	优良	优良
音画品质	音频采样率：16 kHz ～ 48 kHz，反对单、双声道。SDK 采集反对 4K 分辨率、1 fps ～ 60 fps 帧率。	音频采样率：16 kHz ～ 48 kHz 反对单、双声道 SDK 采集反对 1080p 分辨率，60 fps 帧率，自采集反对 4K
首帧耗时	根本无感知	根本无感知
底层技术指标	抗丢包率	视频上下行抗丢包率 70%，音频上下行丢包 80%	音频上下行抗丢包率 80%
3A 解决	反对	反对
网络传输	寰球部署 500 多个外围节点，音视频传输依靠于自研的 MSDN 根底网络、即构 MSDN 交融了多个云商，相比自建网络和繁多云商架构，可用性更高；反对千万级并发，单房间百万级并发，并且可能实时探测线路品质，针对线路故障能够秒级响应和主动复原，相比人工干预更稳固，保障服务的可靠性。	FPA 全链路“端”+“云”协同减速，提供更优良的整体减速性能与稳定性。
其余指标	SDK 包体积	2.98-11.52 MB	4.61 ～ 13.94 MB
单房间容量	单房间能够反对 50 路音视频互动，依据须要能够配置更多，纯语音万人互动	音视频最高反对 17 人连麦互动

通过调研发现，用户最不能承受实时音视频的三个品质问题是 提早大、卡顿显著、画质差。咱们测评了即构、声网的端到端提早、晦涩度和清晰度，比照剖析如下：

晦涩度、清晰度： 在同一网络和同一设施下测试，在视频画质方面，集体主观感知 清晰度 是差不多的，延时层面均感触不到显著提早，而在和 wifi 隔一段距离的弱网状况下，受限网络各服务商的 清晰度 和晦涩度 都略有降落，在整体感观上即构体现好一些。

技术选型的关键点还在于：解决方案的成熟度，计划越成熟后续开发越省力，对开发者越敌对。成熟度次要从以下三个方向：计划拓展性、场景笼罩、头部客户。

计划易用性和拓展性：接入流程是否简略？拓展性是否够强？生态化是否好？是否提供全面敌对的第三方开发者反对？
场景笼罩：是否能够全场景笼罩，是否按场景提供外围性能，音视频品质是否依据不同场景进行优化
头部客户：是否有行业头部大客户？是否有企业级 APP 接入实战经验？是否提供全流程服务？

6.1 计划易用性和拓展性

计划接入流程的快慢决定着业务是否可疾速上线抢占市场，这就要求 SDK 的模块设计简洁清晰、有齐备的正文、和不同规格的阐明。市面上的音视频 SDK 接入流程通常有以下 3 步，1. 获取 APP ID，2. 集成 SDK，3. 实现音视频性能。如下图：

厂商通用接入流程：

临时无奈在飞书文档外展现此内容

即构和声网的具体接入流程

序号	具体步骤	即构	声网
1	筹备阶段	注册开发者账号获取 appid+appSign	注册开发者账号获取 appid+app 证书 +token
2	集成 SDK	集成依赖包	集成依赖包
3	初始化本地引擎对象	通过 appid+appSign 创立本地 RTC 引擎对	通过 appid 创立本地 RTC 引擎对象
4	推本地流	1.loginRoom 登陆房间 2.startPreview 开始本地预览 3.startPublishStream 开始推本端流	1.setupLocalVideo 设置本地视图 2.joinChannel 退出频道
5	拉远端流	1.loginRoom 登陆房间 2.startPreview 开始本地预览 3.starPlayStream 开始拉远端流	1.joinChannel 退出频道 2.setupRemoteVideo 设置远端试图
6	停推本端音视频	1. mutePublishStreamVidio/mutePublishStreamAudio 2. stopPublishStream 3. enableCamera/muteMicrophone	1.muteLocalVideoStream/muteLocalAudioStream 2.enableVideo/enableAudio
7	退出频道 / 房间	logoutRoom	leaveChannel
8	销毁引擎	destroyEngine	RtcEngine.destroy()

声网 & 即构音视频通话时序图如下

PS: 图片来自各厂商官网

通过实战接入了即构跟声网 sdk, 两家厂商接入流程差别不大各有劣势，总结如下：

证书鉴权方面： agroa 在退出频道时，必须要携带 token 进行验证；而 zego 如果须要 token 校验的话，在 ZegoRoomConfig 进行配置即可，这样的解决更加人性化，不便开发者疾速集成和测试
音视频 流 概念上： zego 和 agroa 自身其实都具备流的概念，只是 zego 会把流的概念也抛给客户，而 agroa 是将流的概念以一种隐式的概念存在于 API 中，不间接向用户抛出流的概念，概念上 agroa 的 SDK 会比拟人性化，比拟好了解。而分明了即构流概念后，对音视频场景的搭建在技术架构的了解上更加透彻。
推拉流 概念上： agroa 退出频道时默认主动推拉流，因为没有抛出流的概念，在同一个频道的其余用户都会被以 uid 作为惟一标识拉流，而 zego 登陆房间后进行手动拉流，抛出流的概念间接对单条流进行管制；在逻辑上扩展性更高，在实现简单业务逻辑时也更加不便。

厂商的产品架构决定了其计划的拓展性，拓展性强的计划能够晋升开发效率，节约开发成本。开发者在选型需关注厂商的产品架构，上下游生态链。目前当先的实时互动云服务厂商声网和即构有都有较完整的产品架构和健全的上下游生态链，通过提供丰盛的实时互动 API、性能组件及插件等，帮忙开发者及企业客户轻松搭建各类实时互动场景利用。

如以下产品架构图看，声网和即构以 RTC Paas 为外围业务，并逐渐拓展构建音视频产品矩阵。第三方生态建设上看，即构提供：AI 视觉、内容审核、第三方云厂商、语音转文字、正版版权音乐等服务，声网通过云市场提供：视频特效、语音转文字、内容审核等插件。

即构和声网的产品架构图

6.2 场景笼罩和头部用户

解决方案成熟度还需思考利用场景拓展和头部客户笼罩，随着音视频的迅猛发展，实时音视频已在各行各业有所利用。同时也对音视频厂商提出了更高的要求，如何升高搭建场景化利用的门槛，助力开发者疾速搭建实时互动场景的利用。

以即构为例，即构提供灵便、即接即用的模块化产品组合，以及疾速、可视化、低代码的接入计划，开发者 / 企业可依据理论业务场景需要进行灵便组合。正因如此，即构赋能泛娱乐、在线教育、视频会议、游戏竞技、近程医疗、物联网 IOT、线上金融、政企服务等二十余行业赛道的 100 多种场景。

声网行业场景笼罩

即构行业场景笼罩

社交娱乐场景

	腾讯云	即构	声网
场景解决方案	语聊房、秀场直播、Web 互动直播、语音电台、在线 K 歌、相亲房、小程序直播	语聊房、秀场直播、在线 KTV、社交 + 小游戏、视频相亲、在线健身、互动播客、FM 电台	在线 K 歌房、直播、社交、游戏、电商、声动语聊
场景劣势	反对跨房间 PK、超低提早、智能美颜	反对连麦、玩乐、直播等娱乐玩法。超低提早、数量最多的正版曲库、行业首家反对实时独唱、美颜美声	实时连麦、百万人大频道、高品质音视频、无感切屏
客户案例	他趣、全民 K 歌、唱吧、微光	映客直播、咪咕、Soul、TT 语音、喜马拉雅、乐逗游戏	MOMO、Meet me

在线教育场景

	腾讯云	即构	声网
场景解决方案	互动大班课、互动小班课、AI 课程	1V1 在线教学、AI 课堂、双师课堂、超级小班、小班课、在线自习室、互动大班课等。	职业 & 成人教育、素质教育、K12 教育、教育信息化
场景劣势	反对屏幕共享、互动白板、录制回放等性能	丰盛的课堂模式，齐全的利用插件。百万大房间、屏幕共享、文件共享、互动白板、录制回放	反对互动白板、屏幕共享、实时音讯、实时录制、书面语测评等性能
客户案例	智学网、腾讯教育、新东方	好将来、作业帮、掌门 1 对 1、英语流畅说	新东方

随着实时音视频的倒退，人们对于实时互动的要求越来越高，不再满足于根本的交换通信。音视频技术的倒退演变使得实时互动在实时性、沉迷式上的体现一直晋升，为元宇宙带来了更多设想空间。

元宇宙 虚拟世界场景

通过官网比照各厂商的元宇宙解决方案，即构的元宇宙布局更深刻，投入大量技术资源自研 Avatar 虚构形象、Meta World 虚拟世界两大虚构产品，联合即构弱小的音视频技术，可帮忙开发者疾速落地多人元宇宙场景。

	腾讯云	即构	声网
场景解决方案	虚构会议、虚构展览、虚构演唱会、虚拟人电商直播、虚构赛事、虚构互动游戏	虚构直播、虚构 K 歌房、虚构语聊房、虚构会议、虚构演唱会	元语聊、元直播、互动游戏
场景劣势	虚构多人场景、弹幕互动、动捕驱动、虚构展览场景抉择	自研 Avatar 虚构形象、Meta World 虚拟世界等虚构产品。提供 Q 版、二次元、动漫、拟人等多元化格调虚构形象，以及丰盛的服装、妆容素材库。零门槛渲染 3D 场景，半天可疾速实现虚构场景，灵便天然的人物管制与场景交互。还提供 3D 空间音效、范畴语音、万人实时状态同步等特色的音视频性能，以及丰盛易用的标准化组件。	3D 场景 + 虚构形象、3D 空间音频、媒体播放器组件、捏脸与换妆编辑组件、实时面部捕抓。
客户案例	官网暂未查问到	小西米语音（语聊房应用了即构最新公布的 Q 版格调 Avatar 虚构形象，让用户能够自定义本人的格调形象）	官网暂未查问到

即构元宇宙解决方案（来自即构官网 https://www.zego.im/）

因各大厂商直播 SDK 计费模式较多且差别不大，下边列举局部直播 SDK 厂商的报价供参考，大家可依据业务需要进行抉择。同时提供厂商官网地址，有任何价格相干疑难可间接征询官网。

阿里云

官网地址：https://helpcdn.aliyun.com

CDN 直播

1、按量后付费模式

1.1 按应用流量计费

按不同区域应用的流量阶梯价格计费，当月别离超额累进（以天然月为一个累计周期，下个月主动清零从新累积）。定价受区域和带宽阶梯影响。

流量阶梯（计费单位：元 /GB）	中国边疆 -CN	北美 -NA	欧洲 -EU	亚太 1 区 -AP1	亚太 2 区 -AP2	亚太 3 区 -AP3	中东非洲 -MEAA	南美 -SA
0~10 TB（含）	0.528	0.92	0.92	1.58	1.7	1.7	2.62	2.62
10 TB~50 TB（含）	0.506	0.92	0.92	1.58	1.7	1.7	2.62	2.62
50 TB~100 TB（含）	0.462	0.78	0.78	1.32	1.44	1.44	2.36	2.36
100 TB~1 PB（含）	0.396	0.4	0.4	1.04	1.32	1.24	1.96	1.84
大于 1 PB	0.33	0.32	0.32	0.92	1.18	1.18	1.84	1.7

1.2 按峰值带宽计费

以当日您直播观看区域所在节点，直播减速服务别离产生的带宽最高值（单位 Mbps）为结算规范。定价受区域和带宽阶梯影响。

带宽阶梯（计费单位：元 /Mbps/ 天）	中国边疆 -CN	北美 -NA	欧洲 -EU	亚太 1 区 -AP1	亚太 2 区 -AP2	亚太 3 区 -AP3	中东非洲 -MEAA	南美 -SA
0~500 Mbps（含）	1.32	3.28	3.28	6.56	7.88	7.88	11.82	10.64
500 Mbps~5 Gbps（含）	1.276	3.02	3.02	6.3	7.62	7.62	11.54	10.36
5 Gbps~20 Gbps（含）	1.232	2.76	2.76	6.04	7.34	7.34	11.28	10.1
大于 20Gbps	1.188	2.62	2.62	5.9	7.22	7.22	11.16	9.98

即构科技

官网网址：<https://www.zego.im/>

收费额度：每月收费应用 10000 分钟，不超过完全免费，超过局部独自计算：

优惠活动：惯例优惠为官网报价的 5%-15%，赶上大促局部产品折扣力度十分大低至 1 折起，亲测购买音视频产品组合套餐包更划算。👉即构七周年大促

值得一提的是，即构的官网自助服务流程体验最好，也是目前惟一开明自助服务全流程的音视频厂商，实现了开发者 SDK 集成闭环流程，从服务配置到账户充值以及账号查问，皆可在即构官网在线自助实现，大大晋升开发者开发效率。比方服务配置环节，自助开明秒级失效。账户充值反对应用微信、支付宝、网银等在线充值。合同签订可线上实现。

1. 实时音视频 RTC

用量统计形式：依照用户理论拉取音视频流的时长来统计实时音视频服务的用量。

计费档位	计费类型	档位阐明	价格（元 / 千分钟）
高音质纯音频	时长	纯音频	7
标清视频（SD）	时长	分辨率 ≤ 360P（480 x 360）	12
高清视频（HD）	时长	360P < 分辨率 ≤ 720P（1280 × 720）	25
超清视频（HD+）	时长	720P < 分辨率 ≤ 1080P（1920 × 1080）	98
超清视频（2K）	时长	1080P < 分辨率 ≤ 1440P（2560 × 1440）	112

为便于开发者更好的了解计费模式，即构官网贴上对应产品的计费示例：

计费示例： 即构实时音视频 RTC

以多路视频互动房间为例 https://doc-zh.zego.im/article/8666

2.CDN 直播

用量统计形式：CDN 目前默认为后付费按量计费，并提供两种计费类型：带宽计费和流量计费，您可依据本身业务状态，抉择适宜的计费模式。

服务定价
计费档位	计费类型	档位阐明	价格
(0Mbps,500Mbps]	带宽	月峰值带宽	26 元 /Mbps/ 月
(500Mbps,2Gbps]	带宽	月峰值带宽	24 元 /Mbps/ 月
(2Gbps,∞]	带宽	月峰值带宽	22 元 /Mbps/ 月
不辨别阶梯用量	流量	拉流累计	0.5 元 /GB

计费示例

即构 CDN 直播：https://doc-zh.zego.im/article/14091

音视频产品依据提早性分为实时音视频 RTC、低提早直播和 CDN 直播，直播场景中直播连麦 /PK 玩法对互动同步性要求高，个别应用实时音视频 RTC 能力。音视频厂商实时音视频 RTC 长距离端对端传输时延均匀 300ms～400ms 左右，即构实时音视频 RTC 做到了端到端时延最低 79ms，媲美事实的音视频体验。

直播场景中观众大规模并发个别应用 CDN 直播，格子各厂商 CDN 直播提早较大在 3S 左右、抗弱网能力差容易卡顿。

基于此，即构推出超低提早直播产品，连续了实时音视频的品质劣势，复用了即构的海量数据散发网络和自研传输协定，最高可抗 80% 丢包，并实现了 600ms 的提早，实用于电商直播、网络较差的出海音视频等场景。

3. 超低提早直播

用量统计形式：目前默认为后付费按量计费，依照用户理论拉取音视频流的时长来统计超低提早直播服务的用量。

服务定价

计费档位	计费类型	档位阐明	价格（元 / 千分钟）
高音质纯音频	时长	纯音频	4
标清视频（SD）	时长	分辨率 ≤ 360P（480 x 360）	7
高清视频（HD）	时长	360P < 分辨率 ≤ 720P（1280 × 720）	14.5
超清视频（HD+）	时长	720P < 分辨率 ≤ 1080P（1920 × 1080）	57

计费示例：

即构超低提早直播 https://doc-zh.zego.im/article/14712

声网

官网网址：https://www.agora.io/

1. 交融 CDN 直播

流量阶梯单价：下表列出各个流量阶梯下每个地区的流量单价，价格单位：元 /GB。

服务定价
月度总流量 (GB)	中国边疆	北美	欧洲	亚太 1 区	亚太 2 区	大洋洲	中东非洲	南美
0 – 10,000	0.25	0.48	0.48	0.48	0.73	0.96	0.73	0.73
10,000 (含）- 50,000	0.23	0.46	0.46	0.46	0.69	0.92	0.69	0.69
50,000 (含）- 100,000	0.21	0.42	0.42	0.42	0.63	0.84	0.63	0.63
100,000 (含）- 1,000,000	0.19	0.38	0.38	0.38	0.57	0.76	0.57	0.57
大于 1,000,000	0.16	0.32	0.32	0.32	0.48	0.64	0.48	0.48

2. 实时音视频

声网音视频时长用量的单价如下：

用量类型	计费类型	档位阐明	单价（元 / 千分钟）
音频	时长	纯音频	7
高清视频（HD）	时长	汇合分辨率 ≤ 921,600（1280 × 720）	28
全高清视频（Full HD）	时长	921,600（1280 × 720）< 汇合分辨率 ≤ 2,073,600（1920 × 1080）	63
2K 视频	时长	2,073,600 (1920 × 1080) < 汇合分辨率 ≤ 3,686,400（2560 × 1440）	112
2K+ 视频	时长	3,686,400（2560 × 1440）< 汇合分辨率 ≤ 8,847,360（4096 × 2160）	252

网易云信

官网地址：https://netease.im

直播服务计费项由两局部组成：日峰值带宽费 + 增值服务费（可选）

1. 一般直播

服务定价
一般直播	日峰值带宽	0.6 元 / Mbps / 日
计费规定：当日应用一般直播服务产生的上下行带宽之和峰值计费（单位：Mbps），如有海内需要可征询客户经理计费周期：按日计费举例：当日峰值带宽为 900 Mbps，则对应日带宽计费为 900 * 0.6 = 540 元

2. 实时音视频

计费单价依据单个用户订阅的汇合分辨率来计算，汇合分辨率指用户订阅的所有视频流的分辨率之和。更多计费单价相干介绍请参考资费阐明。

媒体	计费模式	规格	单价
音频	时长	规范语音规格	5.9 元 / 千分钟
视频 SD 单价	时长	汇合分辨率 ≤ 307,200(640 × 480)	15 元 / 千分钟
视频 HD 单价	时长	307,200(640 × 480) < 汇合分辨率 ≤ 921,600(1280 × 720)	25 元 / 千分钟
视频 HD+ 单价	时长	汇合分辨率 > 921,600(1280 × 720)	90 元 / 千分钟

用 ChatGPT 的答复来完结这篇文章吧。ChatGPT 倡议为了选型适宜的实时音视频 / 直播 SDK，开发者首先：需明确业务利用的需要，确定性能和性能指标的需要。其次调研市场上可用的直播 SDK 并进行性能、性能等个性的评估比照，最好能亲自应用测试用例进行验证确保所选音视频 SDK 满足其需要。

文中提到的厂商都有收费试用额度供开发者测试，感兴趣的可自行到官网征询。

即构：https://www.zego.im/

声网：https://docs.agora.io/

腾讯云：https://cloud.tencent.com/

关于直播:我用chatGPT做直播技术选型卷死了同事

摘要

前言

一、自研还是第三方服务？

二、如何选型？

三、好的 SDK 的衡量标准？

四、产品性能生态的完整性

五、技术指标强弱

六、解决方案成熟度

七、应用老本

结语