游戏|太空狼人杀火爆的背后 实时游戏语音有哪些技术难点?

?太空版狼人杀游戏《Among Us》在海外的爆红也已延伸到了国内 , 在国内App Store免费游戏榜 , 《Among Us》曾一度进入榜单Top5 , 国产太空版狼人杀游戏《狼人之间》《太空杀》也纷纷杀入App Store免费游戏榜、娱乐应用榜Top10 , 社交小游戏平台“玩吧”也在平台内推出了“太空杀”小游戏 , 一时间收到众多用户追捧 。
相比于传统的线上狼人杀游戏 , 太空狼人杀嵌入了科幻题材 , 核心玩法依然是坏人卧底在好人之中 , 双方通过语音、逻辑和演技的比拼 , 完成游戏的对抗 。 但相比传统狼人杀“开局全靠一张嘴 , 内容全靠编”的玩法 , 太空狼人杀增加了动作环节 , 玩家还需要操作角色移动 , 并完成解谜小游戏、暗杀好人、发现尸体召开紧急会议等 , 让游戏玩法变得更丰富、刺激 。

游戏|太空狼人杀火爆的背后 实时游戏语音有哪些技术难点?
图片
但值得一提的是 , 《Among Us》游戏本身并不具备实时语音功能 , 玩家只能通过游戏内的文字消息以及第三方的语音工具进行交流 , 对于狼人杀这类游戏而言 , 内置的实时游戏语音是必不可少的 , 不仅可以更快速、高效的进行游戏内沟通 , 还能通过精湛的语音演技忽悠对手 , 取得游戏胜利 。 而国产的太空狼人杀游戏则很好的弥补了这一点 , 均内置了实时语音 , 例如《太空杀》与“玩吧”平台就使用了由声网提供的实时游戏语音技术 。
声网拥有全球领先的实时游戏语音解决方案 , 通过在游戏内接入实时音视频 , 增加玩家沉浸感、社交感 , 《狼人杀》、《饭局狼人杀》、《Mobile Legends: Bang Bang》、《Yalla Ludo》等国内外知名的游戏均采用了声网的实时游戏语音解决方案 , 同时声网还与游戏引擎商Cocos、Unity 深度整合 , Agora 音视频SDK 已经上线 Unity asset store, 并集成于 Cocos creator , 方便开发者快速在游戏中加入实时音视频功能 。
今天我们重点展开介绍一下实时游戏语音背后的技术难点:
首先 , 我们先盘点一下在游戏内实时语音的场景下 , 经常会出现的一些问题:1、高延时 , 在与游戏队友语音沟通时出现较高的延时 , 队友讲话后两三秒才能听到 。 2、音质太差 , 甚至会有键盘声、风扇声、地铁或火车站内的各类噪音 , 听不清队友讲什么 。 3、有回声 , 跟游戏队友沟通能听到自己回声 。 4、声音卡顿 , 语音交流中出现卡顿 , 丢失关键信息 。 5、可用性低 , 在遇到游戏高峰期时段 , 并发太高 , 导致出现无声的情况 。
针对这些问题 , 声网的实时游戏语音解决方案是怎么解决这些技术问题的?
1、SD-RTN?打造超低延时、高质量、大规模铁三角最佳平衡
SD-RTN?是声网专为实时互动而创建的软件定义实时网 , 综合考量了不同地域特点、跨国跨洲链路质量、不同网络类型、不同终端类型、不同业务场景的特征 , 分别适配不同的传输控制策略 , 打造一张真正高可用、高可靠、高质量、超低延时的全球实时网络 , 即使在面对超大规模实时互动场景时 , 也能保证甚至优化音视频质量和延时 。
超低延时:SD-RTN?基于UDP的自研AUT协议 , 进一步在全局网络上进行了优化 , 避免了TCP的延时不可控缺点 , 保证交互的实时性 。 网络组织形式上 , SD-RTN?网络基于自定义路由 , 选择最优传输路径 , 直接将内容传输到对端 , 能够大大降低数据传输延时 , 可做到全球端到端网络延时小于400ms , 延时中位数76ms , 有效保障实时游戏语音中的超低延时 。
高并发:SD-RTN?在全球部署了250+数据中心 , 覆盖全球200多个国家与地区 , 在网络架构设计上能够应对10倍以上的负荷 , 具备千万级并发能力 , 通过对等部署、分区、隔离 , 确保骨干网络故障也能无缝切换;流量暴增时 , 架构实时调整 , 终端用户无感知 。 在游戏在线人数暴增的情况下 , 也能稳定的保障游戏内的实时语音对话 。 分页标题
高质量:99.9% 优质传输率 , SD-RTN?通过软件定义算法 , 利用公共互联网的共享带宽资源 , 多节点实时动态质量监控 , 实现低成本的专线级别质量 。
2、主流游戏引擎兼容
游戏开发者在开发游戏的过程中经常需要接入一些行业主流的游戏引擎 , 声网的音视频SDK深度兼容 Unity、Cocos、Unreal 等主流游戏引擎 , 帮助游戏开发者在接入游戏引擎的同时快速接入声网的音视频SDK 。
2019年1月 , 声网宣布与Cocos达成战略合作 , 在基于游戏引擎的合作上 , Cocos Creator服务面板将深度集成声网音视频SDK 。 与此同时 , 声网也在其自有的音视频SDK中深度集成Cocos小游戏平台项目 , 声网遍布全球的21万+开发者只需选择接入小游戏平台 , 就可以在其app中接入Cocos提供的对战类、休闲类及重度小游戏能力 。
2019年7月 , 声网也正式成为Unity官方认证合作伙伴 , 为游戏开发者提供实时音视频服务 。 开发者在使用Unity研发游戏的过程中 , 只需要选择开启声网SDK , 即可便捷、快速的在游戏内实现实时音视频开黑功能 , 只需四行代码 , 最快30分钟即可完成功能接入 。
3、游戏语音SDK小包体 , 低功耗
对于一些轻度的游戏开发者而言 , 在轻度游戏中加入游戏语音包可能会有影响游戏流畅性的风险 , 而声网专为游戏语音提供的 SDK 包拥有小包体、低功耗的特点 , 包体积、CPU 占用、内存占用、耗电量均小于业界平均水平 20% 以上 , 让玩家在各类游戏中实时互动的同时 , 仍然具有完美、流畅的游戏体验 。
4、全球领先的语音引擎打造卓越音质享受
在游戏语音中 , 高质量的音质无疑会让互动体验更佳 , 声网拥有全球领先的 Agora SOLO?、NOVA? 两大语音引擎 , 支持 48kHz 采样率的全频带采样 , 还原声音高保真度 , 音频 MoS 分高达 4.7 , 可为用户提供极致高清音质体验 。
5、丰富的美声、变声音效
在游戏语音高音质的基础上 , 声网还能提供丰富的美声音效 , 进一步提升声音的表现 , 达到声音美化或改变音色的效果 。 一方面 , 声网能提供媲美专业声卡、调音师的美声音效软件算法 , 摆脱专业设备和人员束缚 , 让你的声音更动听、更有趣 , 极大增强用户体验 , 丰富场景玩法 。 其次 , 声网拥有超 50 种实时美声音效 , 更有多种变声音效 , 例如小萝莉、小男孩、大叔、猪八戒、绿巨人等音效 , 让你在游戏中的语音更具趣味性 , 也为游戏语音场景提供更多新颖玩法 。
6、抗弱网传输与抗丢包算法
针对实时语音中经常出现的弱网传输、丢包等情况 , 声网也拥有一套抗弱网传输与抗丢包算法 。
声网作为实时互动行业的开创者 , 拥有多年的音视频技术沉淀 , 结合网络探测(如延时估计、带宽估计、丢包估计等)、抗丢包技术(如ARQ、FEC等)、自适应jitter buffer、网络拥塞控制策略等 , 实现70% 丢包下视频通话流畅、80% 丢包下语音通话流畅 。
7、听声辨位
玩过吃鸡的玩家一定有这样的体验 , 通过脚步声判断敌人是从哪个方位过来 , 这是游戏的音效 。
声网实时游戏语音解决方案同样也支持游戏听声辨位功能 , 适用于游戏开黑、游戏社交场景 , 通过听声辨位 , 玩家可通过对端玩家的声音知道该玩家所处的位置和环境情况 , 让游戏体验更具沉浸感 。
8、3A算法+AI降噪算法消除噪音与回声
声网拥有业界领先的 3A 算法 , 智能适应各类环境 , 全面消除回声 , 并提供超一流的双讲表现;可在不损伤语音音质的情况下 , 有效消除各类噪音;可实现音频的自动增益 , 即使在嘈杂环境下用户也能体验优异 。
针对游戏语音中经常出现的噪音 , 声网也拥有业界领先的AI降噪算法 。 为了实现良好降噪效果 , 需要解决如何实时人声和噪声分离以及如何保证人声保真度这两个降噪难题 。 声网Agora AI 降噪解决方案利用深度学习技术通过特征提取、神经网络以及增益调整对实时音频进行处理抑制噪声 , 突破了传统信号处理方案的性能瓶颈 , 从而为实时音视频提供清晰语音环境 。 分页标题
9、XLA体验质量保证
声网还为所有接入声网实时互动解决方案的客户提供业内首个体验质量标准XLA , XLA是声网基于用户的实时互动体验 , 率先设计并推出的首个实时互动质量指标体系及标准 , XLA包括面向开发者以及企业级客户的运维体验质量 , 同时也面向终端用户使用实时互动的体验质量 。
XLA主要包含四项体验指标:5s登陆成功率、600ms视频卡顿率、200ms音频卡顿率和400ms网络延时达标率 , 四个指标的月度达标率(1-不达标切片总时长/月度总时长)均需超过99.5% 。
声网还制定了明确的赔付标准 , 如有指标没有达标 , 声网将为企业客户进行赔付 。
10、开发难度低 , 开发者快速接入
声网的实时游戏语音解决方案不仅技术过硬 , 对开发者也非常友好 , 声网的SDK具备丰富灵活的API接口 , 并且调用逻辑清晰简单 , 只需四行代码、30分钟 , 开发者就可快速、便捷的接入音视频SDK , 以iOS为例:
sharedEngineWithappId//初始化
setChannelProfile//设置频道属性
joinChannelByKey//加入频道 , 开始通话
leaveChannel//离开频道 , 结束通话
不管是传统狼人杀、还是太空狼人杀 , 我们可以看到社交游戏的玩法正变得越来越新颖 , 各种创新的玩法层出不穷 , 而实时音视频技术服务商也需要不断精进自己的技术 , 为开发者与客户提供更契合市场发展 , 更稳定、更高质的实时互动解决方案 。
关于声网
声网 Agora 是实时互动 API 平台行业开创者 , 是全球领先的专业服务商 。 开发者只需简单调用 API , 即可在应用内构建多种实时音视频互动场景 。 声网 SDK 已经赋能社交直播、在线教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等 10 余行业 , 共计 100 多种场景 。 仅在 2020 年 3 月 , 声网 Agora 通过 10,000 多个活跃应用程序为 100 多个国家的终端用户提供超过 400 亿分钟的实时互动 。
声网的实时互动技术服务覆盖全球 200 多个国家和地区 , 并在当地提供技术和运营支持 。 使用声网服务的企业包括小米、陌陌、B站、斗鱼、新东方、晓黑板、完美世界(002624,股吧)、西山居、沐潼科技、The Meet Group、Bunch、Kumu等遍布全球的巨头、独角兽及创业企业 。
(责任编辑:张洋 HN080)