发版说明
v1.0 GA
该版本于 2025 年 3 月 5 日发布。
声网对话式 AI 引擎于 2025 年 3 月 5 日正式 GA 发布,并公布了产品定价:声网对话式 AI 引擎的计费规则,详见计费说明。
为了取得最好的对话体验效果,新版本声网对话式 AI 引擎建议与以下声网 SDK 搭配使用:
- 声网 RTC Native SDK,v4.5.1 及以上版本
- 声网 RTC Web SDK,4.23.2 及以上版本
- 声网 RTSA C SDK,1.9.x 及以上版本
自该版本起,声网提供开源的字幕处理模块,你只需要将模块集成到项目中,并调用模块的 API 即可快速实现实时字幕功能,将用户与智能体的对话内容实时以文本输出并显示到终端界面上,详见实时字幕。
该版本新增对话式 AI 引擎消息通知服务,你可以在声网控制台设置消息通知服务地址,订阅智能体创建、停止或出错事件。当订阅的事件发生时,声网会调用你设置的回调地址,将事件详情发送至你的业务服务器。详见消息通知服务。
该版本新增热词功能,添加热词可以显著提升对话式 AI 引擎在专有词汇上的识别准确率。目前该功能处于 Beta 发布阶段,请联系技术支持开通。
v1.0 Public Beta
该版本于 2025 年 2 月 18 日发布。本次发版聚焦于提供自然流畅、低延迟、高可靠的实时语音对话能力,助力开发者快速构建智能化、沉浸式的交互体验。
- 为了取得最好的对话体验效果,已联系声网技术支持获取指定版本的实时互动 SDK。
- 目前仅支持使用中文和英文与 AI 互动,其他语种需求联系技术支持反馈。
- 目前单一 App ID 的并发用户数 (Peak Concurrent Users) 限制为 20, 如需提升配额,请联系技术支持申请。
支持与 AI 进行自然流畅的实时语音对话,如同与真人交流,提供低延迟、极速响应的交互体验。
SDK 会智能识别和消除背景噪音,即使在嘈杂的公共场所,都能够确保声音传输的清晰度,为用户提供高质量的对话体验。
智能抑制背景人声,精准保留对话人清晰语音,确保在多人声环境中仍能实现清晰、专注的交互体验。
支持用户随时打断 AI 并快速响应,实现自然过渡和流畅对话,避免机械式交互。
针对与 AI 智能体对话场景优化的传输算法,支持在弱网环境(如 80% 丢包率)下仍能稳定传输语音数据,确保对话的连续性和可靠性,适应多样化的复杂网络环境。
支持全球主流的 LLM(大语言模型)、TTS(语音合成) 适配,快速实现灵活编排,满足不同场景和业务需求,提供高度定制化的 AI 智能体对话解决方案。
支持用户与 AI 智能体的对话内容实时以文本输出并显示到终端界面上。
支持 iOS、Android、Web、 小程序、以及各类嵌入式硬件等客户端,提供跨平台的一致性和无缝集成体验,满足不同场景的应用需求。