2025/04/28 11:44:16

使用说明

本文介绍如何在你的项目中集成和使用大饼 AI 变声插件。

技术原理

大饼 AI 变声插件是对实时 AI 声音转换核心 API 的封装。通过声网 SDK v4.x 提供的 setExtensionProperty 方法，传入指定的 key 和 value 参数，你可以快速集成格子互动的实时 AI 声音转换能力。

setExtensionProperty 方法的 key 参数与格子互动的 API 名称完全对应，value 参数以 JSON 格式包装该 API 的部分或全部参数。因此，调用该方法时只要传入指定的 key 和 value，就可以调用对应的格子互动 API，实现实时 AI 声音转换的有关功能。

前提条件

Android 开发环境需满足以下要求：

Android Studio 以上版本。
运行 Android 或以上版本的真机（非模拟器）。

示例项目

大饼 AI 变声插件提供了一个 GitHub 示例项目，你可以前往克隆或下载并进行体验。

平台	语言	示例项目
Android	Kotlin	https://github.com/Dubbing-AI-Voice-Changer/DubbingAgoraDemo/tree/main/Android
iOS	Objective-C	https://github.com/Dubbing-AI-Voice-Changer/DubbingAgoraDemo/tree/main/iOS

具体步骤如下：

克隆仓库：

Shell

git clone https://github.com/Dubbing-AI-Voice-Changer/DubbingAgoraDemo.git

参考仓库的 README.md 文件完成后续步骤。

集成和调用流程

本节介绍如何集成声网 SDK 和插件，并调用核心 API 实现变声功能。

1. 集成 SDK 和插件

开始前，你需要在项目中分别集成声网音频 SDK 和大饼 AI 变声插件。

1.1 集成声网音频 SDK

大饼 AI 变声插件需要与声网音频 SDK v4.x 搭配使用。参考以下文档集成音频 SDK v4.x 并实现基础的语音通话：

实现语音通话

1.2 集成大饼 AI 变声插件

参考如下步骤在你的项目中集成大饼 AI 变声插件：

进入声网控制台 > 云市场页面，下载大饼 AI 变声插件的 Android 插件包。解压后，将所有 .aar 文件保存到项目文件夹的 /app/libs 路径。
获取以下资源文件并保存到项目文件夹的同一个目录（比如新建 vc_model 目录）：
- License 文件和音色文件：联系声网获取。其中音色文件的后缀名为 .dat，会根据 License 发放。
- 模型文件：根据示例项目 Readme 的说明下载所需资源。
打开 app/build.gradle 文件，在 dependencies 中添加如下行：
Java
```
implementation fileTree(dir: "libs", include: ["*.jar", "*.aar"])
```

1.3 升级插件

声网云市场推荐你更新插件版本前使用数据库工具 (如 SQLite) 来实现插件版本管理，从而确保插件版本与对应的资源包版本一致。因为当插件版本和资源包版本未对齐时，会出现 App 闪退、崩溃等现象。

以下是用 SQLite 来进行插件版本管理的示例：

使用 SQLite 数据库自行维护插件包和资源包的版本信息。
每次项目初始化时，自动检测当前项目使用的资源包版本：
- 如果无记录文件或记录的资源包版本为旧，则更新资源。成功更新后，回写最新资源包版本信息到 SQLite。
- 如果记录的资源包版本与当前匹配，则正常实现业务。

如果你的项目已经集成过声网云市场提供的第三方插件，并需要更新插件，可以参考以下步骤来保证更新后的可用性。

以下升级流程以相芯美颜特效插件为例：

参考集成插件章节下载所需平台最新版本的插件包和资源包。
删除项目内旧版本的插件包及其资源包后，再将新版插件和资源包放入对应位置。或者直接在对应目录下用新版插件和资源包替换旧版。
删除设备上用老版本插件和资源包编译的 App，重新编译你的项目并运行。

信息

编译 App 时，系统会优先使用连接设备上存在的资源包。请务必在删除旧版本应用程序后再进行编译和运行，否则可能会出现插件版本与资源包不匹配的情况，从而导致各种意外问题。

2. 启用插件

创建并初始化 RtcEngine 后，首先调用 enableExtension 启用插件，再调用其它 API（enableVideo、joinChannel 等）。

Kotlin
// 声明参数
private val EXTENSION_NAME = "dubbing_vc"
private val EXTENSION_VENDOR_NAME = "Dubbing"
private val EXTENSION_AUDIO_FILTER = "DubbingVC"

private val changeSpeaker_ = "changeSpeaker"
private val startRealTimeTranscribe_ = "startRealTimeTranscribe"
private val stopRealTimeTranscribe_ = "stopRealTimeTranscribe"
private val getSpeakersInfo_ = "getSpeakersInfo"

val config = RtcEngineConfig()
config.mContext = baseContext
config.mAppId = appId
config.mEventHandler = mRtcEventHandler
// 加载插件
config.addExtension(EXTENSION_NAME)
config.mExtensionObserver = extensionObserver
// 创建并初始化 RtcEngine
mRtcEngine = RtcEngine.create(config)
mRtcEngine.enableAudio()
// 启用插件
mRtcEngine.enableExtension(EXTENSION_VENDOR_NAME, EXTENSION_AUDIO_FILTER, enable)

3. 设置资源文件路径

在集成插件时，你已经将 License 文件、音色文件、模型文件保存在指定目录。这一步只需要传入这些资源文件所在路径：

Kotlin
val modelPath: String = "${context.filesDir}${File.separator}vc_model"

4. 获取音色列表

收到声网 SDK 的 onStarted 回调后，调用 getExtensionProperty，传入 key 为 getSpeakersInfo，获取音色列表：

Kotlin
val speakerList = mRtcEngine.getExtensionProperty(
    EXTENSION_VENDOR_NAME,
    EXTENSION_AUDIO_FILTER,
    getSpeakersInfo_
)
// 将 JSON 转换为数组
val arr = JSONArray(speakerList)

音色列表以 JSON 数据返回，你需要自行解析。

5. 开始变声

调用 setExtensionProperty 并传入对应的 key 和 value。

Kotlin
mRtcEngine.setExtensionProperty(
    EXTENSION_VENDOR_NAME,
    EXTENSION_AUDIO_FILTER,
    startRealTimeTranscribe_,
    "true"
)

6. 选择音色

传入第 4 步获取的音色列表中的音色 ID，即可设置成对应的音色：

Kotlin
mRtcEngine.setExtensionProperty(
    EXTENSION_VENDOR_NAME,
    EXTENSION_AUDIO_FILTER,
    changeSpeaker_,
    id
)

7. 停止变声

完成后调用 API 停止变声：

Kotlin
mRtcEngine.setExtensionProperty(
    EXTENSION_VENDOR_NAME,
    EXTENSION_AUDIO_FILTER,
    stopRealTimeTranscribe_,
    "true"
)

8. 释放资源

关闭插件，释放插件所占用的资源。

Kotlin
mRtcEngine.enableExtension(EXTENSION_VENDOR_NAME, EXTENSION_AUDIO_FILTER, false)

技术原理​

前提条件​

示例项目​

集成和调用流程​

1. 集成 SDK 和插件​

1.1 集成声网音频 SDK​

1.2 集成大饼 AI 变声插件​

1.3 升级插件​

2. 启用插件​

3. 设置资源文件路径​

4. 获取音色列表​

5. 开始变声​

6. 选择音色​

7. 停止变声​

8. 释放资源​

API 参考​