2025/06/27 16:17:14

自定义视频采集

自定义视频采集是指通过自定义的视频采集源实现对视频流的采集。

与 SDK 默认的视频采集方式不同，自定义视频采集支持用户自行控制采集源，实现更加精细的视频属性调整。例如，支持通过高清摄像头、无人机摄像头或其他类型的摄像头实现视频采集，同时支持动态调整视频质量、分辨率和帧率等参数，以适应不同的应用场景和需求。

声网推荐优先使用更为稳定、可靠、集成维护难度低的 SDK 视频采集，如果你有特定的视频采集需求或无法使用 SDK 采集，那么自定义视频采集为你提供灵活、可定制的方案。

技术原理

声网 SDK 提供自定义视频轨道方式实现视频自采集。你可以创建一个或多个自定义视频轨道，加入频道并在每个频道中发布已创建的视频轨道。你需要使用自采集模块驱动采集设备对视频进行采集，并将采集的视频帧通过视频轨道发送给 SDK。

下图展示在单频道和多频道中实现自定义视频采集时，视频数据的传输过程：

仅在一个频道内发布自采集视频流：

在多个频道内发布不同的自采集视频流：

前提条件

在进行操作之前，请确保你已经在项目中实现了基本的实时音视频功能，详见实现音视频互动。

实现自定义视频采集

参考下图调用时序，在你的 App 中实现自定义视频采集：

参考如下步骤，在你的 App 中实现自定义视频采集功能：

1. 创建自定义视频轨道

初始化 IRtcEngine 后，调用 createCustomVideoTrack 创建自定义视频轨道并获得视频轨道 ID。根据场景需要，你可以创建多个自定义视频轨道。

C++
// 如需创建多个自定义视频轨道，可以多次调用 createCustomVideoTrack
int videoTrackId = m_rtcEngine->createCustomVideoTrack();
m_trackVideoTrackIds[trackIndex] = videoTrackId;

2. 加入频道并发布自定义视频轨道

调用 joinChannel[2/2] 加入频道，或调用 joinChannelEx 加入多频道，在每个频道的 ChannelMediaOptions 中，将 customVideoTrackId 参数设置为步骤 1 中获得的视频轨道 ID，并将 publishCustomVideoTrack 设置为 true，即可在频道中发布指定的自定义视频轨道。

加入单频道：

C++
ChannelMediaOptions mediaOptions;
mediaOptions.clientRoleType = CLIENT_ROLE_BROADCASTER;
// 发布自采集视频流
mediaOptions.publishCustomVideoTrack = true;
mediaOptions.autoSubscribeVideo = false;
mediaOptions.autoSubscribeAudio = false;
// 设置自定义视频轨道 ID
mediaOptions.customVideoTrackId = videoTrackId;
// 加入频道
int ret = m_rtcEngine->joinChannel(APP_TOKEN, szChannelId.data(), 0, mediaOptions);

加入多频道：

C++
int uid = 10001 + trackIndex;
m_trackUids[trackIndex] = uid;
m_trackConnections[trackIndex].channelId = m_strChannel.c_str();
m_trackConnections[trackIndex].localUid = uid;
m_trackEventHandlers[trackIndex].SetId(trackIndex + 1);
m_trackEventHandlers[trackIndex].SetMsgReceiver(m_hWnd);

// 如需在多个频道发布自定义视频轨道，则需要多次设置 ChannelMediaOptions 并多次调用 joinChannelEx
ChannelMediaOptions mediaOptions;
mediaOptions.clientRoleType = CLIENT_ROLE_BROADCASTER;
// 发布自采集视频流
mediaOptions.publishCustomVideoTrack = true;
mediaOptions.autoSubscribeVideo = false;
mediaOptions.autoSubscribeAudio = false;
// 设置自定义视频轨道 ID
mediaOptions.customVideoTrackId = videoTrackId;
// 或加入多频道
int ret = m_rtcEngine->joinChannelEx(APP_TOKEN, m_trackConnections[trackIndex], mediaOptions, &m_trackEventHandlers[trackIndex]);

3. 实现自采集模块

声网提供 YUVReader.cpp 和 YUVReader.h 演示从本地文件读取 YUV 格式的视频数据。在实际的生产环境中，你需要结合业务需求为你的采集设备创建自定义视频采集模块。

C++
// 通过自定义的 YUVReader 类，在 YUVReader 线程中不断读取 YUV 格式视频数据并将数据传递给 OnYUVRead 回调函数进行后续处理
m_yuvReaderHandlers[trackIndex].Setup(m_rtcEngine, m_mediaEngine.get(), videoTrackId);
m_yuvReaders[trackIndex].start(std::bind(&MultiVideoSourceTracksYUVReaderHander::OnYUVRead, m_yuvReaderHandlers[trackIndex], std::placeholders::_1, std::placeholders::_2, std::placeholders::_3, std::placeholders::_4));

4. 通过视频轨道推送视频数据到 SDK

调用 pushVideoFrame 将采集到的视频帧通过视频轨道推送至 SDK。其中， videoTrackId 要与步骤 2 加入频道时指定视频轨道 ID 一致，videoFrame 中可以设置视频帧的像素格式、数据类型和时间戳等参数。

信息

以下代码演示将 YUV 格式转换为 I420 格式的原始视频数据。声网视频自采集还支持推送其他格式的外部视频帧，详见 VIDEO_PIXEL_FORMAT。
为确保音视频同步，声网建议你将 videoFrame 的时间戳参数设置为系统 Monotonic Time。你可以调用 getCurrentMonotonicTimeInMs 获取当前的 Monotonic Time。

C++
void MultiVideoSourceTracksYUVReaderHander::OnYUVRead(int width, int height,
                                                      unsigned char *buffer,
                                                      int size) {
    if (m_mediaEngine == nullptr || m_rtcEngine == nullptr) {
        return;
    }
    // 设置视频像素格式为 I420
    m_videoFrame.format = agora::media::base::VIDEO_PIXEL_I420;
    // 设置视频数据类型为原始数据
    m_videoFrame.type = agora::media::base::ExternalVideoFrame::
        VIDEO_BUFFER_TYPE::VIDEO_BUFFER_RAW_DATA;
    // 将采集到的 YUV 视频数据的宽、高、缓冲区传给 videoFrame
    m_videoFrame.height = height;
    m_videoFrame.stride = width;
    m_videoFrame.buffer = buffer;
    // 获取 SDK 当前的 Monotonic Time 并赋值给 videoFrame 的时间戳参数
    m_videoFrame.timestamp = m_rtcEngine->getCurrentMonotonicTimeInMs();
    // 推送视频帧至 SDK
    m_mediaEngine->pushVideoFrame(&m_videoFrame, m_videoTrackId);
}

5. 销毁自定义视频轨道并离开频道

如果你需要停止发布自定义采集的视频，调用 destroyCustomVideoTrack 销毁视频轨道。如需销毁多个视频轨道，可多次调用 destroyCustomVideoTrack。

C++
// 停止视频数据的自采集
m_yuvReaders[trackIndex].stop();
m_yuvReaderHandlers[trackIndex].Release();
// 销毁自定义视频轨道
m_rtcEngine->destroyCustomVideoTrack(m_trackVideoTrackIds[trackIndex]);
// 离开频道
m_rtcEngine->leaveChannelEx(m_trackConnections[trackIndex]);

参考信息

适用场景

你可以在多种行业的多种场景下使用到自定义视频采集：

视频特殊处理和增强

在某些游戏或虚拟现实应用中，需要对视频流进行实时的特效处理、滤镜处理或其他增强效果。在这种情况下，使用自定义视频采集可以直接获取原始视频流，并进行实时处理，从而实现更加逼真的游戏或虚拟现实效果。

高精度视频采集

在视频监控领域，需要对场景中的细节进行精细的观察和分析，此时使用自定义视频采集可以获得更高的图像质量和更精细的采集控制。

特定视频源采集

在 IoT、直播等行业需要使用特定的摄像头、监控设备或其他非摄像头设备视频源，例如视频捕捉卡、录屏数据等。在这种情况下，使用 SDK 内部采集可能无法满足需求，必须使用自定义视频采集来实现对特定视频源的采集。

与特定设备或第三方应用无缝对接

在智能家居或物联网领域，需要将设备中的视频传输到用户的手机或电脑上进行监控和控制，此时可能需要使用特定的设备或应用程序进行视频采集。在这种情况下，使用自定义视频采集可以方便地将特定设备或应用程序与 RTC SDK 进行对接。

特定的视频编码格式

在特定直播场景中，可能需要使用特定的视频编码格式来满足业务需求，此时使用 SDK 内部采集可能无法满足需求，必须使用自定义视频采集来实现对特定编码格式视频的采集和自定义编码。

优势介绍

使用自定义视频采集，你可以体验到：

更灵活的视频特效

自定义视频采集功能可以帮助用户实现更丰富、更个性化的视频特效和过滤器，从而提高用户的体验和应用程序的吸引力。用户可以通过自定义视频采集功能实现各种特效，如美颜、滤镜、动态贴纸等。

更适应各种场景的需求

自定义视频采集功能可以帮助应用程序更好地适应各种场景的需求，如直播、视频会议、在线教育等。用户可以根据不同的场景需求，定制不同的视频采集方案，从而提供适应性更强的应用程序。

注意事项

如果采集到的自定义视频格式为 Texture，并且远端用户看到的自定义采集视频画面出现闪烁、失真等异常情况时，建议先复制视频数据，再将原始视频数据和复制的视频数据发回至 SDK，从而消除内部数据编码过程中出现的异常情况。

示例项目

声网提供了开源的视频自采集示例项目供你参考，你可以前往下载或查看其中的源代码。

MultiVideoSourceTracks

自定义视频采集

技术原理

前提条件

实现自定义视频采集

1. 创建自定义视频轨道

2. 加入频道并发布自定义视频轨道

3. 实现自采集模块

4. 通过视频轨道推送视频数据到 SDK

5. 销毁自定义视频轨道并离开频道

参考信息

适用场景

视频特殊处理和增强

高精度视频采集

特定视频源采集

与特定设备或第三方应用无缝对接

特定的视频编码格式

优势介绍

更多类型的视频流

更灵活的视频特效

更适应各种场景的需求

注意事项

示例项目

API 参考

技术原理​

前提条件​

实现自定义视频采集​

1. 创建自定义视频轨道​

2. 加入频道并发布自定义视频轨道​

3. 实现自采集模块​

4. 通过视频轨道推送视频数据到 SDK​

5. 销毁自定义视频轨道并离开频道​

参考信息​

适用场景​

视频特殊处理和增强​

高精度视频采集​

特定视频源采集​

与特定设备或第三方应用无缝对接​

特定的视频编码格式​

优势介绍​

更多类型的视频流​

更灵活的视频特效​

更适应各种场景的需求​

注意事项​

示例项目​

API 参考​

技术原理

前提条件

实现自定义视频采集

1. 创建自定义视频轨道

2. 加入频道并发布自定义视频轨道

3. 实现自采集模块

4. 通过视频轨道推送视频数据到 SDK

5. 销毁自定义视频轨道并离开频道

参考信息

适用场景

视频特殊处理和增强

高精度视频采集

特定视频源采集

与特定设备或第三方应用无缝对接

特定的视频编码格式

优势介绍

更多类型的视频流

更灵活的视频特效

更适应各种场景的需求

注意事项

示例项目

API 参考