随着 Sora 现已在 ChatGPT 中上线,你可以仅凭文字描述生成逼真、栩栩如生的真人视频。这些视频视觉效果惊艳——但它们是无声的。
为了让 AI 生成的人物真正“开口说话”,你可以将视频导入 AI Studios,将其转换成能够说话、做表情并根据脚本演绎内容的自定义数字虚拟人(Avatar),支持 80 多种语言。
以下是将 Sora 生成的角色变成可重复使用、带声音的 AI 虚拟人的完整步骤——非常适合无露脸内容、教程视频或社交媒体创作。

步骤 1:使用 Sora 生成无声人物视频
在 ChatGPT 中启动 Sora,编写一个描述角色和场景的提示词。
例如:
“一位三十多岁、专业又温暖的女性,坐在办公桌前,穿着休闲商务装。她带着友善的表情直视镜头,双手自然做轻微的手势,看起来像在说话。背景为中性色,光线柔和。”
Sora 将根据描述生成一段逼真的短视频。人物看起来像在说话,但不会发出任何声音。
生成完成后,下载视频——这将作为你自定义虚拟人的视觉素材。
步骤 2:将 Sora 视频上传到 AI Studios 创建自定义虚拟人
进入 AI Studios,打开“自定义虚拟人(Custom Avatar)”功能,上传刚刚生成的 Sora 视频。
AI Studios 会分析脸部特征、表情和动作,并将其转换成可完全动画化、可重复使用的虚拟人。
从此以后,你可以为这个虚拟人赋予 任意声音、任意语言和任意脚本,无需再次制作视频。
对于想要一个品牌化、人性化且无需出镜的虚拟主持人来说,这是完美选择。
步骤 3:在 AI Studios 中添加声音、脚本和语言
虚拟人创建完成后,你可以使用 AI Studios 的内置功能让它开口说话。
你可以:
- 输入或粘贴你的脚本
- 从 200 多种自然风格的 AI 声音中任意选择(也可上传并克隆你自己的声音)
- 自动将生成的语音与虚拟人的口型同步
步骤 4:在不同的 AI Studios 项目中使用你的虚拟人
你的新虚拟人可以作为主持人,出现在 AI Studios 的各种功能中:
- 文本生成视频(Text to Video): 将文章或脚本转换为带旁白的视频
- 关键词生成短视频(Topic to Video): 根据关键词生成短内容
- 网页生成视频(URL to Video): 将网页内容转成讲解视频
- 或者从零开始制作视频!
你的虚拟人将成为多语言、多场景的视频制作工具,可用于 YouTube、培训内容、数字销售等更多应用。
什么是 Sora?
Sora 是 OpenAI 开发的文本生成视频模型,它能将文字描述转换为逼真、高质量的视频画面。
虽然 Sora 不会生成声音或对话,但它非常适合无需拍摄即可获得逼真画面的场景。
什么是 AI Studios?
DeepBrain AI 推出的 AI Studios 是一款由 AI 驱动的视频制作平台,可将文字转换为带旁白的完整视频,并支持数字虚拟人技术。
平台支持自定义虚拟人、80 多种语言的 AI 语音,以及翻译、配音、自动视频生成等功能。
它适用于创作者、营销人员、教育工作者等需要无需拍摄即可制作专业视频的人群。
Sora 与 AI Studios 如何互补?
Sora 和 AI Studios 是完美的组合,因为它们能够互相弥补对方的不足。
- Sora 提供逼真的视觉画面,但无音频
- AI Studios 提供声音、语言和脚本呈现
两者结合,让你无需拍摄、无需录音即可制作完整的专业 AI 视频。
总结
Sora 能生成逼真的视频,但不会生成声音。
这正是 AI Studios 发挥作用的地方。
将 Sora 的高逼真视觉视频与 AI Studios 的语音与动画功能结合,你可以轻松打造会说话的数字虚拟人,为你的内容制作提供无限可能——完全无需上镜。
从 ChatGPT 开始,在 Sora 中赋予人物形象,再让 AI Studios 使它开口说话。
