随着 Sora 现已在 ChatGPT 中上线，你可以仅凭文字描述生成逼真、栩栩如生的真人视频。这些视频视觉效果惊艳——但它们是无声的。

为了让 AI 生成的人物真正“开口说话”，你可以将视频导入 AI Studios，将其转换成能够说话、做表情并根据脚本演绎内容的自定义数字虚拟人（Avatar），支持 80 多种语言。

以下是将 Sora 生成的角色变成可重复使用、带声音的 AI 虚拟人的完整步骤——非常适合无露脸内容、教程视频或社交媒体创作。

‍

‍

步骤 1：使用 Sora 生成无声人物视频

在 ChatGPT 中启动 Sora，编写一个描述角色和场景的提示词。

例如：

“一位三十多岁、专业又温暖的女性，坐在办公桌前，穿着休闲商务装。她带着友善的表情直视镜头，双手自然做轻微的手势，看起来像在说话。背景为中性色，光线柔和。”

Sora 将根据描述生成一段逼真的短视频。人物看起来像在说话，但不会发出任何声音。

生成完成后，下载视频——这将作为你自定义虚拟人的视觉素材。

步骤 2：将 Sora 视频上传到 AI Studios 创建自定义虚拟人

进入 AI Studios，打开“自定义虚拟人（Custom Avatar）”功能，上传刚刚生成的 Sora 视频。

AI Studios 会分析脸部特征、表情和动作，并将其转换成可完全动画化、可重复使用的虚拟人。
从此以后，你可以为这个虚拟人赋予 任意声音、任意语言和任意脚本，无需再次制作视频。

对于想要一个品牌化、人性化且无需出镜的虚拟主持人来说，这是完美选择。

步骤 3：在 AI Studios 中添加声音、脚本和语言

虚拟人创建完成后，你可以使用 AI Studios 的内置功能让它开口说话。

你可以：

输入或粘贴你的脚本
从 200 多种自然风格的 AI 声音中任意选择（也可上传并克隆你自己的声音）
自动将生成的语音与虚拟人的口型同步

步骤 4：在不同的 AI Studios 项目中使用你的虚拟人

你的新虚拟人可以作为主持人，出现在 AI Studios 的各种功能中：

文本生成视频（Text to Video）： 将文章或脚本转换为带旁白的视频
关键词生成短视频（Topic to Video）： 根据关键词生成短内容
网页生成视频（URL to Video）： 将网页内容转成讲解视频
或者从零开始制作视频！

你的虚拟人将成为多语言、多场景的视频制作工具，可用于 YouTube、培训内容、数字销售等更多应用。

什么是 Sora？

Sora 是 OpenAI 开发的文本生成视频模型，它能将文字描述转换为逼真、高质量的视频画面。
虽然 Sora 不会生成声音或对话，但它非常适合无需拍摄即可获得逼真画面的场景。

什么是 AI Studios？

DeepBrain AI 推出的 AI Studios 是一款由 AI 驱动的视频制作平台，可将文字转换为带旁白的完整视频，并支持数字虚拟人技术。
平台支持自定义虚拟人、80 多种语言的 AI 语音，以及翻译、配音、自动视频生成等功能。
它适用于创作者、营销人员、教育工作者等需要无需拍摄即可制作专业视频的人群。

Sora 与 AI Studios 如何互补？

Sora 和 AI Studios 是完美的组合，因为它们能够互相弥补对方的不足。

Sora 提供逼真的视觉画面，但无音频
AI Studios 提供声音、语言和脚本呈现

两者结合，让你无需拍摄、无需录音即可制作完整的专业 AI 视频。

总结

Sora 能生成逼真的视频，但不会生成声音。
这正是 AI Studios 发挥作用的地方。

将 Sora 的高逼真视觉视频与 AI Studios 的语音与动画功能结合，你可以轻松打造会说话的数字虚拟人，为你的内容制作提供无限可能——完全无需上镜。

从 ChatGPT 开始，在 Sora 中赋予人物形象，再让 AI Studios 使它开口说话。

如何使用 ChatGPT Sora 制作会说话的数字虚拟人（Avatar）