使用方法

创建数字人形象

登录飞影数字人平台后,第一步是确定数字人的视觉形象。平台提供了两种主要方式:一是从官方预设的数字人库中选择现成形象,这些形象覆盖不同年龄、性别和风格,适合快速启动;二是上传个人照片或短拍,系统会基于图像生成高度仿真的数字分身。上传时建议使用正面清晰、光线均匀的照片,分辨率不低于720p,以保证合成效果自然。形象确认后,可进一步微调发型、服装颜色或背景,但保留基础的骨骼驱动能力,确保后续动作自然。

选择语音与语速

声音是数字人表达的核心。飞影数字人内建了数十种中文语音库,涵盖标准普通话、略带地方口音的自然语音以及不同情绪基调(如沉稳、活泼、温柔)。在“声音设置”面板中,你可以逐条试听每个音色的样句,确认后选定。语速支持在0.8倍至1.5倍之间调节,一般推荐1.0倍用于讲解类内容,1.2倍用于快节奏的宣传短片。如需高度定制,平台也提供少量克隆声音的选项——上传一段30秒以上、背景干净的录音,系统能生成近似声线,但需注意版权与合规要求。

输入文案并调整

文案编辑区采用直观的文本输入框,支持一段式或分段式输入。每段文字对应一个镜头或一个动作节点。你可以直接粘贴已有脚本,也可借助平台内置的AI文案辅助工具,输入主题后自动生成初稿,再手动精修。关键点是:在文案中标注停顿符号(如逗号或句号)能触发数字人的呼吸和眨眼微动作,增强真实感。对于长文本,建议每150字以内换行,避免单次合成语音过长导致口型匹配偏差。调整完成后,点击“预览”可查看文字与当前数字人及声音的初步匹配效果。

精细动作与背景设置

除了基础口型,飞影数字人允许你为视频添加手势、头部微转以及眼动方向。在“动作编辑”面板中,你可以选择“默认手势”让数字人自然摆动双手,或针对特定词语(如“大家好”“请注意”)添加强调动作。背景方面,平台提供纯色、渐变以及动态背景库,也可上传个人素材作为背景图或短视频。建议背景画面简洁,与数字人形象色调协调,避免高对比度的图案分散观众对人物口型的注意力。若希望数字人站在讲台或虚拟场景中,可利用内置的3D场景模板,一键套用。

生成与导出视频

所有参数确认后,点击“生成视频”按钮。系统首先对语音进行合成,然后驱动数字人模型匹配口型与动作,整个过程依据视频长度不同耗时数分钟至十余分钟。生成完成后,平台提供在线预览窗口,你可以逐帧检查口型同步度、背景噪点以及字幕位置(如有)。确认无误后选择导出格式:支持MP4、MOV,分辨率可选1080p或4K。导出前还可添加片头片尾文字或品牌水印。最终视频文件存储在云端,提供下载链接,有效期通常为30天,建议及时保存至本地。

批量操作与模板复用

对于需要频繁生成视频的场景(如日播短视频、系列课程),飞影数字人支持“项目模板”功能。将创建好的数字人、声音、背景和动作设置保存为模板。后续新建视频时只需替换文案,其余参数一键套用,大幅提升效率。批量生成时,可上传包含多段文案的Excel表格,系统按行自动串联生成连续视频,适合电商直播预告或批量信息播报。注意每段文案之间会插入默认转场,你可在模板中预设转场类型,如淡入淡出或滑动切换。