云端 AI 合成 + 桌面渲染动画 — 完整管线说明
商家只需准备两样素材:一段录音(用于声音克隆)+ 一段真人出镜视频(用于对口型)。
整个视频生成管线分为两个阶段:
| 阶段 | 职责 | 部署位置 |
|---|---|---|
| AI 合成层 | 语音克隆、TTS、对口型 | 云端服务器 |
| 渲染层 | 字幕对齐、模板注入、动画渲染 | 桌面渲染节点 |
基础 URL:https://www.aiom.com.cn/php
认证方式:Authorization: Bearer <token>(商家登录后获取)
| 功能 | 价格 |
|---|---|
| 对口型 | 1.2 元/分钟(高清,按秒计费) |
| 视频字幕动画 | 由桌面端完成 |
| 语音合成(TTS) | 按第三方 API 消耗 |
对口型视频到手后,桌面渲染节点做三件事:
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
copy | string | 是 | 完整营销文案 |
audio_url | string | 是 | TTS 生成的音频文件 URL |
video_url | string | 是 | 对口型完成的视频文件 URL |
brand_name | string | 否 | 商家名称(默认:品质优选) |
keywords | object | 否 | 关键词 → emoji 映射 |
notify_url | string | 否 | 渲染完成后的回调地址 |
| 场景 | 内容 | 权重 |
|---|---|---|
| scene1-intro | 开场介绍 + 价格展示 | 12% |
| scene2-rejection | 痛点拒绝 + 标签展示 | 10% |
| scene3-pointless | 传统方式无效对比 | 13% |
| scene4-six | 六大优势展示(全屏人脸) | 13% |
| scene5-benefits | 核心卖点卡片 | 18% |
| scene6-only-ones | 品牌独占(全屏人脸) | 8% |
| scene7-cta | 行动号召 | 21% |
桌面渲染节点通过 SSH 反向隧道暴露给云服务器,让 AI Agent 可直接调用。
第一步:启动渲染 API
第二步:启动 SSH 隧道
返回:
查询状态:
下载成品:
| 素材 | 要求 | 用途 |
|---|---|---|
| 录音 | 手机录制,5~30 秒,清晰人声 | 声音克隆 → 生成 voice_id |
| 真人出镜视频 | 5~10 秒,正面拍摄,面部清晰 | 对口型 → 作为口播人物 |