Kling 图生视频 kling-v3
通过 /kling/v1/videos/image2video 提交 Kling 图生视频任务。请求体经模型映射和公共任务 ID 注入后转发至 Kling 官方接口。
授权
在请求头中传入 Authorization: Bearer <token>。
请求体
模型名称
kling-v3 参考图像
- 支持传入图片 Base64 编码或图片 URL(确保可访问)
Base64 编码说明: 请注意,若您使用base64的方式,请确保您传递的所有图像数据参数均采用Base64编码格式。使用 Base64 时,请不要添加任何前缀如 data:image/png;base64,,只需提供 Base64 编码字符串本身。
正确示例:
iVBORw0KGgoAAAANSUhEUgAAAAUA
错误示例:
data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA...
- 图片格式支持 .jpg / .jpeg / .png
- 图片文件大小不能超过 10MB,图片宽高尺寸不小于 300px,图片宽高比介于 1:2.5 ~ 2.5:1 之间
- image 参数与 image_tail 参数至少二选一,二者不能同时为空
参考图像 - 尾帧控制
- 支持传入图片 Base64 编码或图片 URL(确保可访问)
Base64 编码说明: 请注意,若您使用base64的方式,请确保您传递的所有图像数据参数均采用Base64编码格式。使用 Base64 时,请不要添加任何前缀如 data:image/png;base64,,只需提供 Base64 编码字符串本身。
正确示例:
iVBORw0KGgoAAAANSUhEUgAAAAUA
错误示例:
data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAAUA...
- 图片格式支持 .jpg / .jpeg / .png
- 图片文件大小不能超过 10MB,图片宽高尺寸不小于 300px,图片宽高比介于 1:2.5 ~ 2.5:1 之间
- image 参数与 image_tail 参数至少二选一,二者不能同时为空
- image_tail 参数、dynamic_masks/static_mask 参数、camera_control 参数三选一,不能同时使用
是否生成多镜头视频。 当前参数为 true 时,prompt 参数无效 当前参数为 false 时,shot_type 参数及 multi_prompt 参数无效
分镜方式 当 multi_shot 参数为 true 时,当前参数必填
customize, intelligence 正向文本提示词
Omni模型可通过Prompt与主体、图片、视频等内容实现多种能力:
- 通过<<<>>>的格式来指定某个主体、图片或视频,如:<<<element_1>>>、<<<image_1>>>、<<<video_1>>>
- 用 <<<voice_1>>> 来指定音色,序号同 voice_list 参数所引用音色的排列顺序
- 一次视频生成任务至多引用 2 个音色;指定音色时,sound 参数值必须为 on
- 语法结构越简单越好,如:男人<<<voice_1>>>说:"你好"
- 当 voice_list 参数不为空且 prompt 参数中引用音色 ID 时,视频生成任务按"有指定音色"计量计费
2500各分镜信息,如提示词、时长等。 通过 index、prompt、duration 参数定义分镜序号及相应提示词和时长。
- 最多支持 6 个分镜,最小支持 1 个分镜。
- 每个分镜相关内容的最大长度不超过 512。
- 每个分镜的时长不大于当前任务的总时长,不小于 1。
- 所有分镜的时长之和等于当前任务的总时长。
当 multi_shot 为 true 且 shot_type 为 customize 时,当前参数不得为空。格式如下:
"multi_prompt":[{ "index": int, "prompt": "string", "duration": "5" },{ "index": int, "prompt": "string","duration": "5" }]
当 multi_shot 为 true 且 shot_type 为 customize 时必填
负向文本提示词
- 不能超过 2500 个字符
- 建议通过正向提示词中的负向句子补充负向提示信息
2500主体参考列表,基于主体库中的主体 ID 配置。
用 key:value 承载,格式如下:
"element_list":[{ "element_id": long },{ "element_id": long }]
生成视频时引用的音色列表。
- 一次视频生成任务至多引用 2 个音色
- 当 voice_list 参数不为空且 prompt 参数中引用音色 ID 时,视频生成任务按"有指定音色"计量计费
- element_list 与 voice_list 互斥,不能共存
用 key:value 承载,格式如下:
"voice_list":[{ "voice_id": "string" },{ "voice_id": "string" }]
生成视频时是否同时生成声音
on, off 生成视频的自由度;值越大,模型的自由度越小
0 <= x <= 1生成视频的模式
- std:标准模式(标准),基础模式,性价比高,输出视频分辨率为720P。
- pro:专家模式(高品质),高表现模式,生成视频质量更佳,输出视频分辨率为1080P。
- 4k:4K模式,高表现(同pro),生成视频质量更佳,输出视频分辨率为4K。
std, pro, 4k 静态笔刷涂抹区域(用户通过运动笔刷涂抹的 mask 图片)\n"运动笔刷"能力包含"动态笔刷 dynamic_masks"和"静态笔刷 static_mask"两种
- 支持传入图片 Base64 编码或图片 URL(确保可访问,格式要求同 image 字段)
- 图片格式支持 .jpg / .jpeg / .png
- 图片长宽比必须与输入图片相同(即 image 字段),否则任务失败(failed)
- static_mask 和 dynamic_masks.mask 这两张图片的分辨率必须一致,否则任务失败(failed)
动态笔刷配置列表
- 可配置多组(最多 6 组),每组包含"涂抹区域 mask"与"运动轨迹 trajectories"序列
控制相机运动的条款(如不指定,模型将根据输入的文本/图片智能匹配)
视频时长,单位秒。
3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 是否同时生成含水印的结果。
本次任务结果回调通知地址,如果配置,服务端会在任务状态发生变更时主动通知
自定义任务ID