可灵大模型(Kling)是由快手大模型团队自研打造的视频生成大模型,具备强大的视频生成能力,让用户可以轻松高效地完成艺术视频创作。该视频模型具有以下特点:
- 大幅度的合理运动:可灵采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。
- 长达2分钟的视频生成:得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频,且帧率达到30fps。
- 模拟物理世界特性:基于自研模型架构及Scaling Law激发出的强大建模能力,可灵能够模拟真实世界的物理特性,生成符合物理规律的视频。
- 强大的概念组合能力:基于对文本-视频语义的深刻理解和 Diffusion Transformer 架构的强大能力,可灵能够将用户丰富的想象力转化为具体的画面,虚构真实世界中不会出现的的场景。
- 电影级的画面生成:基于自研3D VAE,可灵能够生成1080p分辨率的电影级视频,无论是浩瀚壮阔的宏大场景,还是细腻入微的特写镜头,都能够生动呈现。
- 支持自由的输出视频宽高比:可灵采用了可变分辨率的训练策略,在推理过程中可以做到同样的内容输出多种多样的视频宽高比,满足更丰富场景中的视频素材使用需求。
目前可灵主打的功能就是图生视频及视频续写。图生视频模型以卓越的图像理解能力为基础,将静态图像转化为生动的5秒精彩视频。配上创作者不同的文本输入,即生成多种多样的运动效果,让您的视觉创意无限延展;视频续写单次让视频运动延续4.5秒,运动内容合理、幅度显著。得益于续写中的文本控制,每一段续写都能够体现用户的创意和想法。且支持连续多次的续写,最长可生成3分钟的视频,为创作者实现故事梦想提供了强有力的支持。
虽然可灵生成的视频的确不像 Sora 那样有很高级的滤镜感,一眼给人很惊艳的感觉,但生成的视频明显更贴近生活,真实了很多。
数据评估
关于可灵大模型特别声明
本站多啦导航提供的可灵大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由多啦导航实际控制,在07/10/2024 21:05收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,多啦导航不承担任何责任。
相关导航
暂无评论...