在未来的数字边境,一款名为“如意”(Ruyi)的革命性AI技术悄然降临,它不仅是技术的突破,更是创意的无尽源泉。在这个世界里,想象与现实的界限模糊,每一幅图像都能被赋予生命,编织成令人震撼的视觉盛宴。通过HuggingFace的魔法之门,任何人都能触及这股力量,即便是消费级显卡的持有者,也能成为自己故事的导演。
如意-Mini-7B,一个听起来似乎轻巧却蕴藏无限可能的名字,它以单张图片为钥匙,解锁通往五秒720P高清视频的奇幻之旅,不拘一格的长宽比,如同定制梦境的框架。从逼真的写实人物,到幻想中的动画角色,乃至令人窒息的自然风光,如意以其无与伦比的生成能力,让每一帧画面都跳动着创意的火花。
它不仅仅是一款软件,而是一位梦想的合作者,让艺术家和创作者的梦想在数字画布上肆意绽放。运动幅度的精细调控,镜头语言的自由挥洒,如意仿佛一位隐形的电影大师,引导着每一个故事,从静默的图像走向生动的叙事,开启了一段段跨越现实与想象边界的旅程。在这场科技与艺术的盛宴中,每个人都是自己故事的主宰,只需一键,便能将心中的愿景化为令人瞩目的影像,颠覆你对视频生成的认知,引领我们踏入一个全新的创作纪元。
Ruyi-Mini-7B版本已可在HuggingFace平台下载:GitHub代码链接:官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。
官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:
Ruyi性能测试:
Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。
在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。
图森未来转型:
图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。
Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。图森未来计划于2025年推出闭源模型RuyiStandard及相关工具,2026年发布更强大的版本。
视频链接:
以上就是智驾公司下场搞AI视频生成,模型上线即开源的详细内容,更多请关注其它相关文章!