智驾公司下场搞AI视频生成,模型上线即开源

来源:网络时间:2025-06-04 16:04:10

在未来的数字边境,一款名为“如意”(Ruyi)的革命性AI技术悄然降临,它不仅是技术的突破,更是创意的无尽源泉。在这个世界里,想象与现实的界限模糊,每一幅图像都能被赋予生命,编织成令人震撼的视觉盛宴。通过HuggingFace的魔法之门,任何人都能触及这股力量,即便是消费级显卡的持有者,也能成为自己故事的导演。

如意-Mini-7B,一个听起来似乎轻巧却蕴藏无限可能的名字,它以单张图片为钥匙,解锁通往五秒720P高清视频的奇幻之旅,不拘一格的长宽比,如同定制梦境的框架。从逼真的写实人物,到幻想中的动画角色,乃至令人窒息的自然风光,如意以其无与伦比的生成能力,让每一帧画面都跳动着创意的火花。

它不仅仅是一款软件,而是一位梦想的合作者,让艺术家和创作者的梦想在数字画布上肆意绽放。运动幅度的精细调控,镜头语言的自由挥洒,如意仿佛一位隐形的电影大师,引导着每一个故事,从静默的图像走向生动的叙事,开启了一段段跨越现实与想象边界的旅程。在这场科技与艺术的盛宴中,每个人都是自己故事的主宰,只需一键,便能将心中的愿景化为令人瞩目的影像,颠覆你对视频生成的认知,引领我们踏入一个全新的创作纪元。

  

图片   

  

Ruyi-Mini-7B版本已可在HuggingFace平台下载:GitHub代码链接:官方还提供部署说明和ComfyUI工作流,支持消费级显卡运行。   

  

图片   

  

官方Demo展示了Ruyi强大的生成能力,包括逼真的写实人物、动画角色和自然风景等:   

  

图片图片图片图片   

  

Ruyi性能测试:   

  

Ruyi基于单张图片即可生成最高720P、时长5秒的视频,支持任意长宽比。它支持多起始帧和结束帧,可生成任意长度视频,并提供运动幅度和镜头控制选项。   

  

图片智驾公司下场搞AI视频生成,模型上线即开源   图片   

  

在写实风格、影视剧照、动画风格、动物和风景等方面,Ruyi展现了不错的生成能力,但仍存在一些不足,例如手部畸形和细节缺失。   

  

图片图片图片图片图片图片图片图片智驾公司下场搞AI视频生成,模型上线即开源   图片智驾公司下场搞AI视频生成,模型上线即开源   

  

图森未来转型:   

  

图森未来,一家原智能驾驶公司,于今年8月进军ACG市场,并成立生成式AI部门。Ruyi的开源,体现了其将自动驾驶技术经验应用于AI生成领域的策略。   

  

Ruyi基于DiT架构,参数量约7.1B,训练数据约200M个视频片段。图森未来计划于2025年推出闭源模型RuyiStandard及相关工具,2026年发布更强大的版本。   

  

图片图片   

  

视频链接:   

  

以上就是智驾公司下场搞AI视频生成,模型上线即开源的详细内容,更多请关注其它相关文章!   

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站) 联系邮箱:[email protected]