当前位置:首页 > 娱乐 > Vidu Q2生图功能上线:控制权进一步交给创作者

Vidu Q2生图功能上线:控制权进一步交给创作者

12月1日消息,图功Vidu推出升级后的线控Q2参考生图功能,并同步上线文生图与图像编辑功能,制权商洛市某某自动化科技有限公司试图解决AI多模态创作中“创意”与“可控性”难以兼顾的进步交长期难题。官方称,创作此次更新将创作的图功控制权进一步交还给创作者。

新版Q2生图功能在一致性表现、线控生成速度、制权工作流整合等方面均有所提升,进步交可应用于短剧动漫、创作商洛市某某自动化科技有限公司广告电商、图功泛娱乐、线控影视制作、制权文旅教育等多个场景。进步交平台同时开放限时免费体验,创作会员可在一个月内使用文生图、参考生图及图像编辑功能,旗舰版会员享受不限量生成。

官方介绍,Vidu在国际AI基准测试机构Artificial Analysis最新公布的图像编辑榜单中首次上榜即进入前四名,并在该指标上超过了GPT-5。这意味着其在图像编辑一致性与模型成熟度上已达到较高水平。


一致性能力方面。据悉,Q2参考生图在语义理解、风格支持、美学水准和参考要素灵活度方面均较上一版本提升。官方称,模型能够在保持主体一致的前提下给予创作者更多创作自由,生成速度最快可达5秒。

在参考能力方面,Q2主要包括:

• 任意比例生成:可从同一参考图生成不同比例画面,适配广告、电商、短剧动漫等多种素材需求,支持4K输出。

• 位置、动作、构图复刻:通过升级的空间理解能力,可精准复刻角色站位、动作、布局,即便输入为草图或线稿,也能保持构图一致。

• 分镜切换:可基于同一画面生成不同景别,通过文字指令完成多镜头画面组合,再配合图生视频功能生成完整片段。

图片编辑能力增强方面,全新的Q2图像编辑功能支持局部添加、替换、删减或调整内容,并可进行风格转换及季节、时间变化处理。在编辑过程中,主体一致性与背景结构可保持稳定,不易出现变形或细节缺失。

相比传统修图软件依赖多工具调整的方式,Q2通过文本改图的方式降低了使用门槛,为创作者带来更高效率。

文生图与多风格输出方面,升级后的文生图能力可根据简单提示词直接生成连续分镜,覆盖超过百种主流与非主流美术风格,包括国画、日漫、美漫与复古画风等。无论远景、特写还是近景,均可保持人物外观的一致性。

参考生图功能则可基于固定角色,快速生成不同故事情节下的多张画面,使角色IP构建与多场景延展更加高效,适合漫画、绘本以及短剧类创作的批量生产。

据介绍,此次新增的“主体保存”功能打通了文生图、参考生图与参考生视频的模型链路。创作者可保存任一生图的主体,再在视频生成中调用,实现跨模态一致性。(定西)

延伸阅读
  • 刚刚,DeepSeek 发布 V3.2正式版
  • 盒马前CEO侯毅开启直播带货
  • 再谈注意力:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进

(责任编辑:休闲)

推荐文章
  • 遭老板性侵女高管每月心理治疗费4000

    遭老板性侵女高管每月心理治疗费4000   来源:钱江晚报  今年9月,在天津市津南区人民法院八里台人民法庭开庭审理,未当庭宣判。  经过80多天的等待,12月17日,崔丽丽告诉记者,她因职场暴力导致精神障碍的工伤认定,终于有了法律上的“伤 ...[详细]
  • 黎巴嫩真主党确认其媒体部门负责人死亡

    黎巴嫩真主党确认其媒体部门负责人死亡 当地时间11月17日,黎巴嫩真主党确认其媒体部门负责人穆罕默德·阿菲夫死亡。据黎巴嫩新电视台报道,以色列17日空袭黎巴嫩首都贝鲁特市中心目标,造成包括黎巴嫩真主党媒体负责人穆罕默德·阿菲夫在内的4人死 ...[详细]
  • 乌媒称俄再次发射洲际弹道导弹

    乌媒称俄再次发射洲际弹道导弹   据@CCTV国际时讯 微博,乌克兰媒体称俄军再次从阿斯特拉罕试验场发射洲际导弹。乌克兰空军11月21日早些时候发布通报称,当地时间早5点至7点,俄罗斯军队使用各种类型的导弹袭击了第聂伯罗市。俄军从 ...[详细]
  • 涉嫌策划炸毁纽交所!他被捕!

    涉嫌策划炸毁纽交所!他被捕!   当地时间11月20日,美国佛罗里达州南区检察官办公室宣布,佛罗里达州一男子因涉嫌策划炸毁纽约证券交易所而被逮捕。  据报道,嫌疑人哈伦·阿卜杜勒-马利克·耶内尔现年30岁,他涉嫌试图使用爆炸装置破 ...[详细]
  • 腾势D9全系车型推出全额赠送交强险活动

    腾势D9全系车型推出全额赠送交强险活动 网易汽车12月13日报道近日,腾势参数丨图片)汽车宣布腾势D9将开启“腾势 D9·感恩30万+”年底感恩活动。即日起至2025年12月31日,凡购买并完成交付腾势D9的用户,均可享受全额赠送交强险权益 ...[详细]
  • 智子引擎开源多模态MoE大模型,可高效扩展模型容量

    智子引擎开源多模态MoE大模型,可高效扩展模型容量 转载整理自 智子引擎量子位 | 公众号 QbitAI随着多模态大模型的快速发展,当前主流多模态大模型具备完成多种任务的能力图文描述、视觉问答、文字识别、图标理解、目标检测等)。但是,这些不同的多模态任 ...[详细]
  • 涉嫌策划炸毁纽交所!他被捕!

    涉嫌策划炸毁纽交所!他被捕!   当地时间11月20日,美国佛罗里达州南区检察官办公室宣布,佛罗里达州一男子因涉嫌策划炸毁纽约证券交易所而被逮捕。  据报道,嫌疑人哈伦·阿卜杜勒-马利克·耶内尔现年30岁,他涉嫌试图使用爆炸装置破 ...[详细]
  • 咖啡消费潜力持续释放

    咖啡消费潜力持续释放 咖啡消费潜力持续释放2024-11-08 10:35:26 来源:经济日报 作者:刘阳禾 ...[详细]
  • OpenAI发布GPT最新升级版本

    OpenAI发布GPT最新升级版本   美国开放人工智能研究中心OpenAI)11日发布其人工智能模型GPT的最新升级版本GPT-5.2,以应对生成式人工智能领域日趋激烈的竞争。  为回应谷歌公司11月所发布人工智能模型双子座3的出色表 ...[详细]
  • 涉嫌策划炸毁纽交所!他被捕!

    涉嫌策划炸毁纽交所!他被捕!   当地时间11月20日,美国佛罗里达州南区检察官办公室宣布,佛罗里达州一男子因涉嫌策划炸毁纽约证券交易所而被逮捕。  据报道,嫌疑人哈伦·阿卜杜勒-马利克·耶内尔现年30岁,他涉嫌试图使用爆炸装置破 ...[详细]