AI绘画领域迎来重要突破,小红书与复旦大学联合研发的InstanceAssemble技术,在布局控制生成方向实现关键进展。这项基于扩散变换器架构的创新方案,通过引入"实例拼装注意力"机制,成功解决了复杂场景下图像生成的布局对齐难题,相关研究成果已被国际顶级学术会议NeurIPS 2025收录。
传统布局控制生成技术面临三大挑战:物体位置偏移、语义理解偏差以及计算资源消耗过大。研究团队针对这些痛点,开发出无需模型重训练的轻量化适配方案,仅需增加约7100万个参数(相当于Stable Diffusion3-Medium模型的3.46%),即可实现高精度布局控制。当适配Flux.1模型时,额外参数需求更降至0.84%,显著降低技术落地门槛。
该技术的核心创新在于构建了动态实例注意力网络。用户输入边界框坐标与物体描述后,系统会先定位空间关系,再通过语义解码器生成符合物理规律的图像内容。实验数据显示,在包含90万个实例的密集场景测试中,InstanceAssemble的布局准确率较现有方法提升42%,语义一致性指标提高37%。即使在训练时仅接触稀疏布局(≤10个实例),面对密集场景(≥10个实例)仍能保持稳定性能。
为建立标准化评估体系,研究团队同步推出Denselayout基准测试集和Layout Grounding Score(LGS)评估指标。该测试集包含5000张高分辨率图像和9万个标注实例,覆盖室内设计、城市景观等八大场景。LGS指标通过三维空间匹配度、语义关联性等六个维度,实现了对布局生成质量的量化评估。
目前,这项技术已实现完整开源,代码库和预训练模型均可在GitHub平台获取。实际应用测试表明,在广告设计领域,设计师通过调整边界框参数,可将单张海报的制作时间从3小时缩短至45分钟;在动漫创作场景中,分镜脚本到视觉画面的转化效率提升60%。技术团队表示,未来将持续优化多物体交互关系的生成逻辑,探索在虚拟制片、工业仿真等领域的延伸应用。
更多>同类资讯马斯克实测无安全员Robotaxi:主驾无人流畅应对复杂路况,称体验“完美”12-26京东内测“京东AI购”APP:智能购物新体验,生活服务一站式搞定12-26智元远征A2旗舰版V1.3升级:技能拓展、速度提升,运输更便捷12-26中国品牌闪耀巴黎:Shein实体店受捧,Labubu成圣诞热门之选12-26红果短剧11月剧本分账成绩亮眼 2家工作室5名编剧分账破记录12-26存储涨价潮来袭,年末换机正当时——三款热门机型助你精准选购在当前存储涨价背景下,可以预见的是2026年旗舰机型的大内存版本价格将会大幅上升,所以目前选购大内存版本旗舰机型是更有前瞻性的选择,强劲的性能配合大内存可以稳稳的撑过漫长的涨价周期。推荐16GB+512GB版…12-26
电动化浪潮下的硬派传承 Jeep Recon以纯电之姿重塑越野新体验作为承载全球无数消费者越野情怀的标杆品牌,Jeep并未在市场变革中迷失方向,尽管其电动化转型的节奏相对比较缓慢,但是凭借深厚的品牌底蕴以及技术积淀,简单“露一手”就尽显功力。很多人都不喜欢纯电动力系统,但是不…12-26AI人才争夺白热化:科技巨头以百万年薪及顶级资源提前锁定顶尖实习生12-26卢伟冰口误引热议 小米17Ultra徕卡版设计亮眼市场抢手12-26比亚迪携手火山引擎:豆包大模型上车,开启智能座舱全系AI化新篇章12-26英伟达200亿美元获Groq技术授权,补短板应对竞争重塑AI布局12-26OpenAI联手博通打造10GW定制芯片,2026年部署开启AI硬件新篇章12-26开源新星BU-30B-A3B-Preview:低成本高效率,引领浏览器自动化新潮流12-26
2025汽车行业大变革:十大创新技术引领,开启智能移动空间新纪元比亚迪腾势N8L搭载的AI助手可理解复杂语义逻辑,吉利星睿大模型与DeepSeek-R1融合后,能根据用户驾驶习惯主动提供个性化服务;在上汽大众的高快NOA系统中,DeepSeek与百度文心双模型协同,大幅提…12-26马斯克点赞宇树机器人伴舞王力宏演唱会,创始人王兴兴:喜爱超预期12-26点击查看更多 +全站最新
特斯拉FSD新动向:行驶中就能提交反馈,优化体验再进一步
汽车保养别被忽悠!老司机教你盯紧3个关键部位,拒绝花冤枉钱
极氪回归赋能吉利:量价齐飞,开启“一个吉利”新征程
技术普惠与全球布局:MG2025年以创新破局开启新百年征程
合资新能源SUV“新势力”崛起:多款车型凭实力重塑市场格局
极狐领跑!京AA0001Z上路,L3自动驾驶从蓝图迈向真实交通流热门内容
技术普惠与全球布局:MG2025年以创新破局开启新百年征程
湖北荆州4A景区元旦免费开放!网红唐艺连唱3天,楚风游园盛宴等你来赴
雷军暂别发布会舞台 小米17 Ultra携徕卡登场 售价上探7000元档位
从汽车到金融:百度伐谋如何让AI成为产业升级的“超级引擎”
红旗HS6 PHEV上市:以亲民价重塑大五座SUV,家庭出行新优选
小米17 Ultra徕卡版来袭!影像升级巨大,光学变焦长焦首发登场
本文链接:http://www.28at.com/showinfo-16-190561-0.html小红书联合复旦推出InstanceAssemble:AI绘画精准构图新突破,技术开源赋能创作
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。