小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破

在AIGC从“自由创作”迈向“精准控制”的关键阶段，小红书AIGC团队今日开源其全新布局可控图像生成框架——InstanceAssemble，专为解决高密度、多对象、复杂空间关系的Layout-to-Image任务而设计。该框架在保持极低参数增量（最低仅0.84%）的前提下，显著提升生成图像的空间对齐精度与语义一致性，为电商、设计、游戏等高要求场景提供工业级解决方案。

级联建模 + Assemble-Attention，破解“多物堆叠”难题

传统Layout-to-Image模型在面对“10个商品图标+文字标签+背景图层”等复杂布局时，常出现对象错位、重叠或语义错配。InstanceAssemble创新性采用级联双阶段架构:

1. 语义理解阶段:解析文本描述与布局指令的语义关联;

2. 空间组装阶段:通过自研Assemble-Attention机制，动态建模实例间相对位置、遮挡关系与层次结构，确保每个元素“该在哪，就在哪”。

实验显示，在密集商品展示、多角色插画、UI界面生成等场景中，InstanceAssemble的对象定位准确率与边缘清晰度显著优于现有方法。

极轻量适配，兼容主流底模

为降低部署门槛，框架采用超轻量LoRA适配器:

- 适配Stable Diffusion3-Medium仅需3.46%额外参数;

- 适配Flux.1模型更是低至0.84%。

这意味着用户无需重新训练大模型，即可在保留底模强大生成能力的同时，灵活注入布局控制能力，支持文本+参考图+边界框的多模态指令。

自建DenseLayout基准，推动评估标准化

为精准衡量布局对齐质量，小红书同步发布DenseLayout评测数据集与LGS（Layout Grounding Score）可解释指标。LGS从位置精度、尺度匹配、语义一致性三个维度量化生成效果，解决传统指标(如IoU)在密集场景下失真的问题。

AIbase认为，InstanceAssemble的发布，标志着AIGC正从“画得像”走向“摆得准”。当AI不仅能生成精美图像，还能按设计师的精确布局指令“摆放”每个元素，AIGC才真正具备嵌入专业生产流程的能力。而小红书此次开源，不仅赋能社区创作者，更将推动整个行业向可控、可靠、可商用的生成式AI迈进。

论文链接:https://arxiv.org/abs/2509.16691

项目主页:https://github.com/FireRedTeam/InstanceAssemble

大众点评加码内容生态建设强化AIGC虚假评价治理

大众点评宣布加强真实内容生态建设，推出更多激励措施鼓励用户分享原创、客观的消费评价，以应对AIGC内容带来的挑战。同时，平台升级了AIGC评价治理智能体，利用技术手段高效识别和清理AI生成的低质评价，保障内容真实性。

快看漫画启动“数字生命”战略，AI新品Livo拟于7月公测

快看漫画在2026腾讯AI产业应用大会上宣布，正在研发AI数字生命产品“Livo”，预计今年7月公测。该产品由创始人陈安妮担任“第一架构师”，旨在利用AIGC技术将平台1.3万部漫画IP转化为自运转的数字生命世界。目前Livo已进入Demo内测阶段，相关专利与法务申请同步推进。

LobsterAI上线图片视频大模型矩阵一次性接入四大主流图像视频生成模型

国内AIGC多模态创作领域迎来新进展，网易有道旗下开源AI产品LobsterAI（龙虾）升级，正式上线图片和视频生成能力。此次升级采用矩阵式整合策略，接入四大主流多模态大模型：Seedream、Seedance、HappyHorse和MiniMax-Hailuo，提升创作效率与多样性。

小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破

相关推荐

AI内容产业再下一城，吉视传媒首部AI漫剧定档 7 月

大众点评加码内容生态建设强化AIGC虚假评价治理

影视圈又一重磅联手！生数科技牵手华策，加速 AI 视频从“创意辅助”迈向“真实生产”

快看漫画启动“数字生命”战略，AI新品Livo拟于7月公测

LobsterAI上线图片视频大模型矩阵一次性接入四大主流图像视频生成模型

小红书开源InstanceAssemble！轻量级布局可控生成框架，复杂多实例图像生成精度再突破

相关推荐

AI内容产业再下一城，吉视传媒首部AI漫剧定档 7 月

大众点评加码内容生态建设 强化AIGC虚假评价治理

影视圈又一重磅联手！生数科技牵手华策，加速 AI 视频从“创意辅助”迈向“真实生产”

快看漫画启动“数字生命”战略，AI新品Livo拟于7月公测

LobsterAI上线图片视频大模型矩阵 一次性接入四大主流图像视频生成模型

大众点评加码内容生态建设强化AIGC虚假评价治理

LobsterAI上线图片视频大模型矩阵一次性接入四大主流图像视频生成模型