浙江大学 本次发布的数据集 EliGen Dataset, EliGen数据集由浙江大学和阿里巴巴集团联合创建,旨在支持实体级控制的图像生成任务。该数据集包含50万条高质量的训练样本,每个样本包括图像、全局提示、局部提示和实体掩码。数据集的生成过程使用了Flux生成图像,并通过Qwen2-VL视觉语言模型进行全局提示和实体信息的标注。该数据集的应用领域主要集中在图像生成和图像修复任务,旨在解决现有文本到图像生成模型在细粒度实体控制上的不足,提供更精确的实体位置和语义控制能力。
关于 浙江大学 , 浙江大学是中国著名的综合性研究型大学,位于浙江省杭州市。该校成立于1897年,是中国最早的高等学府之一,以工程、科学、医学和管理学等领域的研究和教学闻名。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。