合肥工业大学 本次发布的数据集 IDK, IDK数据集是由研究团队构建的,用于评估多模态大语言模型(MLLMs)在处理未知情况时的表现。该数据集通过让模型多次回答问题并创建OOD(out of distribution)数据集来评估模型的过度自信问题。数据集的创建旨在帮助模型更好地自我评估不确定性,并通过简单的提示调整来缓解这一问题。IDK数据集的应用领域包括医疗保健、自动驾驶等对模型可靠性要求极高的场景,旨在解决模型在面对不确定性时的过度自信问题。
关于 合肥工业大学 , 合肥工业大学是中国的一所重点大学,位于安徽省合肥市,以工科为主,涵盖理、工、文、管、经、法、教育、艺术等多个学科领域。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。