京东(JD.Com, Inc.) 本次发布的数据集 Chinese Talking-Face Dataset, 该数据集由京东和香港大学的研究团队构建,旨在促进中文环境下的说话人脸生成研究。数据集包含约1100个高质量视频,总时长达130小时,视频来源于Bilibili和抖音平台。数据经过严格筛选,确保每个视频仅包含一个可见人脸,且音频与说话者身份一致。数据集的应用领域主要集中在说话人脸视频生成,特别是唇音同步和视觉质量的提升。通过该数据集,研究者可以训练模型以实现更精确的唇音同步和高质量的视频生成。
查看Chinese Talking-Face Dataset
关于 京东(JD.Com, Inc.) , 京东是中国最大的自营式电商企业之一,提供广泛的电子产品、家用电器、服装等商品的在线销售服务。
关于 arXiv , arXiv 是一个免费分发服务和开放获取的学术文章档案库,涵盖了物理学、数学、计算机科学、定量生物学、定量金融、统计学、电气工程和系统科学以及经济学等领域。该网站上的材料并未经过 arXiv 的同行评审。