芯翌科技联合清华发布全球最大公开人脸数据集,算法斩获人脸识别全球第一

2021-03-17 07:49 分类:公司新闻 来源:

0

(图为已上线的WebFace数据集网站)

日前,芯翌科技与清华大学主动化系智能视觉实验室协作,推出了全球最大的揭露人脸数据集WebFace260M。该研讨论文已被CVPR2021录入。以该数据集为根底,芯翌科技在最新的全球人脸辨认算法测验(NIST-FRVT)榜单中斩获戴口罩人脸辨认评测赛道的榜首名。1

(WebFace260M人脸数目和图片张数上远超其他公共数据集,图片摘自论文)

数据集为学术界贡献了一个新的百万级人脸基准,包含有噪声的4百万人脸数目/2.6张图片(WebFace260M)和清洗后的2百万人脸数目/420万张图脸(WebFace42M)练习数据,以及精心规划的时刻束缚评价协议。

3

(数据清洗进程,图片摘自论文)

研讨团队从互联网上收集了合计4百万的名字列表,并下载了2.6亿张人脸图片。然后规划了一个主动使用自我练习(CAST)流水线来对巨大的数据库进行清洗。数据库具有高效且可扩展的特性。

4

(清洗往后的人脸姿态、年纪以及人种散布,图片摘自论文)

据悉,净化后的WebFace42M是最大的公共人脸辨认练习集。出于希望缩小学术界和工业之间的数据距离的意图,团队参照实践场景,构建了Inference Time conStraint(FRUITS)协议和测验集来全面评价人脸辨认数据库。

使用FRUIT协议,团队开发了一个散布式结构来有效地练习人脸辨认模型,而不影响其功能。在WebFace42M的支持下,咱们在具有挑战性的IJB-C集上降低了40%的失败率,在NIST-FRVT 1:1人脸辨认评测中的430个条目中排名国际第三。即使是10%的数据(WebFace4M)也体现出比公共练习集更优越的功能。此外,在FRUITS-100ms/500ms/1000ms协议下的富特点测验集上建立了全面的基线,包含MobileNet、EfficientNet、AttentionNet、ResNet、SENet、ResNeXt和RegNet系列。

5

(WebFace260M与其他揭露数据集在IJB-C上的体现,图片摘自论文)

NIST-FRVT是全球顶尖科研机构比赛的赛场,测验数据不揭露。该测验通过不同类型的相片样本进行上百亿次比照,对人脸辨认算法的评价可到达百万分之一精度,是当今全球规划最大、规范最严、比赛最剧烈、最威望的人脸辨认算法比赛,素有工业界黄金规范之称。能在NIST-FRVT中斩获首席,可想而知算法的准确率高得吓人。

数据集网站:https://www.face-benchmark.org

论文链接:https://arxiv.org/abs/2103.04098


安身学术前沿,远瞻工业开展。更多数据请参阅前瞻工业研讨院《2021-2026年我国人脸辨认职业商场前瞻与出资战略规划剖析陈述》,一起前瞻工业研讨院供给工业大数据、工业规划、工业申报、工业园区规划、工业招商引资、IPO募投可研等解决方案。

相关深度陈述 REPORTS

2021-2026年我国人脸辨认职业商场前瞻与出资战略规划剖析陈述 2021-2026年我国人脸辨认职业商场前瞻与出资战略规划剖析陈述

陈述主要内容:我国人脸辨认职业开展布景、现状及趋势;国外人脸辨认职业开展状况及跨国公司在华出资布局状况;我国人脸辨认职业商业模式构建及立异;我国人脸辨认职业使用...

检查概况