数据标注
1
业务介绍
众测平台招募了一大批专业的数据标注人员,每天有超过5000个标注人员在线,完成各类基础或有一定专业要求的数据标注工作。
对于有特殊质量或速度要求的项目,众测还维护了一大批专业的小组核心用户,可以帮助需求方更高质量、高速度地完成标注需求。
相比外包公司,众测的标注单价仅为其10%~20%,但标注速度和人数规模远超外包公司,并可以采用与外包公司相同的用户管理和数据审核方式,确保标注数据的质量。
截止目前,众测累计已经完成5亿张图片,8000万条文本类数据的标注。服务范围覆盖百度的IDL,凤巢,PS,NLP,图搜,百科,音乐,文库,视频,移动云,大数据部等30+条产品线,已累计为公司节省成本¥1亿(参考外包公司报价)。
2
业务类型
文本类标注:支持文本、网页、搜索结果、广告结果的标注,如搜索结果理由的标注,可提升百度搜索结果的质量;对话文本判断,为自然语言学习提高基础素材。
多媒体标注:支持图片、语音、视频的标注,如图片的分类与整理,可用于百度图片的分类展现,图片识别算法的验证等;为音乐增加情感标签,用于百度音乐分类推荐。
3
我们的优势
速度快:日均5000名标注人员,可标注文本10万条/天;图片30万张/天。
成本低:文本标注成本约为0.1元/条,图片标注成本约为0.5元/100张,成本约为外包公司10%~20%。
质量高:通过样本题、多人答案拟合、反作弊、人工审核、核心用户小组等机制保证数据标注质量。