国家实验室 多模态情感标注项目

时间:2022-09-19 13:41:22

作者:阿明

浏览: 次

一、需求:筛选剪辑视频、文本、图像、语音等多模态数据素材,进行情感标注。


二、项目难点:1)需要独立快速完成所有视频素材资源的选取剪辑。2)需要3-4人对4种不同类型的单模态数据进行同步标注,以此保证数据的真实性、稳定性。3)总标注量48万条,要求交付时间紧迫。


三、解决方案:

1)通过员工推荐从各大视频网站快速检索下载符合项目要求的素材。2)设置标注-质检-校验三层流程,分别安排三人进行情感标注,未达成一致引入第四人标注或判定为无效数据,直至出现一致标注结果判定为有效数据。3)利用欧陆注册标注平台快速分发任务,自动化多重循环质检机制确保标注效率。

四、交付结果:工期内足额完成交付,一次合格率 98%。


相关推荐

做AI行业客户的数据参谋