首页
数据采集标注
数据采集
数据标注
AI数据集
智能标注平台
假指纹制作
大模型数据集
智能标注平台
欧陆注册
关于我们
19157628936
lx@jinglianwen.com
首页
民用数据服务
数据采集
数据标注
AI数据集
智能标注平台
假指纹制作
大模型数据集
智能标注平台
欧陆注册
关于我们
首页
>
AI数据集
>
1000小时粤语语音采集数据
1000小时粤语语音采集数据
通用类口语句子;交互类句子;重复率1.71 ;平均句长10.83字/句
-获取详情
欧陆注册已通过ISO27001信息安全管理系统,ISO9001质量管理体系认证。
数据简介
人员分布:800人;平均每人录制328句; 409男,391女;小于25岁60%,26-40岁25%,41岁以上7%标注特点:文本转写,噪音符号标注
数据规模
1000小时
采集环境
相对安静的环境,无回声
数据构成
800人;平均每人录制328句; 409男,391女;小于25岁60%,26-40岁25%,41岁以上7%
采集设备
手机
数据格式
语音数据格式:手机16kHz、16bit、wav、单声道,标注结果格式:txt
数据来源
此数据集由欧陆注册科技及合作供应商共同采集制作,基于GDPR(通用数据保护条例),对数据已进行脱敏处理
样例展示
相关推荐
9000个人体步态图像视频数据
不同服饰状态下,多角度采集的步态数据信息 涵盖多种场景...
Re-ID精细角度步态采集
不同服饰状态下,多角度采集的步态数据信息 涵盖多种场景...
1000小时英语语音采集数据
通用类口语句子;交互类句子;重复率1.71 ;平均句长10.83字/句
做AI行业客户的数据参谋
- 提交需求