“COPAD”的版本间的差异
跳到导航
跳到搜索
(→标注规范) |
|||
| 第20行: | 第20行: | ||
== 标注规范 == | == 标注规范 == | ||
| − | * 新版:[[:File:语义-规范-V1-2019.6.5.pdf| 语义标注规范- | + | * 新版:[[:File:语义-规范-V1-2019.6.5.pdf| 语义标注规范-2020年3月19日版.pdf]] |
== 已标注数据列表(以句子为单位,K表示1000) == | == 已标注数据列表(以句子为单位,K表示1000) == | ||
2020年4月23日 (四) 14:17的版本
本页面由刘亚慧和杨浩苹同学维护。
汉语开放谓词论元数据集(Chinese Open Predicate Argument Dataset)
标注人员培训流程
招聘信息(长期、寒暑假兼职)
培训经验
- 定期招新,形成稳定的高质量标注人员更迭。
- 招新时,全面介绍标注工作内容,说明标注工作的优势,提高标注工作的兼职竞争力。
- 提高入职门槛,聘用经面试了解较为适合标注工作的人员,培训时增加高正确率标注人员分享经验的环节,不断更新培训PPT。
- 公开所有标注人员的标注明细,形成良好的竞争监督机制。
- 精简标注人员,过滤标注时间不够或标注准确率太低超过两次的人员。
- 一起认真维护、完善规范,认真培训,认真审核和投诉,给出审核和投诉意见。
标注规范
已标注数据列表(以句子为单位,K表示1000)
- xianyu(100)
- Peking(16K)
数据共享
- 大部分数据向学术界免费共享,支持研究使用。少数数据由于项目或合同约束,需要延迟一些时间后向学术界共享。
- 企业界需要有偿购买使用权。
- 数据共享协议下载:待定。