“SUCDT”的版本间的差异
跳到导航
跳到搜索
(→标注规范) |
|||
| 第11行: | 第11行: | ||
== 标注规范 == | == 标注规范 == | ||
| − | * 最新版:[[:File: | + | * 最新版:[[:File:annotation-guidelines.pdf| annotation-guidelines.pdf]] |
* [http://hlt.suda.edu.cn/index.php/SUCDT-data-annotation-guideline-past 旧版本标注规范] | * [http://hlt.suda.edu.cn/index.php/SUCDT-data-annotation-guideline-past 旧版本标注规范] | ||
2019年3月15日 (五) 08:59的版本
本页面由郭丽娟和彭雪同学维护。
标注人员培训流程
招聘信息(长期、寒暑假兼职)
- 2018年12月招聘
- 旧的:2018年5月招聘
- 旧的:2017年6月招聘信息
标注规范
已标注数据列表(以句子为单位,K表示1000)
- 哈工大树库(HIT-CDT、规范平衡语料库):14K
- 宾大树库(CTB7、规范平衡语料库):15K
- 北大多视图树库(PKU-CDT、规范平衡语料库)数据:11K
- 产品评论:11K
- 产品博客PB:10K
- 小说(ZX诛仙):3K
- 等等
数据共享或购买
大部分数据向学术界免费共享,支持研究使用。少数数据由于项目或合同约束,需要延迟一些时间后向学术界共享。
企业界需要有偿购买使用权。
word版本数据共享协议(链接以后发布)
如需共享或购买,请发邮件至:李正华