“SUCDT”的版本间的差异

来自SUDA-HLT
跳到导航 跳到搜索
第1行: 第1行:
 
本页面由郭丽娟和彭雪同学维护。
 
本页面由郭丽娟和彭雪同学维护。
 +
 +
== 依存句法分析领域移植评测 ==
 +
* 我们正在NLPCC-2019会议上组织评测,发布了约4万句人工标注数据,欢迎大家参与:[http://hlt.suda.edu.cn/index.php/Nlpcc-2019-shared-task 网址]
  
 
== 标注人员培训流程 ==  
 
== 标注人员培训流程 ==  
第15行: 第18行:
  
 
== 已标注数据列表(以句子为单位,K表示1000) ==
 
== 已标注数据列表(以句子为单位,K表示1000) ==
*其中HIT-CDT、CTB7、PC、PB、ZX数据作为nlpcc2019依存句法分析领域移植评测任务使用数据,评测链接:http://tcci.ccf.org.cn/conference/2019/cfpt.php
 
 
* HIT-CDT(规范平衡语料库):14K
 
* HIT-CDT(规范平衡语料库):14K
 
* 宾大树库(CTB7,规范平衡语料库):15K
 
* 宾大树库(CTB7,规范平衡语料库):15K

2019年4月2日 (二) 08:49的版本

本页面由郭丽娟和彭雪同学维护。

依存句法分析领域移植评测

  • 我们正在NLPCC-2019会议上组织评测,发布了约4万句人工标注数据,欢迎大家参与:网址

标注人员培训流程

招聘信息(长期、寒暑假兼职)

标注规范

已标注数据列表(以句子为单位,K表示1000)

  • HIT-CDT(规范平衡语料库):14K
  • 宾大树库(CTB7,规范平衡语料库):15K
  • 北大多视图树库(PKU-CDT、规范平衡语料库)数据:11K
  • 商品评论PC:11K
  • 产品博客PB:10K
  • 小说(ZX诛仙):3K
  • 等等

数据共享或购买

大部分数据向学术界免费共享,支持研究使用。少数数据由于项目或合同约束,需要延迟一些时间后向学术界共享。

企业界需要有偿购买使用权。

word版本数据共享协议(链接以后发布)

如需共享或购买,请发邮件至:李正华