“CCL2021”的版本间的差异
跳到导航
跳到搜索
(→讨论) |
|||
| 第6行: | 第6行: | ||
* 数据处理过程:[http://hlt.suda.edu.cn/index.php/CCL2021Data 网址] | * 数据处理过程:[http://hlt.suda.edu.cn/index.php/CCL2021Data 网址] | ||
* 2021-2-22讨论:[http://hlt.suda.edu.cn/index.php/Discussion2021-2-22 网址] | * 2021-2-22讨论:[http://hlt.suda.edu.cn/index.php/Discussion2021-2-22 网址] | ||
| + | |||
| + | 如何验证补全的正确性?如何验证每一件事的正确性 | ||
| + | 不可以用codt1.0的数据 | ||
| + | 要做哪些基础实验,来帮助我们了解数据,了解codt1.0和2.0的差别;不同领域的差别 | ||
| + | 基础实验做完之后,就以参赛者的标准,来打比赛,主要的方法就是self-training(数据增强?知识蒸馏?异构数据?) | ||
| + | open(只能用大家都可以公开获取的工具、数据资源等)和closed track(只能用我们提供的embedding/bert/unlabeled data);不确定可以咨询我们,有新的规定会通知大家,并写到评测主页上。 | ||
2021年3月9日 (二) 03:28的版本
讨论
- CCL-2021句法领域移植评测,发布CODT 2.0
- 增加两个领域的数据:法律、金融(无标注数据分别给15万句,分好词);规范通用领域的训练集增大为3万句
- 所有领域的训练集,都由BC-train-partial上训练的SuPar-BERT-CRF-1o补全。【明月指导帅克做】
- 苏大跑一些基准实验,主要就用SuPar。帅克来跑。包括self-training tri-training
- 数据处理过程:网址
- 2021-2-22讨论:网址
如何验证补全的正确性?如何验证每一件事的正确性 不可以用codt1.0的数据 要做哪些基础实验,来帮助我们了解数据,了解codt1.0和2.0的差别;不同领域的差别 基础实验做完之后,就以参赛者的标准,来打比赛,主要的方法就是self-training(数据增强?知识蒸馏?异构数据?) open(只能用大家都可以公开获取的工具、数据资源等)和closed track(只能用我们提供的embedding/bert/unlabeled data);不确定可以咨询我们,有新的规定会通知大家,并写到评测主页上。