Word-net-2

来自SUDA-HLT
LA-share讨论 | 贡献2019年4月2日 (二) 15:53的版本 →‎主要计划
跳到导航 跳到搜索

主要工作

  • 限定词语
 我们将词语限定在《现代汉语语法信息词典》、同义词林、HowNet和WordNet翻译词四个部分中的名词。对于同义词林、NowNet、WordNet中的词,本身具有一定的上下位关系,可以直接根据规则得到候选上下位词对。《现代汉语语法信息词典》中的词语根据模式匹配得到候选上下位词对。
  • 限定语料
 我们将语料限定在百度百科和维基百科,我们有百科的源文件,当前需要对数据文件进行倒排索引,方便词语的搜索和模式的识别。