“Projects”的版本间的差异

来自SUDA-HLT
跳到导航 跳到搜索
第5行: 第5行:
 
   作为自然语言处理基础研究,苏州大学自然语言分析技术的目标是精准分析句子的词法和句法信息,以支持各种应用需求。我们的技术主要有几个特点:1)采用目前行业领先的多种机器学习技术,包括传统的基于离散特征的方法和深度学习方法,以提高分析性能,同时兼顾效率;2)基于我们做出的面向多源异构数据融合的一系列工作,充分利用现有的各种人工标注数据,提高模型的分析能;3)采用我们提出的基于局部标注表示的统一框架,允许训练数据只包含局部标注信息,从而充分利用各种弱标注数据,也可以将先验知识转化为弱标注信息,从而对模型解码过程进行直接约束;4)我们不断针对多源网络文本,进行人工标注,不断增加高质量训练数据。
 
   作为自然语言处理基础研究,苏州大学自然语言分析技术的目标是精准分析句子的词法和句法信息,以支持各种应用需求。我们的技术主要有几个特点:1)采用目前行业领先的多种机器学习技术,包括传统的基于离散特征的方法和深度学习方法,以提高分析性能,同时兼顾效率;2)基于我们做出的面向多源异构数据融合的一系列工作,充分利用现有的各种人工标注数据,提高模型的分析能;3)采用我们提出的基于局部标注表示的统一框架,允许训练数据只包含局部标注信息,从而充分利用各种弱标注数据,也可以将先验知识转化为弱标注信息,从而对模型解码过程进行直接约束;4)我们不断针对多源网络文本,进行人工标注,不断增加高质量训练数据。
  
  基于以上技术,我们搭建了一个稳定、高准确率、高效率的[http://hlt-la.suda.edu.cn/ 语言分析平台],从而实现技术不断积累和沉淀,目前已经向阿里、科沃斯、狗尾草等公司提供服务。同时,为了支持人工数据标注工作,我们也搭建了一个[http://139.224.234.18/anno-sys 数据标注平台],采用局部标注、严格双人标注、专家审核等形式,我们发现可以最大限度降低数据标注管理者的工作,同时也可以在降低人力成本和提高数据质量之间获得平衡。
+
  基于以上技术,我们搭建了一个稳定、高准确率、高效率的[http://hlt-la.suda.edu.cn/ 汉语理解平台],从而实现技术不断积累和沉淀,目前已经向阿里、科沃斯、狗尾草等公司提供服务。同时,为了支持人工数据标注工作,我们也搭建了一个[http://139.224.234.18/anno-sys 数据标注平台],采用局部标注、严格双人标注、专家审核等形式,我们发现可以最大限度降低数据标注管理者的工作,同时也可以在降低人力成本和提高数据质量之间获得平衡。
  
  
* 语言分析平台:[http://hlt-la.suda.edu.cn 苏州大学语言理解平台(CUP)]
 
 
* 汉语开饭依存树库构建:[http://hlt.suda.edu.cn/index.php/CODT CODT]
 
* 汉语开饭依存树库构建:[http://hlt.suda.edu.cn/index.php/CODT CODT]
* 数据标注平台:[http://101.132.166.249/anno-sys 苏州大学数据标注平台(DAP)]
 
 
* 词语关系网络构建(目前关注上下位关系) [http://hlt.suda.edu.cn/index.php/word-net 基于多源信息的词语上下位关系网络构建]
 
* 词语关系网络构建(目前关注上下位关系) [http://hlt.suda.edu.cn/index.php/word-net 基于多源信息的词语上下位关系网络构建]
  

2019年9月25日 (三) 03:07的版本

Suda-HLT主要项目

LAGroup(语言分析小组)

 作为自然语言处理基础研究,苏州大学自然语言分析技术的目标是精准分析句子的词法和句法信息,以支持各种应用需求。我们的技术主要有几个特点:1)采用目前行业领先的多种机器学习技术,包括传统的基于离散特征的方法和深度学习方法,以提高分析性能,同时兼顾效率;2)基于我们做出的面向多源异构数据融合的一系列工作,充分利用现有的各种人工标注数据,提高模型的分析能;3)采用我们提出的基于局部标注表示的统一框架,允许训练数据只包含局部标注信息,从而充分利用各种弱标注数据,也可以将先验知识转化为弱标注信息,从而对模型解码过程进行直接约束;4)我们不断针对多源网络文本,进行人工标注,不断增加高质量训练数据。
基于以上技术,我们搭建了一个稳定、高准确率、高效率的汉语理解平台,从而实现技术不断积累和沉淀,目前已经向阿里、科沃斯、狗尾草等公司提供服务。同时,为了支持人工数据标注工作,我们也搭建了一个数据标注平台,采用局部标注、严格双人标注、专家审核等形式,我们发现可以最大限度降低数据标注管理者的工作,同时也可以在降低人力成本和提高数据质量之间获得平衡。


KG(知识图谱)

  • 情感知识构建
* 中文实体情感知识库 SentiBridge
* 电商情感词典ECSD
  • 知识图谱构建

MT