论文一、本体论在自动问答系统中的应用_骆正华基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量来联系问句实例和领域知识,达到问题和答案的连接。用户提交的问句进行分词、 词性标注、 语块划分等浅层句法分析在语块结构化的问句实例中找相似的问句构造本体的目的都是为了实现某种程度的知识共享和重用。 领域知识可划分为三个层次,通用概念知识->领域概念知识->具体事实知识。领域具体事实知识的表示采用XML标记规范,主题、操作事件或业务实体、描述或属性。问句语义的表示主题、疑问块、问句语义表示问句向量本质上有三种情况主题+实体+属性主题+事件+角色向量是一组无序的关键字二、一种基于加权语义相似度模型的自动问答系统_刘亚军利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度。关键词语(权重高的词语)三、自动问答系统中的问题理解研究_曹志娟QA系统主要分为五个部分问题理解、信息检索、信息处理、答案抽取、FAQ系统。主要是三个主要部分问题理解信息检索答案抽取讲述问题理解的两个关键点:问题分类和问句扩展。问题分类词法分析:问句分词和标注 问题分类:基于答案对象的类型分类,增加疑问词短语分类、问题标准型、特征词分类1. 识别问句中的疑问词,根据疑问词找到句型模式集合 - 人、地点、具体时间、持续事件、数量、原因、方法、其他2. 与集合中的句型规则进行匹配,从而得到问题标准型 - 通过形式语言制定具体规则 - 通过概率分类的方法3. 再根据特征词确定问题领域 - 特征词的扩充问句扩展问句重写-更改为定制的模板关键词扩展名词、动词的关键词
论文简介-1
March 6, 2019 · 1 min · jiezi