"现代汉语语义词典(SKCC)"是一个面向汉英机器翻译的大规模汉语语义知识库,它以数据库文件形式收录6.6万余实词,不仅给出每个词语所属的词类、语义类,而且以义项为单位详细描述了它们的各种语义搭配限制.目的是为计算机语义自动分析、词义消歧等任务提供强有力的支持.本文介绍这部语义词典的结构、内容,并以实例说明这部词典可有效地解决翻译系统中的词汇歧义(WSD)问题.科技部科研项目中文核心期刊要目总览(PKU)中国社会科学引文索引(CSSCI)01134-14
语义角色除了受句法结构限制之外,同词汇的语义特征也有着紧密的内在联系.对于一些仅依靠句法分析不能很好解决的角色标注问题,如句法结构相同的两个成分所对应的角色分别为完全不同的施事、受事角色的情况,可以通...
针对当前信息分类编码标准数量和所涉及领域不断增加的情况,文章提出了一个新的信息分类编码标准分类框架,以解决信息分类编码标准分类体系的完整性、稳定性和开放性等问题.它一方面在高层继承已有的标准分类体系,...
“不如”在上古汉语中从表示比较的动词发展为表示选择的动词,并进一步发展为表示建议的副词.近代汉语中的“还是”、上古汉语中的“其”以及山东方言中的“胜”等也是从比较、选择发展为表示建议的.可见,从比较、...
该文讨论如何构造合适的汉语语义描写体系并建设相应的语义知识库,从而为文本语义的计算机自动分析提供可靠的资源.文章提出的技术路线是:在生成词库论和论元结构理论的指导下,分别描写名词的物性结构和动词、形容...
语言知识库是自然语言处理系统的重要组成部分,迄今为止的各种知识库重在对实词的句法和语义知识的描述,很少涉及虚词.本文主要探讨现代汉语虚词知识库的建构,包括建立一个基于用法的机器词典,一个与之配套的有虚...
提出E-Chunk概念,它是一种新的知识表示方式.E-Chunk是无歧义翻译单元,形式上是一个无翻译歧义的单词或单词串.它是基于语义定义的,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征.本...
认识语言基本结构单位的性质和特点是把握语言结构脉络的基础.汉语的基本结构单位是字,其特点是突出语义;表义性的汉字忠实地反映了这种特点.语句的结构框架是"话题--说明&quot...
该文主要讨论名词的词义描写和研究问题.首先通过对几种主要的词汇语义学理论(包括结构主义语义学、生成主义语义学、概念语义学和自然语义元语言理论)进行介绍和评述,指出它们在对名词进行语义刻画方面存在缺陷和...
词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高.但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题,要真正有效地提高词义...
作为文本内容理解的媒介与载体,词汇语义知识库已被广泛应用于信息检索、信息提取、问答系统、自动文摘等方面,成为自然语言处理不可或缺的基础资源.本文介绍词汇语义知识库研究与开发的现状,重点分析了WordN...
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.该文研究了基于大规模语料库的汉语词义相似度计算方法,...
针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法.首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的...
《现代汉语语法信息词典》是面向汉语信息处理的基本语言知识库。1995年11月底通过技术鉴定。5年来,北大计算语言学研究所在应用、推广的同时,仍把重要的力量投入词典本身的发展。至目前为止,词典收词已由5...
汉语虚词语义描写较为粗疏,也存在一定的问题,文章从语义分析、语义演变机制等角度分析"简直"一词的意义,立体表现"简直"的含义,并...
语义问题一直是自然语言处理领域的一个难点。近年来,随着深度学习技术的逐渐兴起,越来越多的研究采用深度神经网络对语义相关的问题进行建模。在语义层面上开展研究,能更为有效地解决一些传统统计方法所难以解决的...
语义角色除了受句法结构限制之外,同词汇的语义特征也有着紧密的内在联系.对于一些仅依靠句法分析不能很好解决的角色标注问题,如句法结构相同的两个成分所对应的角色分别为完全不同的施事、受事角色的情况,可以通...
针对当前信息分类编码标准数量和所涉及领域不断增加的情况,文章提出了一个新的信息分类编码标准分类框架,以解决信息分类编码标准分类体系的完整性、稳定性和开放性等问题.它一方面在高层继承已有的标准分类体系,...
“不如”在上古汉语中从表示比较的动词发展为表示选择的动词,并进一步发展为表示建议的副词.近代汉语中的“还是”、上古汉语中的“其”以及山东方言中的“胜”等也是从比较、选择发展为表示建议的.可见,从比较、...
该文讨论如何构造合适的汉语语义描写体系并建设相应的语义知识库,从而为文本语义的计算机自动分析提供可靠的资源.文章提出的技术路线是:在生成词库论和论元结构理论的指导下,分别描写名词的物性结构和动词、形容...
语言知识库是自然语言处理系统的重要组成部分,迄今为止的各种知识库重在对实词的句法和语义知识的描述,很少涉及虚词.本文主要探讨现代汉语虚词知识库的建构,包括建立一个基于用法的机器词典,一个与之配套的有虚...
提出E-Chunk概念,它是一种新的知识表示方式.E-Chunk是无歧义翻译单元,形式上是一个无翻译歧义的单词或单词串.它是基于语义定义的,具有无歧义性、复现性、可嵌套性、内部结构句法自足性等特征.本...
认识语言基本结构单位的性质和特点是把握语言结构脉络的基础.汉语的基本结构单位是字,其特点是突出语义;表义性的汉字忠实地反映了这种特点.语句的结构框架是"话题--说明&quot...
该文主要讨论名词的词义描写和研究问题.首先通过对几种主要的词汇语义学理论(包括结构主义语义学、生成主义语义学、概念语义学和自然语义元语言理论)进行介绍和评述,指出它们在对名词进行语义刻画方面存在缺陷和...
词义消歧研究在自然语言处理的许多应用领域中具有重要的理论和实践意义,在机器翻译中更是如此,它直接关系到译文质量的提高.但目前已有的词义消歧系统基本上都面临着消歧知识获取的瓶颈问题,要真正有效地提高词义...
作为文本内容理解的媒介与载体,词汇语义知识库已被广泛应用于信息检索、信息提取、问答系统、自动文摘等方面,成为自然语言处理不可或缺的基础资源.本文介绍词汇语义知识库研究与开发的现状,重点分析了WordN...
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.该文研究了基于大规模语料库的汉语词义相似度计算方法,...
针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法.首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的...
《现代汉语语法信息词典》是面向汉语信息处理的基本语言知识库。1995年11月底通过技术鉴定。5年来,北大计算语言学研究所在应用、推广的同时,仍把重要的力量投入词典本身的发展。至目前为止,词典收词已由5...
汉语虚词语义描写较为粗疏,也存在一定的问题,文章从语义分析、语义演变机制等角度分析"简直"一词的意义,立体表现"简直"的含义,并...
语义问题一直是自然语言处理领域的一个难点。近年来,随着深度学习技术的逐渐兴起,越来越多的研究采用深度神经网络对语义相关的问题进行建模。在语义层面上开展研究,能更为有效地解决一些传统统计方法所难以解决的...
语义角色除了受句法结构限制之外,同词汇的语义特征也有着紧密的内在联系.对于一些仅依靠句法分析不能很好解决的角色标注问题,如句法结构相同的两个成分所对应的角色分别为完全不同的施事、受事角色的情况,可以通...
针对当前信息分类编码标准数量和所涉及领域不断增加的情况,文章提出了一个新的信息分类编码标准分类框架,以解决信息分类编码标准分类体系的完整性、稳定性和开放性等问题.它一方面在高层继承已有的标准分类体系,...
“不如”在上古汉语中从表示比较的动词发展为表示选择的动词,并进一步发展为表示建议的副词.近代汉语中的“还是”、上古汉语中的“其”以及山东方言中的“胜”等也是从比较、选择发展为表示建议的.可见,从比较、...