随着开源软件项目规模的增大,如何快速地学习、理解一个软件项目成为基于复用的软件开发活动中的一个重要环节.这些开源软件项目的源代码和文档集的数量都比较庞大,开发人员在学习过程中查找和阅读这些软件信息需要花费大量的时间和精力.为此,提出一种基于自然语言的软件信息检索方法,以帮助开发人员快速地检索并理解其需要的软件信息.基于该方法,设计并实现了NaLSiSe工具.NaLSiSe工具在中国计算机学会主办的第一届软件研究成果原型竞赛中荣获优秀奖.以Lucene为例,验证了该工具可以有效减少开发人员阅读源代码和文档的工作量,同时具备简洁的用户界面和友好的用户体验.国家863计划:网构化软件生产、构造和复用技术与工具; 国家自然科学基金:软件构件自动标签及其应用技术研究中文核心期刊要目总览(PKU)中国科技核心期刊(ISTIC)中国科学引文数据库(CSCD)0991-954
本文介绍信息检索、语义搜索、本体知识、词汇本体知识等基本概念及其相互之间的关系,特别是Ontology这个概念的内涵从哲学本体论到信息技术的本体知识的演进、本体知识的构造与类别、跟汉语相关的词汇本体知...
检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作.本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译...
碩士論文[[abstract]]內容式擷取(Content-Based Retrieval, CBR)為多媒體領域中一個重要且具有挑戰性的研究議題,近年來隨著電腦網路與軟硬體的快速發展,3D物件的使用...
Рассмотрены существующие методы синтаксического анализа естественно-языкового текста и выделены осно...
文章通过分析问题回答等信息检索系统对于语义资源的需求,借鉴国外语义资源建设的实践和经验,指出面向处理汉语的信息检索系统的语义资源,至少应该包括下列三种:1)汉语词网(CWN),提供基本的词汇概念及其关...
資訊檢索(Information Retrieval)一直是資訊學界的重要研究領域,但長久以來並未能在其它的學門中發揮其重要性,然而藉由Internet的普及與網路資源的激增,以資訊檢索為基礎的網路搜...
在網際網路的蓬勃發展與美國數位圖書館計葷的帶動下,有關數位圖書館的研究已經受到全球性的重視,由於所有的數位圖書館計畫都希望所提供的數位館藏以及資訊能夠排除語言障礙,提供全球性且不分種族的服務,因此近來...
本論文提出了以使用者相關回饋提升檢索效能的新架構。過去在語音檢索的領域,有關使用者相關回饋的研究僅限於套用文件檢索領域的技術來修正檢索模型,而本論文提出了以使用者相關回饋來重估測辨識系統的聲學模型參數...
研究代表者publisher機関番号: 34419; 研究種目:若手研究(B); 研究期間:2011~2012; 課題番号:23700996; 研究分野:総合領域; 科研費の分科・...
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用Info...
Рассмотрена технология поиска и обработки научно-технической информации из различных источн...
查全率和查准率是评估信息检索系统检索质量的两个基本标准.长期以来,基于这两个标准,存在着多种评价方法.但是,这些方法基本上是对查全率和查准率做简单的处理,仅反映检索的平均性能,而对检索稳定性没有分析,...
本研究采用概念特征自由列举实验范式,考察三类范畴(动物、自然食物、人造物) 自然概念的语义特征提取反应时间的范畴效应。结果表明, ⑴语义特征提取的反应时间存在范畴效应:提取动物特征的时间显著短于提取自...
電子情報通信学会 第18回データ工学ワークショップ : 2007年2月28日~2007年3月2日 : 広島プリンスホテル(広島県広島市)DEWS2007 : Hiroshima検索における問題点とし...
主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在...
本文介绍信息检索、语义搜索、本体知识、词汇本体知识等基本概念及其相互之间的关系,特别是Ontology这个概念的内涵从哲学本体论到信息技术的本体知识的演进、本体知识的构造与类别、跟汉语相关的词汇本体知...
检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作.本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译...
碩士論文[[abstract]]內容式擷取(Content-Based Retrieval, CBR)為多媒體領域中一個重要且具有挑戰性的研究議題,近年來隨著電腦網路與軟硬體的快速發展,3D物件的使用...
Рассмотрены существующие методы синтаксического анализа естественно-языкового текста и выделены осно...
文章通过分析问题回答等信息检索系统对于语义资源的需求,借鉴国外语义资源建设的实践和经验,指出面向处理汉语的信息检索系统的语义资源,至少应该包括下列三种:1)汉语词网(CWN),提供基本的词汇概念及其关...
資訊檢索(Information Retrieval)一直是資訊學界的重要研究領域,但長久以來並未能在其它的學門中發揮其重要性,然而藉由Internet的普及與網路資源的激增,以資訊檢索為基礎的網路搜...
在網際網路的蓬勃發展與美國數位圖書館計葷的帶動下,有關數位圖書館的研究已經受到全球性的重視,由於所有的數位圖書館計畫都希望所提供的數位館藏以及資訊能夠排除語言障礙,提供全球性且不分種族的服務,因此近來...
本論文提出了以使用者相關回饋提升檢索效能的新架構。過去在語音檢索的領域,有關使用者相關回饋的研究僅限於套用文件檢索領域的技術來修正檢索模型,而本論文提出了以使用者相關回饋來重估測辨識系統的聲學模型參數...
研究代表者publisher機関番号: 34419; 研究種目:若手研究(B); 研究期間:2011~2012; 課題番号:23700996; 研究分野:総合領域; 科研費の分科・...
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用Info...
Рассмотрена технология поиска и обработки научно-технической информации из различных источн...
查全率和查准率是评估信息检索系统检索质量的两个基本标准.长期以来,基于这两个标准,存在着多种评价方法.但是,这些方法基本上是对查全率和查准率做简单的处理,仅反映检索的平均性能,而对检索稳定性没有分析,...
本研究采用概念特征自由列举实验范式,考察三类范畴(动物、自然食物、人造物) 自然概念的语义特征提取反应时间的范畴效应。结果表明, ⑴语义特征提取的反应时间存在范畴效应:提取动物特征的时间显著短于提取自...
電子情報通信学会 第18回データ工学ワークショップ : 2007年2月28日~2007年3月2日 : 広島プリンスホテル(広島県広島市)DEWS2007 : Hiroshima検索における問題点とし...
主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在...
本文介绍信息检索、语义搜索、本体知识、词汇本体知识等基本概念及其相互之间的关系,特别是Ontology这个概念的内涵从哲学本体论到信息技术的本体知识的演进、本体知识的构造与类别、跟汉语相关的词汇本体知...
检索一篇文档在其他语言中的译文对于双语平行语料库的建立是一件很有意义的工作.本文提出一种改进的跨语言相似文档检索算法,该算法使用双语词典或统计翻译模型作为双语知识库,查找两篇文档的共同翻译词对,把翻译...
碩士論文[[abstract]]內容式擷取(Content-Based Retrieval, CBR)為多媒體領域中一個重要且具有挑戰性的研究議題,近年來隨著電腦網路與軟硬體的快速發展,3D物件的使用...