对信息检索系统返回结果相关度的改进,一直是信息检索领域重要的研究内容.本文首先引入查询词出现信息的概念,随后给出了查询词出现权重的形式化表示,进而将其与BM25模型结合起来.对于查询词出现权重的计算,本文采用了两种方法,即线性加权方法和因数加权方法.我们通过在GOV2数据集上的实验发现,无论哪种方法,通过加入查询词出现权重,都可以有效的改进检索结果的相关度.实验显示,对于TREC 2005的查询,MAP值的改进达到15.78%,p@10的改进达到34.68%.本文所描述的方法已经应用到TREC 2009的Web Track中.教育部科技发展中心"网络时代的科技论文快速共享研究"项目; 国家自然科学基金; 863课题; CNGI搜索引擎项目中文核心期刊要目总览(PKU)中国科技核心期刊(ISTIC)中国科学引文数据库(CSCD)中国社会科学引文索引(CSSCI)04361-3653
[[abstract]]搜尋引擎幫助人們瀏覽網頁與尋找在全球資訊網相關網頁,然而搜尋結果排名往往是根據搜尋引擎廠商自己排名演算法所產生,與使用者真正需求常會有所出入,最有效改善搜尋品質的方法就是直接透...
[[abstract]]由於電腦硬體及網路技術的快速發展,使用者對存取影像資料的需求量大增,使得影像資料庫儲存的影像數量大幅成長,包含的影像內容也愈來愈多元而且複雜,因此更需要能符合這些變化的影像搜尋...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果.该文提出了一种新的思路...
本文首先分析基于关键词的搜索的困难(查询串的表达不忠和表达差异等),说明基于语义的搜索的必要性.接着,尝试通过对"意义"和"意义相同&qu...
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用Info...
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(L...
本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラ...
本文是对信息检索的一次理论研究.在总结了已有相关性研究的基础上,对信息检索模型之中的相关性因素做了系统梳理,认为现有信息检索模型中的系统相关性因素体现得不十分明显,同时用户相关性的因素没有很好地纳入系...
在信息检索中,“相关性”是一个关键性的概念,但是信息检索研究长久以来一直是在缺乏一个准确的相关性定义的情况下进行的。对这一概念人们做了大量研究并提出了理论框架,但这些研究成果无法很好地被加以利用。本文...
[[abstract]]由於近年來的網路普及化,再加上使用者對於影像存取需求量的增加,造成了多媒體資料庫的大幅成長,因此需要更多有效率的影像搜尋技術。而相關回饋(Relevance Feedback,...
针对当前的概念检索模型存在没有语义特征的词典和缺乏知识库层面上的推理机制等问题,采用具有很强的表达能力和可判定推理功能的描述逻辑来实现概念的扩展检索.设计了一个基于描述逻辑的概念检索模型,并对其核心的...
本文藉由收集分析網路使用者實際進行個人圖像需求之檢索過程資料,並輔以觀察、問卷,及訪談等方法,共分析34名不同領域大學院校學生之圖像檢索行為特性,及其圖像相關判斷準則及線索,並觀察檢索前後的變化。主要...
電子情報通信学会 第18回データ工学ワークショップ : 2007年2月28日~2007年3月2日 : 広島プリンスホテル(広島県広島市)DEWS2007 : Hiroshima検索における問題点とし...
【目的/意义】相关性检索机制作为知识搜索引擎最核心的部分之一,对提升机构知识库精准知识服务能力和用户满意度具有重要意义。本研究旨在为机构知识库优化相关性检索机制提供技术路线支撑。【方法/过程】首先,系...
[[abstract]]相關回饋是一個反覆的過程,讓使用者能根據前次的查詢結果來進行回饋以改善下次的擷取結果。傳統的相關回饋方法屬於短期經驗學習的相關回饋方法,並且無法在多使用者間的多個查詢過程中累積...
[[abstract]]搜尋引擎幫助人們瀏覽網頁與尋找在全球資訊網相關網頁,然而搜尋結果排名往往是根據搜尋引擎廠商自己排名演算法所產生,與使用者真正需求常會有所出入,最有效改善搜尋品質的方法就是直接透...
[[abstract]]由於電腦硬體及網路技術的快速發展,使用者對存取影像資料的需求量大增,使得影像資料庫儲存的影像數量大幅成長,包含的影像內容也愈來愈多元而且複雜,因此更需要能符合這些變化的影像搜尋...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果.该文提出了一种新的思路...
本文首先分析基于关键词的搜索的困难(查询串的表达不忠和表达差异等),说明基于语义的搜索的必要性.接着,尝试通过对"意义"和"意义相同&qu...
搜索引擎检索系统的质量评估对传统信息检索系统评估带来了新的研究问题.利用Tiangwang搜索引擎查询日志,按类别构造评估查询集,用人工判别相关性的方法对3个搜索引擎进行了检索质量评估.实验用Info...
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(L...
本論文では,専門用語を専門分野コーパスから自動抽出する方法の提案と実験的評価を報告する.本論文では名詞(単名詞と複合名詞) を対象として専門用語抽出について検討する.基本的アイデアは,単名詞のバイグラ...
本文是对信息检索的一次理论研究.在总结了已有相关性研究的基础上,对信息检索模型之中的相关性因素做了系统梳理,认为现有信息检索模型中的系统相关性因素体现得不十分明显,同时用户相关性的因素没有很好地纳入系...
在信息检索中,“相关性”是一个关键性的概念,但是信息检索研究长久以来一直是在缺乏一个准确的相关性定义的情况下进行的。对这一概念人们做了大量研究并提出了理论框架,但这些研究成果无法很好地被加以利用。本文...
[[abstract]]由於近年來的網路普及化,再加上使用者對於影像存取需求量的增加,造成了多媒體資料庫的大幅成長,因此需要更多有效率的影像搜尋技術。而相關回饋(Relevance Feedback,...
针对当前的概念检索模型存在没有语义特征的词典和缺乏知识库层面上的推理机制等问题,采用具有很强的表达能力和可判定推理功能的描述逻辑来实现概念的扩展检索.设计了一个基于描述逻辑的概念检索模型,并对其核心的...
本文藉由收集分析網路使用者實際進行個人圖像需求之檢索過程資料,並輔以觀察、問卷,及訪談等方法,共分析34名不同領域大學院校學生之圖像檢索行為特性,及其圖像相關判斷準則及線索,並觀察檢索前後的變化。主要...
電子情報通信学会 第18回データ工学ワークショップ : 2007年2月28日~2007年3月2日 : 広島プリンスホテル(広島県広島市)DEWS2007 : Hiroshima検索における問題点とし...
【目的/意义】相关性检索机制作为知识搜索引擎最核心的部分之一,对提升机构知识库精准知识服务能力和用户满意度具有重要意义。本研究旨在为机构知识库优化相关性检索机制提供技术路线支撑。【方法/过程】首先,系...
[[abstract]]相關回饋是一個反覆的過程,讓使用者能根據前次的查詢結果來進行回饋以改善下次的擷取結果。傳統的相關回饋方法屬於短期經驗學習的相關回饋方法,並且無法在多使用者間的多個查詢過程中累積...
[[abstract]]搜尋引擎幫助人們瀏覽網頁與尋找在全球資訊網相關網頁,然而搜尋結果排名往往是根據搜尋引擎廠商自己排名演算法所產生,與使用者真正需求常會有所出入,最有效改善搜尋品質的方法就是直接透...
[[abstract]]由於電腦硬體及網路技術的快速發展,使用者對存取影像資料的需求量大增,使得影像資料庫儲存的影像數量大幅成長,包含的影像內容也愈來愈多元而且複雜,因此更需要能符合這些變化的影像搜尋...
对检索结果进行聚类能够方便用户从搜索结果中快速地找到自己需要的信息,当前已有各种聚类方法和系统被广泛使用,但是,现有大部分方法由于聚类标签的可读性和描述性较差,难以达到预期效果.该文提出了一种新的思路...