メモリサイズが増大し低価格化が進んだことから, メモリ上でのデータベースの運用は珍しいものではなくなった. そのようなシステムではかつてのディスクI/Oではなく, プロセッサやメインメモリのリソースがボトルネックとなる. 本研究では, 転置索引を用いた全文検索システムをメモリ上で運用することを前提に, 圧縮データ構造の処理効率を改善することを検討する. 多くの圧縮スキームにおいて重要な要素技術であるPrefix Sum処理の高速化手法ならびに, 近年注目されているPForDelta圧縮スキームの細粒度処理を可能にした改良版データ構造とその処理手法を提案する
隨著電腦以及網際網路的普及,越來越多各領域的資料被數位化,利用電腦幫助儲存及管理資料。有許多資料在數位化的過程中,採用tree的資料結構來表達以及儲存。也因此,如何查詢這些龐大的資料,就成為重要的課題...
В настоящее время множество систем поддержки принятия решений включают в себя и системы...
1超文本与超文本系统 超文本是一种表示和管理知识、信息的新方法,从本质上说,它还是一个由节点和链构成的信息网络.其中,节点是超文本表达信息的一个基本单位,一个节点是一个相对独立的信息块,它表达一个特定...
在64位体系结构的 CPU 中,字长从32位扩展到64位,处理器每次可以处理的数据也增加到64位。这对搜索引擎使用的核心数据结构--倒排索引的压缩与解压缩带来一定的影响。针对当前32位整数字对齐压缩算...
高性能なコンピュータが開発されるに従い、大量のデータから、目的の情報を検索することのできる検索エンジンは不可欠になる。本論文では、従来の逐次検索と2分探索法を組み合わせて、高速検索が可能な処理系の開発...
本研究提出一個新的視訊索引方 法:Cone-tree 。目前所有的索引方法都 使用特徵向量的距離做為編索引的基 礎。但是以距離為基礎的索引方法,不 適合處理向量的平移(scalar shift)的問 ...
提出一种新颖的优化方案.方案采用了查询谓词分组和连接分组技术,在众多的查询之间实现了计算共享,较大地节约了系统中存在的算子的数量并提高了处理速度.连接分组首先检查系统当前有无可以利用的中间结果,在这个...
[[abstract]]在一個資訊爆炸的時代,我們所接觸的訊息日益增多並與電腦及網路普及也造就了知識技術的快速流通,如何有效的管理與保存這些重要的資產,已經成為當下一個重要研究的課題。目前對於資料庫核...
目前,隨著資料急速地增加,大規模可擴充性的高度分散式資料庫服務已逐漸成為一種趨勢。在資料如此分散的環境下,如何讓資料的查詢更有效率,建立一個好的索引扮演著相當重要的角色,加上越來越多的資料庫程式應用像...
マイクロプロセッサと主記憶との動作周波数差は,年々拡大する一方である.両者の周波数差は,マ イクロプロセッサの性能阻害要因であり,一般的にメモリ・ウォール問題と呼ばれる.本稿では,メモ リ・ウォール問...
We develop a new strategy for processing a collection of documents on a cluster of multicore process...
卒業論文textWWWには膨大な情報が溢れており、Vernoはそのリソースを有効に活用するための手段である、全文検索システムの一つである。Vernoは「プログラマブルな検索エンジン」をコンセプトとし、...
We develop a new strategy for processing a collection of documents on a cluster of multicore process...
目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP).一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数...
通过对1996至2005年十年间中国上市公司的净利润的实证分析,我们发现当净利润为正时,盈余数据的左起第二位为0的概率比正常情况的概率显著的大,为9的概率比正常情况的概率显著的小;而当净利润为负时,情...
隨著電腦以及網際網路的普及,越來越多各領域的資料被數位化,利用電腦幫助儲存及管理資料。有許多資料在數位化的過程中,採用tree的資料結構來表達以及儲存。也因此,如何查詢這些龐大的資料,就成為重要的課題...
В настоящее время множество систем поддержки принятия решений включают в себя и системы...
1超文本与超文本系统 超文本是一种表示和管理知识、信息的新方法,从本质上说,它还是一个由节点和链构成的信息网络.其中,节点是超文本表达信息的一个基本单位,一个节点是一个相对独立的信息块,它表达一个特定...
在64位体系结构的 CPU 中,字长从32位扩展到64位,处理器每次可以处理的数据也增加到64位。这对搜索引擎使用的核心数据结构--倒排索引的压缩与解压缩带来一定的影响。针对当前32位整数字对齐压缩算...
高性能なコンピュータが開発されるに従い、大量のデータから、目的の情報を検索することのできる検索エンジンは不可欠になる。本論文では、従来の逐次検索と2分探索法を組み合わせて、高速検索が可能な処理系の開発...
本研究提出一個新的視訊索引方 法:Cone-tree 。目前所有的索引方法都 使用特徵向量的距離做為編索引的基 礎。但是以距離為基礎的索引方法,不 適合處理向量的平移(scalar shift)的問 ...
提出一种新颖的优化方案.方案采用了查询谓词分组和连接分组技术,在众多的查询之间实现了计算共享,较大地节约了系统中存在的算子的数量并提高了处理速度.连接分组首先检查系统当前有无可以利用的中间结果,在这个...
[[abstract]]在一個資訊爆炸的時代,我們所接觸的訊息日益增多並與電腦及網路普及也造就了知識技術的快速流通,如何有效的管理與保存這些重要的資產,已經成為當下一個重要研究的課題。目前對於資料庫核...
目前,隨著資料急速地增加,大規模可擴充性的高度分散式資料庫服務已逐漸成為一種趨勢。在資料如此分散的環境下,如何讓資料的查詢更有效率,建立一個好的索引扮演著相當重要的角色,加上越來越多的資料庫程式應用像...
マイクロプロセッサと主記憶との動作周波数差は,年々拡大する一方である.両者の周波数差は,マ イクロプロセッサの性能阻害要因であり,一般的にメモリ・ウォール問題と呼ばれる.本稿では,メモ リ・ウォール問...
We develop a new strategy for processing a collection of documents on a cluster of multicore process...
卒業論文textWWWには膨大な情報が溢れており、Vernoはそのリソースを有効に活用するための手段である、全文検索システムの一つである。Vernoは「プログラマブルな検索エンジン」をコンセプトとし、...
We develop a new strategy for processing a collection of documents on a cluster of multicore process...
目前的查询性能预测方法一般都是利用查询的特征、文档集合的特征以及结果列表的特征预测查询结果的平均精度(AP).一种性能预测方法与其他方法比较时,通常采用预测的AP和查询真实AP之间的皮尔森线性相关系数...
通过对1996至2005年十年间中国上市公司的净利润的实证分析,我们发现当净利润为正时,盈余数据的左起第二位为0的概率比正常情况的概率显著的大,为9的概率比正常情况的概率显著的小;而当净利润为负时,情...
隨著電腦以及網際網路的普及,越來越多各領域的資料被數位化,利用電腦幫助儲存及管理資料。有許多資料在數位化的過程中,採用tree的資料結構來表達以及儲存。也因此,如何查詢這些龐大的資料,就成為重要的課題...
В настоящее время множество систем поддержки принятия решений включают в себя и системы...
1超文本与超文本系统 超文本是一种表示和管理知识、信息的新方法,从本质上说,它还是一个由节点和链构成的信息网络.其中,节点是超文本表达信息的一个基本单位,一个节点是一个相对独立的信息块,它表达一个特定...