查询优化在大型检索系统中是十分必要的.查询优化包括静态形式、结合词集的形式和动态自动聚类形式.文章概要分析了AlltheWeb、Teoma、Vivisimo、GuideBeam等动态自动聚类的特点和机制,并提出了建立动态自动聚类系统的一些建议.中文核心期刊要目总览(PKU)中国社会科学引文索引(CSSCI)0334-402
Формулируется задача определения устойчивости кластерной структуры при автоматической класс...
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集...
产业群战略已经成为各国工业政策的一项重要内容,但由于产业的多样性和集群发展的动态性,实施中难有一套完整的定式,实际操作中难度较大.为此,本文首先对产业群基本动力机制进行总结,按照集群竞争优势的强度以及...
针对基于密度的聚类算法不能自动处理密度分布不均匀的数据问题,提出一种基于不均匀密度的自动聚类算法.该算法既保持了一般基于密度算法的优点,也能有效地处理分布不均匀的数据.实验结果表明,该算法是有效的.国...
介绍了蒸发、溅射产生团簇的原理以及通过调节参数得到不同大小的团簇材料,阐述了团簇的基本结构和性质, 并介绍了团簇在镀膜及功能膜如光学膜磁性膜方面的应用.国家自然科学基金中文核心期刊要目总览(PKU)中...
一般にWeb検索システムは仮想的・平均的なユーザにとって有益な情報を提供できるよう設計されている。しかし、現実にシステムを利用するのは多様な個々のユーザであり、求める情報の傾向もそれぞれに異なる。検索...
传统的数据挖掘技术如分类、聚类、关联和异常点发现等技术与OLAP技术的结合通常采用的方法是分类、聚类、关联和异常点发现的结果即为任务的终点和目标.然而事实上,在实际需求中用户不仅仅需要分类、聚类等数据...
聚类是数据挖掘领域中最活跃的研究分支之一,聚类技术在其他的科学领域也有广泛的应用。迄今为止已经提出了大量的聚类算法,其中基于密度的DBSCAN算法因其很多优点而备受关注,为了减少DBSCAN的区域查询...
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακ...
在聚类优化问题定义的基础上,介绍了内部度量、外部度量和相对度量3种聚类质量评价方法,阐述各种具有代表性的度量的特征及其对划分优化的作用,总结聚类评价方法的应用问题.铁道部科技研究项目中文核心期刊要目总...
随着信息技术的高速发展,数据量急剧增长,如何从海量的数据中提取有用的信息和知识成为当务之急。数据挖掘就是解决这个问题的新兴领域。聚类分析作为数据挖掘领域中的一个重要课题,受到了越来越多的关注。目前聚类...
R*树是目前公认查询效果很好的R树变体,但是其构造代价较原始R树增加数倍,对于插入删除和更新频繁的空间数据效果不好.为此,本文提出一种基于惰性聚类分裂技术的R树动态实现方法(LR树).惰性聚类分裂技术...
[[abstract]]在本研究中, 我們示範了一個基於自動分群為基礎的特徵合併程序, 這個合併程序藉由自動分群進行特徵轉換, 並使用合併程序產生新的特徵. 這個新的特徵處理流程相較於傳統的分類來說,...
根据弹丸在舱内运动及出舱后弹丸与炮弹之间的运动特点,建立了完整的子母弹抛撤飞行力学模型.该模型的建立,便于研究活塞式动态抛撒的子母弹的运动特征,以及子弹在舱内和舱外的运动规律.另外,根据所建立的模型和...
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最...
Формулируется задача определения устойчивости кластерной структуры при автоматической класс...
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集...
产业群战略已经成为各国工业政策的一项重要内容,但由于产业的多样性和集群发展的动态性,实施中难有一套完整的定式,实际操作中难度较大.为此,本文首先对产业群基本动力机制进行总结,按照集群竞争优势的强度以及...
针对基于密度的聚类算法不能自动处理密度分布不均匀的数据问题,提出一种基于不均匀密度的自动聚类算法.该算法既保持了一般基于密度算法的优点,也能有效地处理分布不均匀的数据.实验结果表明,该算法是有效的.国...
介绍了蒸发、溅射产生团簇的原理以及通过调节参数得到不同大小的团簇材料,阐述了团簇的基本结构和性质, 并介绍了团簇在镀膜及功能膜如光学膜磁性膜方面的应用.国家自然科学基金中文核心期刊要目总览(PKU)中...
一般にWeb検索システムは仮想的・平均的なユーザにとって有益な情報を提供できるよう設計されている。しかし、現実にシステムを利用するのは多様な個々のユーザであり、求める情報の傾向もそれぞれに異なる。検索...
传统的数据挖掘技术如分类、聚类、关联和异常点发现等技术与OLAP技术的结合通常采用的方法是分类、聚类、关联和异常点发现的结果即为任务的终点和目标.然而事实上,在实际需求中用户不仅仅需要分类、聚类等数据...
聚类是数据挖掘领域中最活跃的研究分支之一,聚类技术在其他的科学领域也有广泛的应用。迄今为止已经提出了大量的聚类算法,其中基于密度的DBSCAN算法因其很多优点而备受关注,为了减少DBSCAN的区域查询...
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακ...
在聚类优化问题定义的基础上,介绍了内部度量、外部度量和相对度量3种聚类质量评价方法,阐述各种具有代表性的度量的特征及其对划分优化的作用,总结聚类评价方法的应用问题.铁道部科技研究项目中文核心期刊要目总...
随着信息技术的高速发展,数据量急剧增长,如何从海量的数据中提取有用的信息和知识成为当务之急。数据挖掘就是解决这个问题的新兴领域。聚类分析作为数据挖掘领域中的一个重要课题,受到了越来越多的关注。目前聚类...
R*树是目前公认查询效果很好的R树变体,但是其构造代价较原始R树增加数倍,对于插入删除和更新频繁的空间数据效果不好.为此,本文提出一种基于惰性聚类分裂技术的R树动态实现方法(LR树).惰性聚类分裂技术...
[[abstract]]在本研究中, 我們示範了一個基於自動分群為基礎的特徵合併程序, 這個合併程序藉由自動分群進行特徵轉換, 並使用合併程序產生新的特徵. 這個新的特徵處理流程相較於傳統的分類來說,...
根据弹丸在舱内运动及出舱后弹丸与炮弹之间的运动特点,建立了完整的子母弹抛撤飞行力学模型.该模型的建立,便于研究活塞式动态抛撒的子母弹的运动特征,以及子弹在舱内和舱外的运动规律.另外,根据所建立的模型和...
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最...
Формулируется задача определения устойчивости кластерной структуры при автоматической класс...
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集...
产业群战略已经成为各国工业政策的一项重要内容,但由于产业的多样性和集群发展的动态性,实施中难有一套完整的定式,实际操作中难度较大.为此,本文首先对产业群基本动力机制进行总结,按照集群竞争优势的强度以及...