最近鄰居法是一種在機器學習及資料探勘應用上相當常見的演算法。有相當多種方法可以實作最近鄰居法,其中樹狀結構演算法包含k維樹及球樹。球樹搜尋法是一種在高維度資料裡表現相當好的演算法。本工作專注於增進球樹搜尋法的效能。我們提出同心球樹搜尋法用來改變球樹的根結點結構。我們也提出了幾種策略法用來改變樹狀搜尋的順序。實驗結果顯示我們的方法能有效地降低拜訪的資料點個數及樹狀節點個數,以提升效能,節省不少搜尋時間。另外我們發現同心球樹在高維度的資料上表現相當良好,能增進更多的效能。最後我們的實驗也發現,如同傳統的球樹,同心球樹在不同的資料集的表現差異相當大。The K-nearest neighbors(KNN) is often a necessary algorithm in many machine learning and data mining applications.There are several tree structure algorithm to implement KNN, like K-d tree search and Ball-tree search.Ball-tree search is a powerful algorithm to search KNN for high dimension.In this work, we focus on improving the efficiency of ball-tree.We propose concentric ball-tree which change the leaf node structure of ball-tree.We also use several heuristic to chang...
最近邻体法是一类有效的植物空间分布格局分析方法,邻体距离的概率分布模型用于描述邻体距离的统计特征,属于常用的最近邻体法之一。然而,聚集分布格局中邻体距离(个体到个体)的概率分布模型表达式复杂,参数估计...
Рассматривается информационная система 3D-Clustering, предназначенная для решения задач оптимальной ...
针对目前聚类算法不能有效的处理模糊边界点的问题,提出了一种基于真实核心点的RDBSCAN聚类算法。提出真实核心点的概念,首先在密度聚类过程中的核心点进一步处理分类,把影响聚类效果的伪核心点剔除,将剩下...
計畫編號: NSC99-2221-E343-006執行機構: 南華大學資訊工程學系研究期間: 9908~10007[[abstract]]尋找最接近k 個鄰居(k nearest neighbo...
随着近年来信息技术和互联网技术的高速发展,我们进入了大数据时代,海量数据需要强大的计算能力。相似性连接操作作为机器学习、数据库、基因信息学等学科的一个基本操作,如何大幅提高计算速度和计算效率,成为了现...
В данной статье рассматривается проблема вычислительно сложного алгоритма классификации, используем...
传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数...
[[abstract]]近年來,支援向量機 (Support Vector Machines,SVMs) 在樣式識別與數據挖掘的領域中已被廣泛用於解決各式各樣的分類問題。支援向量機的基本原則在於根據所...
在综合考虑气候、植被、地貌等凶素的基础上,提出一种基于多层次格网模型的最近邻指数-模糊聚类生态区域划分算法(Nearest Neighbor Index Fuzzy clustering,NNI-FI...
これまでに, データベースに対する検索システムは, 精度, 再現度, 速度ともにめざましく進歩した. 検索は生活のあらゆるレベルに浸透し, コモディティ化したため, 検索に対する要求も性能面はもちろん...
K-means 演算法是一個十分普及的分類演算法,它廣泛的運用在各種工程以及科學領域上,像是影像分割(Image segmentation)、圖形識別(Pattern classification)與...
計畫編號: NSC98-2221-E343-008執行機構: 南華大學資訊工程學系研究期間: 9808~9907[[abstract]]PNN(Pairwise-nearest-neighbor...
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集...
近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング技術が注目されて...
В статье представлены результаты анализа и экспериментов применения различных характеристик множеств...
最近邻体法是一类有效的植物空间分布格局分析方法,邻体距离的概率分布模型用于描述邻体距离的统计特征,属于常用的最近邻体法之一。然而,聚集分布格局中邻体距离(个体到个体)的概率分布模型表达式复杂,参数估计...
Рассматривается информационная система 3D-Clustering, предназначенная для решения задач оптимальной ...
针对目前聚类算法不能有效的处理模糊边界点的问题,提出了一种基于真实核心点的RDBSCAN聚类算法。提出真实核心点的概念,首先在密度聚类过程中的核心点进一步处理分类,把影响聚类效果的伪核心点剔除,将剩下...
計畫編號: NSC99-2221-E343-006執行機構: 南華大學資訊工程學系研究期間: 9908~10007[[abstract]]尋找最接近k 個鄰居(k nearest neighbo...
随着近年来信息技术和互联网技术的高速发展,我们进入了大数据时代,海量数据需要强大的计算能力。相似性连接操作作为机器学习、数据库、基因信息学等学科的一个基本操作,如何大幅提高计算速度和计算效率,成为了现...
В данной статье рассматривается проблема вычислительно сложного алгоритма классификации, используем...
传统k-means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进k-means初始聚类中心选择的算法。算法首先将所有对象作为一个大类,然后不断从对象数...
[[abstract]]近年來,支援向量機 (Support Vector Machines,SVMs) 在樣式識別與數據挖掘的領域中已被廣泛用於解決各式各樣的分類問題。支援向量機的基本原則在於根據所...
在综合考虑气候、植被、地貌等凶素的基础上,提出一种基于多层次格网模型的最近邻指数-模糊聚类生态区域划分算法(Nearest Neighbor Index Fuzzy clustering,NNI-FI...
これまでに, データベースに対する検索システムは, 精度, 再現度, 速度ともにめざましく進歩した. 検索は生活のあらゆるレベルに浸透し, コモディティ化したため, 検索に対する要求も性能面はもちろん...
K-means 演算法是一個十分普及的分類演算法,它廣泛的運用在各種工程以及科學領域上,像是影像分割(Image segmentation)、圖形識別(Pattern classification)與...
計畫編號: NSC98-2221-E343-008執行機構: 南華大學資訊工程學系研究期間: 9808~9907[[abstract]]PNN(Pairwise-nearest-neighbor...
传统K-means算法的聚类数k值事先无法确定,而且算法是随机性地选取初始聚类中心点,这样容易造成聚类结果不稳定,且准确率较低。基于SSE用来选取聚类个数k值,基于聚类中心点所在的周围区域相对比较密集...
近年の技術の進歩によって記憶装置の大容量化が進み、膨大な量のデータを人間が直接扱うことが困難になってきている。そこで、膨大なデータの中から有用な情報を取り出す技術としてデータマイニング技術が注目されて...
В статье представлены результаты анализа и экспериментов применения различных характеристик множеств...
最近邻体法是一类有效的植物空间分布格局分析方法,邻体距离的概率分布模型用于描述邻体距离的统计特征,属于常用的最近邻体法之一。然而,聚集分布格局中邻体距离(个体到个体)的概率分布模型表达式复杂,参数估计...
Рассматривается информационная система 3D-Clustering, предназначенная для решения задач оптимальной ...
针对目前聚类算法不能有效的处理模糊边界点的问题,提出了一种基于真实核心点的RDBSCAN聚类算法。提出真实核心点的概念,首先在密度聚类过程中的核心点进一步处理分类,把影响聚类效果的伪核心点剔除,将剩下...