This study provides the introduction of some basic definitions about clustering
method of data mining. For this purpose, it is given the methods of data mining, some
algorithms of clustering method. Meanwhile, the k -Means clustering and
Hierarchical clustering algorithms are defined.
The aim of this study is to cluster the dataset into two clusters using Hierarchical
clustering algorithm and k -Means algorithm. In order to achieve our target, two
distance formulas are used to measure the distance between the vectors in the
algorithms: the Euclidean distance and k -Nearest neighborhood distance.to compare
two methods.
Keywords: Data mining, data mining algorithms, data mining applications
ÖZ:
Bu çalışma veri madenciliği kümeleme yönteminin bazı temel tanımlarını sunar. Bu
amaçla, veri madenciliği yöntemleri, veri madenciliğinin bazı kümeleme yöntemleri
algoritmaları veriliyor. Bunun yanında, K -ortalama ve Hiyerarşik kümeleme
algoritmaları tanımlanır.
Bu çalışmanın amacı, Hirerarşik ve K -ortalama algoritmalarını kullanıp veri
kümesini iki kümeye ayırmaktır. Amacımıza ulaşmak için, vektörler arasındaki
uzaklığı ölçmek için iki tane tanım kullanılır: Öklit uzaklık ve en yakın K komşu
bağıntıları.
Anahtar kelimeler: Veri madenciliği teknikleri, veri madenciliği algorimaları, veri
madenciliği uygulamaları