DSpace
 

EMU I-REP >
02 Faculty of Engineering >
Department of Computer Engineering >
Theses (Master's and Ph.D) – Computer Engineering >

Please use this identifier to cite or link to this item: http://hdl.handle.net/11129/4899

Title: Imbalance Learning Using Heterogeneous Ensembles
Authors: Altınçay, Hakan
Zefrehi, Hossein Ghaderi
Eastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineering
Keywords: Computer Engineering
Machine learning--Artificial intelligence - Data processing
Imbalance learning
classifier ensembles
bagging
boosting
heterogeneous ensembles
multi-balancing
Issue Date: 2018
Publisher: Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ)
Citation: Zefrehi, Hossein Ghaderi. (2018). Imbalance Learning Using Heterogeneous Ensembles. Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Computer Engineering, Famagusta: North Cyprus.
Abstract: In pattern classification, class-imbalance problem occurs when the number of samples in one of the classes is much larger than those in the others. In such cases, the performance of classifiers is generally poor on the minority class. Ensembles of classifiers are used to tackle this problem where each member is developed using a different balanced dataset. In this approach, one balancing strategy and a classifier prototype is generally used. In order to increase the diversity among the members, bagging and boosting are also considered. In this thesis, the use of heterogeneous ensembles utilizing multiple prototypes and multiple balancing schemes for imbalance learning is addressed. Experiments conducted on 66 datasets have shown that significant improvements can be achieved by employing multiple prototypes. It is also observed that multiple balancing schemes contribute to the performance scores, especially in simple and bagging-based ensembles.
ÖZ: Örüntü tanımada, bir sınıftaki örnek sayısı diğer sınıflarınkinden çok daha fazla olduğunda sınıf-denksizliği problem oluşmaktadır. Bu tür durumlarda, sınıflandırıcı başarımı kıüçük sınflarda düşük olmaktadır. Bu problemi aşmak için, her üyenin denkleştirilmiş bir veri kümesi ile eğitildiği çoğul sınıflandırıcılı sistemler kullanılmaktadır. Bu sistemler, genellikle bir denkleştirme ve bir sınıflandırıcı tipi ile geliştirilmektedir. Sınıflandırıcılar arasındaki farklılıkları artırmak için, torbalama ve artırma teknikleri de kullanılmaktadır. Bu tezde, birden fazla denkleştirme ve sınıflandırcı tipi kullanan heterojen çoğul sınıflandırıcı sistemlerin denksizlik öğrenmede kullanımı çalışılmıştır. 66 veri kümesinde yapılan deneysel çalışmalar, birden fazla sınıflandırıcı tipi kullanılarak başarımda belirgin iyileştirmeler sağlanabileceğini göstermiştir. Ayrıca, birden fazla denkleştirme algoritmasının kullanılmasının, özellikle basit ve torbalama-tabanlı sistemlerin başarımına katkıda bulunduğu gözlemlenmiştir.
Description: Master of Science in Computer Engineering. Thesis (M.S.)--Eastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineering, 2018. Supervisor: Prof. Dr. Hakan Altınçay.
URI: http://hdl.handle.net/11129/4899
Appears in Collections:Theses (Master's and Ph.D) – Computer Engineering

Files in This Item:

File Description SizeFormat
zefrehihossein.pdfThesis, Master521.21 kBAdobe PDFView/Open


This item is protected by original copyright

Recommend this item
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback