ABSTRACT
Alzheimer’s disease (AD), an irreversible neurodegenerative dementia, occurs most
frequently in older adults which gradually destroys regions of the brain that are
responsible for memory, learning, thinking and behavior. By estimation, 5.3 million
Americans of all ages suffered from AD in 2015. This number is expected to increase
to 16 million people by 2050. AD is the only cause of death in the top 10 of
Americans that cannot be cured, prevented or slowed. Presently, there is no cure for
AD, but early detection may help to figure out the root of AD mechanisms and
improve the quality of life for patients who suffer from AD. In recent years, analysis
of neuroimaging data has attracted a lot of interest with the recent improvements for
early and accurate detection of AD. Neuroimaging techniques have become an
important field of research due to the progress in their acquisition, storage and
management in a wide range of applications including AD detection. High accurate
image-based early detection of AD could provide valuable support for clinical
treatments. High-dimensional classification methods have been a major target in the
field of machine learning for the automatic AD detection. One major issue of
automatic AD classification is the feature-selection method from high-dimensional
feature space. This study proposes novel feature selection methods for high
dimensional pattern recognition problem aimed at high accurate detection of AD,
which uses the information from three dimensional magnetic resonance imaging
(MRI) data extracted from the brain.
MRI-based brain data used in the present study are obtained from the Alzheimer's
Disease Neuroimaging Initiative (ADNI). This work focuses on structural MRI data
and investigates extraction and selection of features, which are the main blocks in an
automatic diagnosis detection system. In this regard, Voxel-based-morphometry
(VBM) analysis of cross-sectional 3-Tesla 3D T1-weighted MRI data is utilized to
perform feature extraction. VBM is an automated technique for assessment of whole
brain structure with voxel-by-voxel comparisons which has been developed to
analyze tissue concentrations or volumes between subject groups to distinguish
degenerative diseases with dementia. The significant local differences in gray matter
volumes (gray matter atrophies) based on VBM analysis are selected as 3-D volumes
of interests (VOIs). Feature extraction based on the 3D voxel clusters detected by
VBM on structural MRI (sMRI) and voxel values of VOIs are considered as raw
features. In the feature selection stage, novel methods based on probability
distribution function (PDF) and feature ranking are introduced to select most
discriminative features from high-dimensional data. In the PDF-based feature
selection approach, a novel statistical feature-selection process is employed, utilizing
the PDF of the VOI to represent statistical patterns of the respective high
dimensional sMRI sample. PDF of the VOIs can be considered a lower-dimensional
feature vector representing sMRI images. The dimensionality of the PDF-based
feature vector can be adjusted by changing the number of bins of the PDF. In this
regard, the Fisher Criterion is used to determine the optimal number of bins of the
histogram generating the PDF. In the proposed feature ranking method, all raw
features are ranked using seven different statistical measures methods, namely,
statistical dependency (SD), mutual information (MI), information gain (IG),
Pearson’s correlation coefficient (PCC), t-test score (TS), Fisher’s criterion (FC), and
the Gini index (GI). These measures are indicators of class separability, therefore the
features with higher scores are assumed to be more discriminative. Hence it is critical
to determine the number of top features. In the current study, to determine the
number of top features, two methods namely, Fisher criterion and classification error
are introduced. The Fisher Criterion between AD and HC groups is calculated for all
sizes of feature vectors, where the vector size maximizing Fisher Criterion is selected
as the number of top discriminative features. In a similar spirit, the estimated
classification error on training set made up of the AD and HC groups is calculated.
The vector size that minimizing this error is selected as the size of the top
discriminative feature vector. In the classification stage, the support vector machine
(SVM) classifiers with linear and non-linear kernels are employed to perform binary
classification using 10 fold cross validation between patients who suffer from AD
and age-matched healthy controls. Moreover, data fusion techniques are proposed to
achieve higher performance in AD detection. In this regard, data fusion is introduced
to improve the classification performance, by combining scores or vectors received
from clusters obtained from MRI images based on the severity of gray matter atrophy
in the brain. In addition, a novel data fusion approach among feature ranking
methods is introduced. The results indicate that proposed approaches are reliable
techniques that are highly competitive with the state-of-the-art techniques in
classification of AD.
Keywords: Alzheimer’s disease, Structural MRI, Voxel-based morphometry,
Statistical feature extraction, Probability distribution function, Feature ranking,
Fisher Criterion, classification error, Data fusion, , Support vector machine.
ÖZ :
Alzheimer hastalığı (AH), geri dönüşü olmayan bir nörodejeneratif bunaklık hastalığı
olup, sıklıkla yaşlı erişkinlerde beynin hafıza, öğrenme, düşünme ve davranış ile
ilgili bölgelerini yavaş yavaş yok ederek ortaya çıkmaktadır. Tahminlere göre, her
yaştan 5.3 milyon Amerikalı 2015 yılı itibarıyle Alzheimer hastalığından
muzdariptir. Bu sayının 2050 yılında 16 milyona yükselmesi beklenmektedir. AH,
tedavi edilebilir, önlenebilir ya da yavaşlatılabilir bir hastalık olmayıp Amerikalılar
arasında en yüksek ilk 10 ölüm nedenleri arasında yer almaktadır. Halen, ortada AH
tedavisi bulunmamakla birlikte erken teşhis AH mekanizmalarını anlamaya ve bu
hastalıktan muzdarip insanların yaşam kalitesini artırmak için yardımcı olabilir. Son
yıllarda, beyin görüntü verilerinin analizi ile AH’nin erken ve doğru tespiti için
ortaya çıkan gelişmeler çok ilgi çekmektedir. Beyin görüntüleme tekniklerindeki
gelişmeler sayesinde veri edinim, depolama ve yönetimi konuları önemli bir
araştırma alanı oluşturarak AH tespiti de dahil olmak üzere geniş bir uygulama
yelpazesi ortaya çıkarmaktadır. AH’nin yüksek doğrulukla görüntü tabanlı erken
teşhisi, klinik tedaviler için değerli bir destek sağlayabilmektedir. Yüksek boyutlu
sınıflandırma yöntemleri otomatik AH tespiti için makine öğrenme alanında önemli
bir hedef olmuştur. Otomatik AH sınıflandırma yaklaşımlarında önemli bir konu da
yüksek boyutlu öznitelik uzayından öznitelik-seçme yöntemidir. Bu çalışmada, üç
boyutlu MR beyin verilerinden çıkarılan bilgiler kullanılarak AH'nin yüksek
doğrulukla tespiti hedefiyle yüksek boyutlu tanıma problemi için yeni özellik seçim
yöntemleri önerilmektedir. Bu çalışmada kullanılan Manyetik Resonans
Görüntüleme (MRG) tabanlı beyin verileri Alzheimer Hastalığı Beyin Girişimi
(ADNI) tarafından oluşturulmuştur.Sunulan bu çalışmada, yapısal MRG verileri
incelenerek çıkarılan ve seçilen öznitelikler otomatik teşhis algılama sisteminin temel
taşları olarak çalışılmaktadır. Bu bağlamda, kesitsel 3 Tesla 3B T1 ağırlıklı MR
verilerinin voksel-bazlı morfometri (VBM) analizi özellik çıkarımını gerçekleştirmek
için kullanılmaktadır. VBM ile dejeneratif hastalıklar ile bunaklık hasta gruplarını
ayırt etmek için doku konsantrasyonlarını veya birimleri analiz etmek mümkün
olmaktadır. VBM tekniği ile konu grupları arasındaki voksel, voksel karşılaştırmalar
ile tüm beyin yapısının değerlendirilmesi otomatik olarak mümkün olmaktadır. VBM
analizi tabanlı gri madde hacimlerinde önemli yerel farklılıklar (gri madde
körelmesi) meydana gelmekte ve bu bölgeler 3B ilgi hacimleri (VOIs) olarak
seçilmektedir. Yapısal MRG ve VOI ham voksel değerleri üzerinden VBM
tarafından algılanan 3B voksel kümelerine dayalı öznitelik çıkarımı yapılmaktadır.
Öznitelik seçimi aşamasında olasılık dağılım fonksiyonu (PDF) ve öznitelik
sıralaması tabanlı yeni yöntemler önerilmekte, yüksek boyutlu ham verilerin en ayırt
edici özellikleri seçilebilmektedir. PDF tabanlı öznitelik seçimi yaklaşımında, yeni
bir istatistiki öznitelik seçim süreci önerilmekte ve bu bağlamda ilgili yapısal MRG
örneklerden elde edilen VOI üzerinden çıkarılan PDF seçilen yüksek boyutlu
bölgenin istatistiksel örüntüsünü temsil etmek için kullanılmaktadır. VOI'lerden
çıkarılan PDFler yapısal MRI görüntülerini temsil eden düşük boyutlu öznitelik
vektörleri olarak kabul edilebilmektedir.
PDF tabanlı özellik vektörünün boyutu PDF bidonlarının sayısı değiştirilerek
ayarlanabilmektedir. Bu bağlamda, Fisher kriteri kullanılarak PDF’i üreten histogram
bidonlarının optimal sayısı belirlenebilmektedir. Önerilen öznitelik sıralama
yönteminde, tüm ham öznitelikler, yedi farklı istatistiksel ölçüm yöntemleri
kullanılarak sıralanabilmektedir. Bu yöntemler sırasıyla: İstatistiksel bağımlılık (SD),
karşılıklı bilgi (MI), bilgi kazancı (IG), Pearson korelasyon katsayısı (PCC), t-test
puanı (TS), Fisher kriteri (FC) ve Gini indeksi (GI) olarak seçilmiştir. Bu ölçümler
sınıflar arası ayrılabilirlik ölçüsünü göstermektedir. Bu nedenle ölçümlerdeki yüksek
değerler kullanılan özniteliklerin daha ayrımcı olduğunu göstermektedir.Dolayısıyla
en üst özniteliklerin sayısını belirlemek çok önemlidir. Bu çalışmada, en üst
özniteliklerin sayısını belirlemek için iki yöntem yani Fisher kriteri ve sınıflandırma
hatası önerilmektedir. AH ve sağlıklı kontol (HC) grupları arasında Fisher Kriteri,
öznitelik vektörlerinin tüm boyutları için hesaplananmakta ve Fisher kriterini
maksimize eden vektör boyutu en üst ayrımcı öznitelik vektör boyutu olarak
seçilmektedir. Benzer bir yaklaşımla, AH ve HC gruplarından oluşan eğitim seti
üzerinde sınıflandırma hatası hesaplanmaktadır. Bu hatayı minimize eden boyut, en
üst ayırt edici öznitelik vektörünün boyutu olarak seçilmektedir.
Sınıflandırma aşamasında, doğrusal ve doğrusal olmayan çekirdekli destek vektör
makinesi (SVM) sınıflandırıcılarının AH ve yaş uyumlu sağlıklı kontrollerden
muzdarip hastalar arasında 10 kat çapraz doğrulama kullanarak ikili sınıflandırma
yapmaktadır. Ayrıca, veri füzyonu teknikleri AH tespitinde daha yüksek performans
elde etmek için önerilmiştir. Bu bağlamda, veri füzyonu beyinde gri madde körelme
şiddetine göre MR görüntülerinden elde edilen kümelere alınan puanlar ya da
vektörler birleştirerek, sınıflandırma performansını artırmak için önerilmiştir. Buna
ek olarak, özellik sıralamasında yöntemler arasında yeni bir veri füzyon yaklaşımı
tanıtılmıştır. Sonuçlar, önerilen tekniklerin AH sınıflandırılmasında literatürdeki
alternatif teknikler ile son derece rekabetçi ve güvenilir teknikler olduğunu
göstermektedir.
Anahtar Kelimeler: Alzheimer hastalığı, yapısal MRG, voksel-temelli morfometri,
İstatistiksel özellik çıkarımı, olasılık dağılım fonksiyonu, öznitelik sıralaması, Fisher
kriteri, sınıflandırma hatası, veri füzyonu, vektör destek makinesi.