Imputing Missing Values Using Support Variables with Application to Barley Grain Yield

EMU I-REP

Show simple item record

dc.contributor.advisor Tandoğdu, Yücel
dc.contributor.author Erbilen, Mustafa
dc.date.accessioned 2022-04-20T08:06:06Z
dc.date.available 2022-04-20T08:06:06Z
dc.date.issued 2019
dc.date.submitted 2019-07
dc.identifier.citation Erbilen, Mustafa. (2019). Imputing Missing Values Using Support Variables with Application to Barley Grain Yield. Thesis (Ph.D.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus. en_US
dc.identifier.uri http://hdl.handle.net/11129/5338
dc.description Doctor of Philosophy in Mathematics. Institute of Graduate Studies and Research. Thesis (Ph.D.) - Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2019. Supervisor: Asist. Prof. Dr. Yücel Tandoğdu. en_US
dc.description.abstract In any data collection process, regardless of the sampling method, missing data values are encountered due to many different reasons. Depending on the amount of missing data the results to be obtained from the analysis of such data will somehow be affected. Therefore, starting from 1950s an increasing interest is shown by statisticians on one hand how to minimize the missing data values and also how to impute the missing values. In this thesis the theory and methods employed so far for the imputation of missing values in a data set are studied in detail. This is followed by the introduction of a new concept in the imputation of missing data using the support variables as part of multivariate regression process. Conversion of the units of support variables to that of the response variable is very important and is studied in detail via the imputation of missing values in a barley grain yield data set. Application results of the support variable concept is comepared with the results obtained from Markov Chain Monte Carlo (MCMC), Gaussian and Epanechnikov Kernel regression and found to be better performer in terms of lower error levels and in terms of robustness. The robustness of the results of all methods are checked using the Relative Aitchison Distance (RDA) concept. Keywords: Missing Value, Imputation, Support Variables, Mean Squared Error (MSE), Regression, Correlation, Kernel Regression. en_US
dc.description.abstract ÖZ: Veri toplama yöntemine bakılmaksızın, herhangi bir veri toplama işleminde çok değişik nedenlerden kaynaklanan veri eksiklikleri oluşmaktadır. Eksik verilerin az veya çok oluşuna göre, böyle bir veri tabanını kullanarak yapılacak herhangi bir veri analizinin sonuçlarıda etkilenecektir. Bu nedenle, veri toplama işleminde eksik verilerin minimuma indirgenmesi veya eksik verilerin tahmin edilmesi konularında istatistikciler 1950li yıllardan bu yana giderek artan oranda konuyla ilgili araştırmalarına devam etmektedir. Bu tez çalışmasında bugüne kadar konuyla ilgili yapılan birçok teorik ve pratik çalışma detaylı olark incelenmiştir. Bunu takip eden aşamada eksik verilerin tahmin işleminde, desetek değişkenlerinin çok değişkenli regresyonda kullanımı önerilmiştir. Destek değişkenlerine ait birimlerin bağımlı değişken birimine dönüştürülmesi çok önemli olduğundan, detaylı olarak incelenmiş ve arpa verimliliği verisi kullanılarak uygulaması yapılmıştır. Destek verileri kullanılarak yapılan uygulamadan elde edilen sonuçlar, Markov Chain Monte Carlo (MCMC), Gaussian ve Epanechnikov Kernel regresyon metodlarından elde edilen sonuçlarla, tahmin hataları, ve tahminlerin güçlülüğü açısından kıyaslanmıştır. Elde edilen sonuçlara göre önerilen destek verileri ile tahmin yöntemi daha düşük hatalı va daha güçlü tahminler vermiştir. Tahminlerin gücü Relative Aitchison Distance (RDA) yöntemi ile hesaplanmıştır. Anahtar kelimeler: Eksik Değer, Veri Atama, Destek Değişkeni, Hata Karelerinin Ortalaması (HKO), Regresyon, Korelasyon, Kernel Regresyonu. en_US
dc.language.iso eng en_US
dc.publisher Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ) en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Mathematics en_US
dc.subject Applied Mathematics and Computer Science en_US
dc.subject Sampling (Statistics) en_US
dc.subject Mathematical statistics en_US
dc.subject Missing Value en_US
dc.subject Imputation en_US
dc.subject Support Variables en_US
dc.subject Mean Squared Error (MSE) en_US
dc.subject Regression en_US
dc.subject Correlation en_US
dc.subject Kernel Regression en_US
dc.title Imputing Missing Values Using Support Variables with Application to Barley Grain Yield en_US
dc.type doctoralThesis en_US
dc.contributor.department Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record