DSpace
 

EMU I-REP >
08 Faculty of Arts and Sciences >
Department of Mathematics >
Theses (Master's and Ph.D) – Mathematics >

Please use this identifier to cite or link to this item: http://hdl.handle.net/11129/5338

Title: Imputing Missing Values Using Support Variables with Application to Barley Grain Yield
Authors: Tandoğdu, Yücel
Erbilen, Mustafa
Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics
Keywords: Mathematics
Applied Mathematics and Computer Science
Sampling (Statistics)
Mathematical statistics
Missing Value
Imputation
Support Variables
Mean Squared Error (MSE)
Regression
Correlation
Kernel Regression
Issue Date: 2019
Publisher: Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ)
Citation: Erbilen, Mustafa. (2019). Imputing Missing Values Using Support Variables with Application to Barley Grain Yield. Thesis (Ph.D.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus.
Abstract: In any data collection process, regardless of the sampling method, missing data values are encountered due to many different reasons. Depending on the amount of missing data the results to be obtained from the analysis of such data will somehow be affected. Therefore, starting from 1950s an increasing interest is shown by statisticians on one hand how to minimize the missing data values and also how to impute the missing values. In this thesis the theory and methods employed so far for the imputation of missing values in a data set are studied in detail. This is followed by the introduction of a new concept in the imputation of missing data using the support variables as part of multivariate regression process. Conversion of the units of support variables to that of the response variable is very important and is studied in detail via the imputation of missing values in a barley grain yield data set. Application results of the support variable concept is comepared with the results obtained from Markov Chain Monte Carlo (MCMC), Gaussian and Epanechnikov Kernel regression and found to be better performer in terms of lower error levels and in terms of robustness. The robustness of the results of all methods are checked using the Relative Aitchison Distance (RDA) concept. Keywords: Missing Value, Imputation, Support Variables, Mean Squared Error (MSE), Regression, Correlation, Kernel Regression.
ÖZ: Veri toplama yöntemine bakılmaksızın, herhangi bir veri toplama işleminde çok değişik nedenlerden kaynaklanan veri eksiklikleri oluşmaktadır. Eksik verilerin az veya çok oluşuna göre, böyle bir veri tabanını kullanarak yapılacak herhangi bir veri analizinin sonuçlarıda etkilenecektir. Bu nedenle, veri toplama işleminde eksik verilerin minimuma indirgenmesi veya eksik verilerin tahmin edilmesi konularında istatistikciler 1950li yıllardan bu yana giderek artan oranda konuyla ilgili araştırmalarına devam etmektedir. Bu tez çalışmasında bugüne kadar konuyla ilgili yapılan birçok teorik ve pratik çalışma detaylı olark incelenmiştir. Bunu takip eden aşamada eksik verilerin tahmin işleminde, desetek değişkenlerinin çok değişkenli regresyonda kullanımı önerilmiştir. Destek değişkenlerine ait birimlerin bağımlı değişken birimine dönüştürülmesi çok önemli olduğundan, detaylı olarak incelenmiş ve arpa verimliliği verisi kullanılarak uygulaması yapılmıştır. Destek verileri kullanılarak yapılan uygulamadan elde edilen sonuçlar, Markov Chain Monte Carlo (MCMC), Gaussian ve Epanechnikov Kernel regresyon metodlarından elde edilen sonuçlarla, tahmin hataları, ve tahminlerin güçlülüğü açısından kıyaslanmıştır. Elde edilen sonuçlara göre önerilen destek verileri ile tahmin yöntemi daha düşük hatalı va daha güçlü tahminler vermiştir. Tahminlerin gücü Relative Aitchison Distance (RDA) yöntemi ile hesaplanmıştır. Anahtar kelimeler: Eksik Değer, Veri Atama, Destek Değişkeni, Hata Karelerinin Ortalaması (HKO), Regresyon, Korelasyon, Kernel Regresyonu.
Description: Doctor of Philosophy in Mathematics. Institute of Graduate Studies and Research. Thesis (Ph.D.) - Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2019. Supervisor: Asist. Prof. Dr. Yücel Tandoğdu.
URI: http://hdl.handle.net/11129/5338
Appears in Collections:Theses (Master's and Ph.D) – Mathematics

Files in This Item:

File Description SizeFormat
Erbilenmustafa.pdfThesis, Doctoral1.76 MBAdobe PDFView/Open


This item is protected by original copyright

Recommend this item
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

Valid XHTML 1.0! DSpace Software Copyright © 2002-2010  Duraspace - Feedback