Smoothing with Kernel Regression and Related to Principal Component Analysis

EMU I-REP

Show simple item record

dc.contributor.advisor Tandoğdu, Yücel
dc.contributor.author Ilgaz, Sena
dc.date.accessioned 2021-08-13T08:21:02Z
dc.date.available 2021-08-13T08:21:02Z
dc.date.issued 2019
dc.date.submitted 2019
dc.identifier.citation Ilgaz, Sena. (2019). Smoothing with Kernel Regression and Related to Principal Component Analysis. Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus. en_US
dc.identifier.uri http://hdl.handle.net/11129/4998
dc.description Master of Science in Applied Mathematics and Computer Science. Thesis (M.S.)--Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2019. Supervisor: Assist. Prof. Dr. Yücel Tandoğdu. en_US
dc.description.abstract In any process that produces useful output, more than one and in many cases tens or hundreds of variables are involved. With the advancement of technology the number of observations has also dramatically increased, to the point that without using a computer software it is impossible to process such data. For processing multivariate big data sets, there are many different techniques available. For obtaining optimal bandwidth simulations were carried out. Mean Squared Error (MSE) and the ratio of MSE to the average of the variance of estimated values (AVE) were used as criteria, in obtaining the optimal bandwidth. It is determined that the linear correlation between the PC and the variable, and the contribution of a variable to the PC has significant effect on the error levels. In this thesis Kernel Regression which is a non-parametric regression method is used for estimating various dependent variables. In chapter 3 basic theory related with kernel regression is given, supported by the proof of various theorems and application data. For large number of variables the Principal Component Analysis (PCA) technique is used to reduce the number of variables to manageable level. Basic theory related with PCA is given under chapter 4. In this thesis a logical link between kernel regression and PCA is established for the estimation of the variables governing a process. The variables governing the process are taken as dependent i X , and Principal Components (PC) as independent variables, using kernel regression. In chapter 5, a data set consisting of 14 variables was used to determine the necessary number of PCs, using both covariance and correlation matrices separately. Then, variables that exhibited high correlation with PCs, and variables with high contribution to a PC were taken as dependent variables, while PCs were used as independent variables in kernel regression. en_US
dc.description.abstract ÖZ: Kullanışlı çıktı üreten herhangi bir işlemde, birden fazla ve çoğu zaman onlarca veya yüzlerce değişken söz konusudur. Teknolojinin gelişmesiyle birlikte elde edilebilen gözlem sayısı ciddi şekilde artarken, bilgisayar yazılımlarını kullanmadan bunların analiz edilmesi imkansızdır. Çok değişkenli büyük verilerin işlenmesi için, birçok farklı teknik mevcuttur. Bu tezde parametrik olmayan bir regresyon yöntemi olan Kernel Regresyonu, çeşitli bağımlı değişkenleri tahmin etmek için kullanılmıştır. Bölüm 3'te kernel regresyonu ile ilgili temel teori, çeşitli teoremlerin ispatı ve bir uygulama örneği ile desteklenerek verilmiştir. Çok sayıda değişken için, değişken sayısını yönetilebilir seviyeye düşürmek için Temel Bileşen Analizi (TBA) tekniği kullanılır. TBA ile ilgili temel teori bölüm 4'te verilmiştir. Bu tezde, süreçte geçerli olan değişkenlerin tahmini için kernel regresyonu ile TBA arasında mantıksal bağlantı kurulmuştur. Bu mantıkta değişkenler ( i X ) bağımlı olarak, Temel Bileşenler (TB) bağımsız değişkenler olarak alınarak kernel regresyonu uygulanmıştır. Beşinci bölümde 14 değişkenden oluşan bir veri setinin kovaryans ve korelasyon matrisleri ayrı ayrı kullanılarak gerekli TB sayısı belirlemiştir. Daha sonra, TB'lerle yüksek korelasyon gösteren değişkenler ve TB'ne yüksek katkısı olan değişkenler, bağımlı TB'ler ise bağımsız değişkenler olarak alınarak kernel regresyonu uygulanmıştır. Optimal bant genişliği elde etmek için simülasyonlar yapıldı. Hata Karelerinin Ortalaması (HKO) ve HKO'nin tahmin edilen değerlerin varyans ortalamasına oranı, optimal bant genişliğinin elde edilmesinde ölçüt olarak kullanılmıştır. TB ile değişken arasındaki doğrusal korelasyonun ve bir değişkenin TB'ye katkısının hata seviyeleri üzerinde önemli bir etkiye sahip olduğu tespit edilmiştir. en_US
dc.language.iso eng en_US
dc.publisher Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ) en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Mathematics en_US
dc.subject Applied Mathematics and Computer Science en_US
dc.subject Principal components analysis en_US
dc.subject Kernel Regression en_US
dc.subject Bandwidth en_US
dc.subject Principal Component Analysis (PCA) en_US
dc.subject Principal Components (PCs) en_US
dc.subject Mean Squared Error (MSE) en_US
dc.subject Covariance en_US
dc.subject Correlation en_US
dc.title Smoothing with Kernel Regression and Related to Principal Component Analysis en_US
dc.type masterThesis en_US
dc.contributor.department Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record