|
EMU I-REP >
08 Faculty of Arts and Sciences >
Department of Mathematics >
Theses (Master's and Ph.D) – Mathematics >
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11129/6406
|
Title: | Applying Machine Learning-Based Regression Models in the Prediction of Health Insurance Premium |
Authors: | Tut, Mehmet Ali (Supervisor) Mukwa, Njoh Nji Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics |
Keywords: | Thesis Tez Mathematics Department Applied Mathematics and Computer Science Data Science Regression analysis--Computer Science Information retrieval Data--Information--Storage and Retrieval Health Insurance Machine Learning Statistics Linear Regression Polynomial XGBroost ML Models Python |
Issue Date: | Feb-2024 |
Publisher: | Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ) |
Citation: | Mukwa, Njoh Nji. (2024).Applying Machine Learning-Based Regression Models in the Prediction of Health Insurance Premium . Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus. |
Abstract: | It is no doubt that the insurance industry is no stranger to data driven decision making.
The field of health insurance has seen profound transformation in recent times driven
by technological advancement, data proliferation and evolved healthcare dynamics.
Traditional methods for predicting health insurances premiums face several different
challenges which can result in inaccurate pricing, adverse selection and suboptimal
risk assessment. Some of these limitations including but not restricted to limited data
utilization, static models and inefficiency in underwriting.
This thesis project seeks to investigate comprehensively how machine learning based
regression models and techniques, including linear regression, polynomial regression
and XGBoost regression can be used in insurance to make predictions on health
insurance premiums. Using a diverse historic US health insurance dataset gotten from
Kaggle containing client insurance charges, demography information, lifestyle factors,
these models meticulously tuned, trained, and evaluated. The study does in-depth
examination of the methodologies, including exploratory data analysis, feature
selection and engineering, hyperparameter optimization, and model evaluation, to
determine the predictive accuracy of each model. ÖZ:
Sigorta endüstrisinin veri odaklı kararlar almaya yabancı olmadığı şüphesizdir. Sağlık
sigortası alanında, teknolojik ilerleme, veri çoğalması ve gelişmiş sağlık dinamikleri
tarafından yönlendirilen köklü bir dönüşüm yaşanmıştır. Geleneksel yöntemlerle
sağlık sigortası primlerini tahmin etme, doğru fiyatlandırmayla, olumsuz seçimle ve
altoptimal risk değerlendirmesiyle sonuçlanabilen çeşitli zorluklarla karşılaşmaktadır.
Bu sınırlamalar arasında, ancak bunlarla sınırlı olmamak kaydıyla, sınırlı veri
kullanımı, statik modeller ve underwritingdeki verimsizlik bulunmaktadır.
Bu tez projesi, sağlık sigortası primlerine ilişkin tahminlerde bulunmak için makine
öğrenmesi tabanlı regresyon modelleri ve tekniklerin, lineer regresyon, polinom
regresyon ve XGBoost regresyonunun kapsamlı bir şekilde nasıl kullanılabileceğini
araştırmayı amaçlamaktadır. Kaggle'dan alınan çeşitli tarihli bir ABD sağlık sigortası
veri setini kullanarak, müşteri sigorta ücretleri, demografik bilgiler, yaşam tarzı
faktörleri içeren bu modeller özenle ayarlanmış, eğitilmiş ve değerlendirilmiştir.
Çalışma, keşifsel veri analizi, özellik seçimi ve mühendisliği, hiperparametre
optimizasyonu ve model değerlendirmeyi içeren yöntemleri derinlemesine
incelemekte ve her modelin tahmin doğruluğunu belirlemektedir. |
Description: | Master of Science in Applied Mathematics and Computer Science. Institute of Graduate Studies and Research. Thesis (M.S.) - Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2024. Supervisor: Asst. Prof. Dr. Mehmet Ali Tut. |
URI: | http://hdl.handle.net/11129/6406 |
Appears in Collections: | Theses (Master's and Ph.D) – Mathematics
|
This item is protected by original copyright
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|