Applying Machine Learning-Based Regression Models in the Prediction of Health Insurance Premium

EMU I-REP

Show simple item record

dc.contributor.advisor Tut, Mehmet Ali (Supervisor)
dc.contributor.author Mukwa, Njoh Nji
dc.date.accessioned 2025-07-15T06:02:01Z
dc.date.available 2025-07-15T06:02:01Z
dc.date.issued 2024-02
dc.date.submitted 2024-02
dc.identifier.citation Mukwa, Njoh Nji. (2024).Applying Machine Learning-Based Regression Models in the Prediction of Health Insurance Premium . Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus. en_US
dc.identifier.uri http://hdl.handle.net/11129/6406
dc.description Master of Science in Applied Mathematics and Computer Science. Institute of Graduate Studies and Research. Thesis (M.S.) - Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2024. Supervisor: Asst. Prof. Dr. Mehmet Ali Tut. en_US
dc.description.abstract It is no doubt that the insurance industry is no stranger to data driven decision making. The field of health insurance has seen profound transformation in recent times driven by technological advancement, data proliferation and evolved healthcare dynamics. Traditional methods for predicting health insurances premiums face several different challenges which can result in inaccurate pricing, adverse selection and suboptimal risk assessment. Some of these limitations including but not restricted to limited data utilization, static models and inefficiency in underwriting. This thesis project seeks to investigate comprehensively how machine learning based regression models and techniques, including linear regression, polynomial regression and XGBoost regression can be used in insurance to make predictions on health insurance premiums. Using a diverse historic US health insurance dataset gotten from Kaggle containing client insurance charges, demography information, lifestyle factors, these models meticulously tuned, trained, and evaluated. The study does in-depth examination of the methodologies, including exploratory data analysis, feature selection and engineering, hyperparameter optimization, and model evaluation, to determine the predictive accuracy of each model. en_US
dc.description.abstract ÖZ: Sigorta endüstrisinin veri odaklı kararlar almaya yabancı olmadığı şüphesizdir. Sağlık sigortası alanında, teknolojik ilerleme, veri çoğalması ve gelişmiş sağlık dinamikleri tarafından yönlendirilen köklü bir dönüşüm yaşanmıştır. Geleneksel yöntemlerle sağlık sigortası primlerini tahmin etme, doğru fiyatlandırmayla, olumsuz seçimle ve altoptimal risk değerlendirmesiyle sonuçlanabilen çeşitli zorluklarla karşılaşmaktadır. Bu sınırlamalar arasında, ancak bunlarla sınırlı olmamak kaydıyla, sınırlı veri kullanımı, statik modeller ve underwritingdeki verimsizlik bulunmaktadır. Bu tez projesi, sağlık sigortası primlerine ilişkin tahminlerde bulunmak için makine öğrenmesi tabanlı regresyon modelleri ve tekniklerin, lineer regresyon, polinom regresyon ve XGBoost regresyonunun kapsamlı bir şekilde nasıl kullanılabileceğini araştırmayı amaçlamaktadır. Kaggle'dan alınan çeşitli tarihli bir ABD sağlık sigortası veri setini kullanarak, müşteri sigorta ücretleri, demografik bilgiler, yaşam tarzı faktörleri içeren bu modeller özenle ayarlanmış, eğitilmiş ve değerlendirilmiştir. Çalışma, keşifsel veri analizi, özellik seçimi ve mühendisliği, hiperparametre optimizasyonu ve model değerlendirmeyi içeren yöntemleri derinlemesine incelemekte ve her modelin tahmin doğruluğunu belirlemektedir. en_US
dc.language.iso eng en_US
dc.publisher Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ) en_US
dc.rights info:eu-repo/semantics/openAccess en_US
dc.subject Thesis Tez en_US
dc.subject Mathematics Department en_US
dc.subject Applied Mathematics and Computer Science en_US
dc.subject Data Science en_US
dc.subject Regression analysis--Computer Science en_US
dc.subject Information retrieval en_US
dc.subject Data--Information--Storage and Retrieval en_US
dc.subject Health Insurance en_US
dc.subject Machine Learning en_US
dc.subject Statistics en_US
dc.subject Linear Regression en_US
dc.subject Polynomial en_US
dc.subject XGBroost en_US
dc.subject ML Models en_US
dc.subject Python en_US
dc.title Applying Machine Learning-Based Regression Models in the Prediction of Health Insurance Premium en_US
dc.type masterThesis en_US
dc.contributor.department Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record