Improved Traffic Crash Modeling through Accuracy and Response Time Using Classification Algorithms: A Model Comparison Approach

EMU I-REP

Show simple item record

dc.contributor.author Aghayan, Iman
dc.date.accessioned 2013-11-12T09:30:14Z
dc.date.available 2013-11-12T09:30:14Z
dc.date.issued 2013
dc.identifier.citation Aghayan, Iman. (2013). Improved Traffic Crash Modeling through Accuracy and Response Time Using Classification Algorithms: A Model Comparison Approach. Thesis (Ph.D.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Civil Engineering, Famagusta: North Cyprus. en_US
dc.identifier.uri http://hdl.handle.net/11129/1219
dc.description Doctor of Philosophy in Civil Engineering. Thesis (Ph.D.)--Eastern Mediterranean University, Faculty of Engineering, Dept. of Civil Engineering, 2013. Supervisor: Assist. Prof. Dr. Mehmet Metin Kunt. en_US
dc.description.abstract ABSTRACT: This research focuses on predicting the severity of freeway traffic crashes by employing two different dataset including Iranian and Cyprus data. In Iranian data, twelve variables related to crash parameters were used by considering genetic algorithm, combined genetic algorithm and pattern search, and artificial neural network methods. The genetic algorithm evaluated eleven equations to obtain the best equation, and then the genetic algorithm and pattern search methods were combined using the best genetic algorithm equation. The neural network used a multi-layer perceptron architecture that consisted of a multi-layer feed-forward network with hidden sigmoid and linear output neurons that can also fit multidimensional mapping problems arbitrarily well. In Cyprus data, seven variables were selected to compare two fuzzy clustering algorithms—fuzzy subtractive clustering and fuzzy C-means clustering— with a multi-layer perceptron neural network. Four clustering algorithms—hierarchical, K-means, subtractive clustering, and fuzzy Cmeans clustering—were used to obtain the optimum number of clusters based on the mean silhouette coefficient and R-value before applying the fuzzy clustering algorithms. The selected models used in Iranian and Cyprus dataset were able to predict the severity of crash injuries and to estimate the response time on the traffic crash data in which the prediction accuracy was determined according to R-value, root mean square errors, mean absolute errors, and sum of square error. Based on the results obtained from Iranian data, the highest R-value and the highest amount of time were obtained for the artificial neural network around 0.87 and 7.627 seconds, respectively. The results demonstrated that the artificial neural network provided the best prediction accuracy with highest response time, while genetic algorithm had the lowest value for prediction accuracy (0.79) and response time (0.687) among the applied models. The combination of the GA and PS methods allowed for various prediction rankings ranging from linear relationships to complex equations. Based on the results obtained from Cyprus data, the highest R-value and the highest amount of time were obtained for the multi-layer perceptron around 0.89 and 2.635, respectively demonstrating that the multi-layer perceptron had a high accuracy in traffic crash prediction among the prediction models, and that it was stable even in the presence of outliers and overlapping data. Meanwhile, in comparison with other prediction models, fuzzy subtractive clustering provided the lowest value for response time (0.284 ), 9.28 times faster than the time of multi-layer perceptron. Overall, the results showed that the MLP can be the best model to predict the traffic crash severity regardless of the variables involved with crash data in which the accuracy was the important criterion. Meanwhile, more than one model can be appropriate according to the determined criteria. Considering prediction accuracy and response time could lead to developing an on-line system for processing data from detectors and/or a real-time traffic database as well as the system may be implemented in an incident management to prevent the traffic crash or secondary traffic crash in which the model can be extended through improvements based on additional data through induction procedure. Keywords: Accuracy, Classification algorithms, Prediction, Response time, Traffic crash severity. ………………………………………………………………………………………………………… ÖZ: Bu araştırma, İran ve Kıbrıs verileri olmak üzere iki farklı veri seti kullanılarak otoyol trafik kazaları ciddiyetinin tahmininde odaklanmıştır. İran verileri, çarpışma parametreleri ile ilgili oniki değişkene, genetik algoritma, kombine genetic algoritma, ve yapay sinir ağları yöntemleri dikkate alınarak kullanılmıştır. Genetik algoritma uygulamasında en iyi denklemi elde etmek için onbir denklem değerlendi. Sonra genetik algoritma ve desen arama yöntemleri en iyi genetik algoritma denklemi kullanılarak birleştirildi. Sinir ağı da çok boyutlu haritalama sorunlarını da rastgele modelleme yapabileceği gizli sigmoid ve lineer çıkış nöronlar ile çok katmanlı ileri beslemeli ağ oluşur ve çok katmanlı algılayıcı mimarisi ile kullanıldı. Kıbrıs verileri, yedi değişkenin iki bulanık kümeleme algoritmaları-bulanık eksiltici kümeleme ve bulanık C-aracı birçok katmanlı algılayıcı sinir ağı kümeleme ile karşılaştırmak için seçilmiştir. Dört kümeleme algoritmaları-hiyerarşik, K-means, eksiltici kümeleme ve bulanık C-means kümeleme ile elde edildi ve bulanık kümeleme algoritmaları uygulamadan önce ortalama siluet katsayısı ve R-değeri esas alınarak kümelerinin optimum sayıda elde etmek için kullanılırdı. İran ve Kıbrıs verileri için kullanılan seçili modellerin, kazalarda yaralanma şiddetini tahmin etme doğruluğu ve tahmin sürelerinin tasbiti yapıldı. Tahmin doğruluğu R-değerine göre kararlı olan, kök, hata karelerinin ortalamalarının mutlak hataları anlama ve hata kareler toplamıdır. İran verileri, yüksek R-değeri ve zaman en yüksek miktarda elde edilen sonuçlara dayanarak yapay sinir ağı için elde edildi ve bunlar sırasıyla 0.87 ve 7,627. Sonuçlar yapay sinir ağının yüksek tepki süresi ile en iyi tahmin doğruluğu sağladığını göstermiştir, genetik algoritma uygulanan modeller arasında tahmin doğruluğu (0.79) ve tepki süresi (0,687) için en düşük değerdir. Doğrusal ilişki karmaşık denklemleri kadar çeşitli tahmini sıralaması için GA ve PS yöntemlerinin kombinasyonu kullanılmıştır. Kıbrıs verilerinde, R-değeri yüksek zaman ve en yüksek miktarda elde edilen sonuçlara göre, çok-katmanlı algılayıcı ile elde edilmiştir. Çok katmanlı algılayıcı tahmin modellerinin yanında trafik kazasında tahmini yüksek doğruluğu taşıdığını gösteren sırasıyla 0.89 ve 2.635, çevresindeki hatta sapan ve üst üste gelen verilerin mevcudiyetinde bile kararlı oldu gözlemlenmiştir. Bu arada, diğer tahmin modelleri ile karşılaştırıldığında, bulanık kümeleme eksiltici ve düşük değer sağlanan çok katmanlı algılayıcı süresinden daha hızlı tepki süresi gerektirmiş (0.284), 9.28 kat kadardır. Genel olarak, tahmini doğruluk ve tepki süresi dikkate alındığında verilerin işlenmesi için bir gerçek zamanlı sistemi geliştirmek için olabilir ayrıca detektörlerden gelen ve gerçek zamanlı trafik veri tabanı oluşturulduğunda hem kaza yönetim sisteminin çökmesi ya da ikinci kaza oluşumunu önleyebilir. Geliştirilen modelde indüksiyon prosedürü aracılığıyla ek verilere dayanarak iyileştirmeler yapılabilir ve bu yol ile uygulama aralığı geliştirebilir. Anahtar Kelimeler: Doğruluk, Sınıflandırma algoritmaları, Tahmin, Tepki süresi, Trafik kaza şiddeti. en_US
dc.language.iso en en_US
dc.publisher Eastern Mediterranean University (EMU) en_US
dc.subject Civil Engineering en_US
dc.subject Traffic Accidents - Research - Mathematical Models en_US
dc.subject Crash Injuries - Research - Mathematical Models en_US
dc.subject Traffic Engineering - Iran en_US
dc.subject Traffic Engineering - Cyprus, North en_US
dc.subject Accuracy - Classification Algorithms - Prediction - Response Time - Traffic Crash Severity en_US
dc.title Improved Traffic Crash Modeling through Accuracy and Response Time Using Classification Algorithms: A Model Comparison Approach en_US
dc.type Thesis en_US


Files in this item

This item appears in the following Collection(s)

Show simple item record