Text Mining Techniques and an Application on Natural Language Processing by Using R

dc.contributor.advisorTut, Mehmet Ali
dc.contributor.authorOnwochei, Daniel Onyeka
dc.date.accessioned2021-08-25T07:52:07Z
dc.date.available2021-08-25T07:52:07Z
dc.date.issued2019
dc.date.submitted2019
dc.departmentEastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematicsen_US
dc.descriptionMaster of Science in Applied Mathematics and Computer Science. Thesis (M.S.)--Eastern Mediterranean University, Faculty of Arts and Sciences, Dept. of Mathematics, 2019. Supervisor: Assist. Prof. Dr. Mehmet Ali Tut.en_US
dc.description.abstractIn our current society, technology is advancing at a very high pace, and these new inventions also generates large amount of data. Data is now increasing at an exponential rate, and this alarming growth rate has led to difficulty in getting and retrieving specific information from the web. Automatic summarization systems can help to resolve this information overload problem in an effective way. It easily identifies the important points from a document to produce a concise summary. Thus, the thesis investigates the extractive-based approach in generation of a summary from single documents/texts. In the study, an extractive-based summarization framework (EBSF) was designed, also, an extractive-based text summarization system has been developed, evaluated and its workflow described. The framework implements several techniques and the summarization system generates extractive summaries from news articles using an extractive-based summarization technique which is based on the TextRank algorithm. Results from the various program testing shows that the summaries generated using our extractive-based summarization system offers an excellent tradeoff between time/length and accuracy. In this study, the summaries from the designed summarizing system, tends to be concise and contain less extraneous material.en_US
dc.description.abstractÖZ: Mevcut toplumumuzda, teknoloji çok hızlı ilerliyor ve bu yeni buluşlar da büyük miktarda veri üretiyor. Veriler artık üstel bir oranda artmakta ve bu endişe verici büyüme hızı, web'den belirli bilgilerin elde edilmesinde ve alınmasında zorluklara neden olmuştur. Otomatik özetleme sistemleri, bu bilgi aşırı yük sorununu etkili bir şekilde çözmeye yardımcı olabilir. Kısa bir özeti oluşturmak için bir belgedeki önemli noktaları kolayca tanımlar. Bu nedenle, tez, tek bir belgeden / metinlerden bir özet özeti çıkarmaya dayalı yaklaşımı incelemektedir. Çalışmada, çıkartma temelli bir özetleme çerçevesi (EBSF) tasarlandı, ayrıca çıkartma temelli bir metin özetleme sistemi geliştirildi, değerlendirildi ve iş akışı tanımlandı. Çerçeve, çeşitli teknikleri uygular ve özetleme sistemi, TextRank algoritmasına dayanan bir çekişme tabanlı özetleme tekniğini kullanarak haber makalelerinden çekişme özetleri oluşturur. Çeşitli program testlerinden elde edilen sonuçlar, ekstraktif tabanlı özetleme sistemimizi kullanarak oluşturulan özetlerin zaman / uzunluk ve doğruluk arasında mükemmel bir değişim sunduğunu göstermektedir. Bu çalışmada, tasarlanan özetleme sistemindeki özetler özlü olma eğilimindedir ve daha az yabancı materyal içerir.en_US
dc.identifier.citationOnwochei, Daniel Onyeka. (2019). Text Mining Techniques and an Application on Natural Language Processing by Using R. Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Mathematics, Famagusta: North Cyprus.en_US
dc.identifier.urihttps://hdl.handle.net/11129/5046
dc.language.isoen
dc.publisherEastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ)en_US
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectMathematicsen_US
dc.subjectApplied Mathematics and Computer Scienceen_US
dc.subjectData Miningen_US
dc.subjectDatabase searchingen_US
dc.subjectBig Dataen_US
dc.subjectData Miningen_US
dc.subjectInformation Extractionen_US
dc.subjectNatural Language Processingen_US
dc.subjectSummarizationen_US
dc.subjectText Miningen_US
dc.titleText Mining Techniques and an Application on Natural Language Processing by Using Ren_US
dc.typeMaster Thesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Onwocheidaniel.pdf
Size:
1.2 MB
Format:
Adobe Portable Document Format
Description:
Thesis, Master

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.77 KB
Format:
Item-specific license agreed upon to submission
Description: