|
EMU I-REP >
02 Faculty of Engineering >
Department of Computer Engineering >
Theses (Master's and Ph.D) – Computer Engineering >
Please use this identifier to cite or link to this item:
http://hdl.handle.net/11129/6365
|
Title: | Sentiment Analysis Using Feature Fusion and Convolutional Neural Networks |
Authors: | Acan, Adnan (Supervisor) Altunörgü, Oğulcan Eastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineering |
Keywords: | Computer Engineering Department Artificial intelligence--Neural Networks Artificial Intelligence--Computational intelligence--Deep Learning Word, mach'ne learn'ng, lsa, word2vec, textcnn, cnn |
Issue Date: | Aug-2023 |
Publisher: | Eastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ) |
Citation: | Altunörgü, Oğulcan. (2023). Sentiment Analysis Using Feature Fusion and Convolutional Neural Networks. Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Computer Engineering, Famagusta: North Cyprus. |
Abstract: | The a'm of th's study 's to use deep learn'ng methods for sent'ment analys's on a
database of well-known documents. It a'ms to show the comparat've success of the
prepared algor'thm aga'nst some publ'shed methods and to exam'ne the data
dependency us'ng textual datasets.
Sent'ment analys's (or op'n'on m'n'ng) 's a method used 'n natural language
process'ng to analyze text documents and determ'ne the content of a text 'tem. Natural
language process'ng (NLP) 's a branch of art'f'c'al 'ntell'gence (AI) that enables
computers to understand and learn human language. When each word 's expressed as
a vector, the mean'ngs of the words w'll be stored 'n the vectors, and the vectors of the
words that have close mean'ngs w'll be close to each other. Words are converted 'nto
mathemat'cal express'ons and the'r mean'ngs are reduced to data that computers can
process by express'ng the'r prox'm'ty to another word mathemat'cally. In th's study,
we a'med to use Word2Vec, LSA and CNN three popular text-based feature extract'on
methods used 'n natural language process'ng and mach'ne learn'ng. Word2Vec 's
tra'ned on a large text dataset to obta'n word vectors, ensur'ng that s'm'lar-mean'ng
words are close together 'n the vector space. In th's way, the relat'onsh'ps and mean'ng
s'm'lar't'es between words are reflected. LSA 's a text m'n'ng method used to extract
semant'c content from large text datasets. LSA uses matr'x factor'zat'on techn'que to
d'scover the structure between documents and words. We a'm to perform sent'ment
analys's us'ng deep learn'ng models such as TextCNN and Conv1D.
TextCNN and Conv1D are convolut'onal neural networks effect've for feature
extract'on and class'f'cat'on 'n text data. These models are used to extract features
from text data and conduct sent'ment analys's. The datasets used 'nclude
Sent'ment140, YELP, Amazon, and IMDB. ÖZ:
Bu çalışmanın amacı b'r d'z' 'y' b'l'nen belge ver' tabanı üzer'nde duygu anal'z' 'ç'n
der'n öğrenme yöntemler'n'n kullanılmasıdır. Hazırlanan algor'tmanın bazı
yayınlanmış yöntemlere karşı karşılaştırmalı başarısını göstermey', met'nsel ver'
kümeler'n' kullanarak ver' bağımlılığını 'ncelemey' amaçlamaktadır.
Duygu anal'z', met'n belgeler'n' anal'z etmek ve met'n öğes'n'n 'çer'ğ'n' bel'rlemek
'ç'n doğal d'l 'şlemede (NLP) b'r yöntemd'r. Doğal d'l 'şleme yapay zekanın b'r
koludur ve b'lg'sayarların, 'nsan d'l'n' kavramasını, öğrenmes'n' ve 'dare etmes'n'
sağlar. Her b'r sözcük vektörel olarak 'fade ed'ld'ğ'nde sözcükler'n anlamları
vektörlerde saklanarak, b'rb'r'ne yakın anlam taşıyan sözcükler'nde vektörler'
b'rb'r'ne yakın olacaktır. Sözcükler matemat'ksel 'fadelere dönüştürülerek anlamları
başka b'r sözcüğe yakınlığı y'ne matemat'ksel olarak 'fade ed'lerek b'lg'sayarların
'şleyeb'leceğ' ver'lere 'nd'rgen'rler. Bu çalışmada doğal d'l 'şleme ve mak'ne
öğrenmes' alanlarında kullanılan 'k' popüler met'n tabanlı özell'k çıkarma yöntem'
olan Word2Vec, LSA ve CNN kullanmayı hedefled'k. Word2Vec, kel'me vektörler'n'
elde etmek 'ç'n büyük met'n ver' kümes' üzer'nde eğ't'l'r ve benzer anlamlı
kel'meler'n vektör uzayında b'rb'r'ne yakın olmasını sağlar. Bu şek'lde, kel'meler
arasındak' 'l'şk'ler ve anlam benzerl'kler' yansıtılır. LSA 'se büyük met'n ver'
kümeler'nden anlamsal 'çer'k çıkarmak 'ç'n kullanılan b'r met'n madenc'l'ğ'
yöntem'd'r. LSA, belgeler ve kel'meler arasındak' yapıyı keşfetmek 'ç'n matr's
çözümleme (matr'x factor'zat'on) tekn'ğ'n' kullanır. TextCNN ve Conv1D g'b' der'n
öğrenme modeller'n' kullanarak duygu anal'z'n' gerçekleşt'rmey' hedefl'yoruz.
TextCNN ve Conv1D, met'n ver'ler'nde özell'k çıkarma ve sınıflandırma 'ç'n etk'l'
olan evr'ş'ml' s'n'r ağlarıdır. Bu modeller, met'n ver'ler'n'n özell'kler'n' çıkarmak ve
duygu anal'z' yapmak 'ç'n kullanılır. Kullanılan ver' setler' Sent'ment140, YELP,
Amazon ve IMDB ver'ler'n' 'çermekted'r. |
Description: | Master of Science in Computer Engineering. Institute of Graduate Studies and Research. Thesis (M.S.) - Eastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineering, 2023. Supervisor: Assoc. Prof. Dr. Adnan Acan. |
URI: | http://hdl.handle.net/11129/6365 |
Appears in Collections: | Theses (Master's and Ph.D) – Computer Engineering
|
This item is protected by original copyright
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|