Automated Database Schema Matching Engine

dc.contributor.advisorErtuğrul, Duygu Çelik
dc.contributor.authorSailan, Maha
dc.date.accessioned2023-08-03T06:01:19Z
dc.date.available2023-08-03T06:01:19Z
dc.date.issued2020-01
dc.date.submitted2020
dc.departmentEastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineeringen_US
dc.descriptionMaster of Science in Computer Engineering. Institute of Graduate Studies and Research. Thesis (M.S.) - Eastern Mediterranean University, Faculty of Engineering, Dept. of Computer Engineering, 2020. Supervisor: Assoc. Prof. Dr. Duygu Çelik Ertuğrul.en_US
dc.description.abstractDatabase Schema Matching is a process which intakes multiple schema as an entry and yields back a mapping that classifies a similar component in these schemas. This process is mostly used to locate and identify semantically related-target. With this method or process it eases the finding and matching of divergent and randomly scattered data sets. It is one valuable tool for data processing and schema integration. Researches shows that various methods for schema matching based on different schema level matcher and classification criteria are proposed in order to find the most similar attributes and element in the schemas. Schema matching is classified into two approaches; Individual Match Approach and Combining Matchers Approach. In this thesis the individual match approach is used, which considers the schema level that is linguistic based. Past studies exhibited several methodologies to make the matching process in schema matching partially and fully automated, while in this thesis Convolutional Neural Network (CNN) methodology is proposed to implement an automated database schema matching engine with the aid of cosine similarity algorithm and Jaro Winkler algorithm. One of the powerful characteristics of the proposed methodology is that, it can be automated hence, less time is required to carry a particular task and more efficient if the task is more complex and if it is a larger scale task. The proposed methodology showed a very satisfactory result. The purpose of this thesis is to implement an automated database schema matching engine in addition to research and study the techniques and methodologies that is used for schema matching. Keywords: Schema Matching, Individual Match, Multiple Matchers, Convolutional Neural Networken_US
dc.description.abstractÖZ:Veritabanı Şeması eşleştirme, birden çok şemayı bir girdi olarak alan ve bu şemalarda benzer bir bileşeni sınıflandıran bir eşlemeyi üreten bir süreçtir. Bu işlem çoğunlukla anlamsal olarak ilişkili hedefi bulmak ve tanımlamak için kullanılır. Bu yöntem veya işlem sayesinde farklı ve rastgele dağılmış veri kümelerinin bulunması ve eşleştirilmesi kolaylaşır. Veri işleme ve şema birleştirilmesi için değerli bir araçtır. Araştırmalar, şemalarda en benzer özellikleri ve öğeleri bulmak için farklı seviyedeki şema eşleştiricisi ve sınıflandırma kriterlerine dayalı olarak şema eşleştirmesi için çeşitli yöntemlerin önerildiğini göstermektedir. Şema eşleştirme iki yaklaşım olarak sınıflandırılır; Bireysel Eşleşme Yaklaşımı ve Eşleştirici Birleşmesi Yaklaşımı. Bu tezde, dil temelli şema düzeyini dikkate alan bireysel eşleşme yaklaşımı kullanılmaktadır. Geçmiş çalışmalar şemada eşleştirme işlemini kısmen ve tamamen otomatik hale getirmek için çeşitli metodolojiler sergilerken, bu tezde Sarmallı Sinir Ağı (CNN) metodolojisi, kosinüs benzerlik algoritması ve Jaro winkler algoritması yardımıyla otomatik bir veritabanı şeması eşleştirme motorunun uygulanmasını önerir. Önerilen metodolojinin en önemli özelliklerinden biri, otomatikleştirilebileceğinden dolayı, belirli bir görevi yerine getirmek için daha az zamana ihtiyaç duyulması ve görev daha karmaşıksa ve daha büyük ölçekli bir görev ise daha verimli olmasıdır. Önerilen metodoloji oldukça tatmin edici sonuçlar göstermiştir. Bu tezin amacı, şema eşleştirme için kullanılan teknikleri ve metodolojileri araştırmaya ve incelemeye ek olarak otomatik bir veritabanı şema eşleştirme motorunu uygulamaktır. Anahtar Kelimeler: Şema Eşleştirme, Bireysel Eşleme, Çoklu Eşleştiriciler, Sarmallı Sinir Ağı.en_US
dc.identifier.citationSailan, Maha. (2020).Automated Database Schema Matching Engine .Thesis (M.S.), Eastern Mediterranean University, Institute of Graduate Studies and Research, Dept. of Computer Engineering, Famagusta: North Cyprusen_US
dc.identifier.urihttps://hdl.handle.net/11129/5684
dc.language.isoen
dc.publisherEastern Mediterranean University (EMU) - Doğu Akdeniz Üniversitesi (DAÜ)en_US
dc.relation.publicationcategoryTez
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectData in computer systemsen_US
dc.subjectData integration (Computer science)en_US
dc.subjectSchema matchingen_US
dc.subjectSchema Matchingen_US
dc.subjectIndividual Matchen_US
dc.subjectMultiple Matchersen_US
dc.subjectConvolutional Neural Networken_US
dc.titleAutomated Database Schema Matching Engineen_US
dc.typeMaster Thesis

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Sailanmaha.pdf
Size:
970.48 KB
Format:
Adobe Portable Document Format
Description:
Thesis, Master

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.77 KB
Format:
Item-specific license agreed upon to submission
Description: