In this study, three different mammalian genomes are investigated with respect to their transcript diversity. The main focus of the thesis is investigation of how this transcript diversity reflects on the protein structures. Within the three genomes, specifically Transcription Factor genes are analyzed. The methodologies employed include biological data retrieval from contemporary biomedical resources, storage of data in a relational database and further computational analyses.
Our results revealed that both in human and in mouse more than half of the TF genes analyzed have unique transcripts which code for proteins with unique domains. That is they have at least 2 unique transcripts coding for differential protein domain structures. Importantly, the unique domain coded by one of the TF transcripts and not the other conveys DNA-binding ability. This is the case for 51% of TF human genes and 52% of TF mouse genes. Given the lesser number of transcripts sequenced per rat TF genes in general, this percentage stays at 37%, as expected.
The overall conclusion from this thesis is that the majority of TF genes have transcript diversity and that this transcript diversity brings diversity in protein structures and thus in functions.
Keywords:
Transcription factor, genomes, transcripts, protein structure, domain function, DNA-binding, biological databases, data retrieval and storage.
ÖZ :
Bu çalısmada, üç farklı memeli organizmanın genomlarının transkript çeşitliliği incelenmiştir. Tezin temel amacı ise transkript çeşitliliğinin protein yapısındaki etkilerini incelemektir. İncelenen üç genomun özellikle Transkripsiyon Faktörlerini (TF) kodlayan kısımları analiz edilmiştir. Bu çalışma süresince kullanılan metotlardan bazıları güncel biyomedikal kaynakları kullanarak biyolojik veri toplamak, toplanan veriyi saklamak, veriye çeşitli yollardan ulaşılabilecek bir bilgisayar veritabanına kaydetmek ve çeşitli hesaplamalı analizler yapmak olmuştur.
Sonuçlar göstermiştir ki hem insan hem de fare genomlarında analiz edilen TF genlerinin en az yarısı kendilerine özgü yapısal bölümler (domain) içeren proteinleri kodlayan transkriptlere sahiptir. Diğer bir deyişle, bu genlerin, her birinin farklı özgün yapısal bölümlere sahip en az 2 proteini kodlayan değişik transkriptlere sahip olduğu anlaşılmıştır. En önemlisi, iki TF transkriptinden sadece birinde gözlenmiş olan özgün yapısal bölümün, DNA ile bağ kurma kabiliyetine sahip olmasıdır. Bu farklılık insan TF genlerinin %51’inde, fare TF genlerinin ise %52’sinde gözlemlenmiştir. Sıçan TF genlerinin sekanslanmış transkript sayısının düşük olduğunu göz önüne alırsak, bu yüzdelik beklendiği gibi %37 civarında kalmıştır.
Bu tezden çıkarabileceğimiz genel sonuç şudur ki TF genlerinin çoğunun transkript çeşitliliği yüksektir, ve bu çeşitilik proteinlerde görülebilir yapısal ve buna bağlı olarak fonksiyonel farklılıklara yol açar.
Anahtar Kelimeler
Transkripsiyon faktörü, genom, transkriptler, protein yapısı, domain fonksiyonu, DNA-bağlaması, biyolojik veri, veri toplanması ve depolaması.