ExPASy: Protein Bilgileri için Temel İnternet Sitesi
Merhabalar sevgili okuyucularımız;
Bildiğiniz gibi bir önceki
yazımızda, sizlerle PubMed’ in nasıl kullanılacağına dair bazı bilgiler
paylaşmıştık ve dUTPase adlı proteini örnek alarak, bir protein hakkında genel
bilgilere nasıl ulaşılır öğrenmiştik. Şimdi de bir proteine dair daha detaylı
bilgiler elde etmek adına sizleri ExPASy adlı internet sitesiyle
tanıştıracağız.
ExPASy, protein biyoinformatiğinin
öncülerinden Prof. Amos Bairoch tarafından üretilmiş ve yönetilmekte olan ve
tüm dünyada proteinlere dair lider bilgi kaynağı sağlayan bir internet
sitesidir. ExPASy, Swiss-Prot protein dizisi veritabanına ek olarak
kullanıcılara birçok sayıda farklı analiz aracı sağlar. Ayrıca farklı
sunucularda daha özelleşmiş analizler yapmak için çok çeşitli dış bağlantılar
sağlar.
ExPASy’ de Bir Örnek
E.coli bilindiği üzere
araştırmalarda sıkça kullanılan bir organizmadır. Biz de bu örneğimizde E.coli
bakterisini kullanarak, dUTPase fonksiyonunu gösteren proteinin dizisini
bulmaya çalışacağız.
1) Tarayıcımızı kullanarak www.expasy.org adresine gidelim.
2) Arama kısmına "dUTPase coli" yazalım ve sol tarafta bulunan veritabanı seçimi kısmından UniProtKB’ i
seçelim.
3) Arama sonuçlarından en üstte
bulunan "P06968 DUT_ECOLI"adlı sonuca tıkladığımız zaman karşımıza dUTPase’ e
ait uzunca bir sonuç çıkacaktır.
Çıkan
sonuç sayfasından proteinin özellikleri, görevleri, yapısı, dizisi gibi birçok
bilgiye ulaşabiliriz. Aynı zamanda protein dizisinin FASTA formatını da elde
edebiliriz.
FASTA Formatı Nedir?
FASTA, 1988 yılında W.R. Pearson ve D.J. Lipman tarafından
geliştirilmiş, popüler bir sekans-dizileme ve veri tabanı-tarama programıdır.
FASTA tarafından kullanılan sekanslar aşağıdaki formata uymak zorundadır:
>My_Sequence_Name
ACGTCGCTAGCTACTAACGTCGCTAGCTACCTAAGCTAGATCCATAGCTATC
Satır, tanım satırı ve kendine özgü tanımlayıcısı olan ‘>’
işareti ile başlar ve isteğe bağlı olan kısa tanımla devam eder. Devam
eden tanımlar; ‘>’ karakteri yeni bir sekansın başlangıcını
gösterene kadar DNA veya protein sekansları (tek harfli kodlar şeklinde)
içerir.
FASTA çözümlemesi kolay olduğu için oldukça popüler olmuş, ve birçok
sekans analiz yazılımı için, BLAST ve CLUSTALW dahil, giriş formatı olmuştur.
Bazı programlar RAW
formatı ile tek seferde bir sekans analiz ederler. Bu, tanım satırı olmadan,
basitçe FASTA formatının sekans bölümüdür-ama makinalar titiz olabilir. RAW
formatı istenirken FASTA formatı kullanmak hatalara sebep olur ya da bazı tanım
satırları protein veya DNA sekansları ile sonuçlanabilir.
Araştırmış olduğumuz E.coli
bakterisinde bulunan dUTPase proteininin FASTA formatı aşağıdaki gibidir.
>sp|P06968|DUT_ECOLI Deoxyuridine
5'-triphosphate nucleotidohydrolase OS=Escherichia coli (strain K12) OX=83333
GN=dut PE=1 SV=2
MMKKIDVKILDPRVGKEFPLPTYATSGSAGLDLRACLNDAVELAPGDTTLVPTGLAIHIA
DPSLAAMMLPRSGLGHKHGIVLGNLVGLIDSDYQGQLMISVWNRGQDSFTIQPGERIAQM
IFVPVVQAEFNLVEDFDATDRGEGGFGHSGRQ
Bu yazımızda bir protein hakkında detaylı bilgileri elde etmek amacıyla kullanabileceğiniz ExPASy internet sitesini uygulamalı bir şekilde anlatmaya çalıştık. Umarız sizler için bilgilendirici bir yazı olmuştur. Bir sonraki yazımızda görüşmek üzere hoşçakalın😊
Yorumlar
Yorum Gönder