ExPASy: Protein Bilgileri için Temel İnternet Sitesi

Merhabalar sevgili okuyucularımız;

Bildiğiniz gibi bir önceki yazımızda, sizlerle PubMed’ in nasıl kullanılacağına dair bazı bilgiler paylaşmıştık ve dUTPase adlı proteini örnek alarak, bir protein hakkında genel bilgilere nasıl ulaşılır öğrenmiştik. Şimdi de bir proteine dair daha detaylı bilgiler elde etmek adına sizleri ExPASy adlı internet sitesiyle tanıştıracağız.
ExPASy, protein biyoinformatiğinin öncülerinden Prof. Amos Bairoch tarafından üretilmiş ve yönetilmekte olan ve tüm dünyada proteinlere dair lider bilgi kaynağı sağlayan bir internet sitesidir. ExPASy, Swiss-Prot protein dizisi veritabanına ek olarak kullanıcılara birçok sayıda farklı analiz aracı sağlar. Ayrıca farklı sunucularda daha özelleşmiş analizler yapmak için çok çeşitli dış bağlantılar sağlar.

ExPASy’ de Bir Örnek

E.coli bilindiği üzere araştırmalarda sıkça kullanılan bir organizmadır. Biz de bu örneğimizde E.coli bakterisini kullanarak, dUTPase fonksiyonunu gösteren proteinin dizisini bulmaya çalışacağız.
1) Tarayıcımızı kullanarak www.expasy.org adresine gidelim.
2) Arama kısmına "dUTPase coli" yazalım ve sol tarafta bulunan veritabanı seçimi kısmından UniProtKB’ i seçelim.




3) Arama sonuçlarından en üstte bulunan "P06968 DUT_ECOLI"adlı sonuca tıkladığımız zaman karşımıza dUTPase’ e ait uzunca bir sonuç çıkacaktır.







Çıkan sonuç sayfasından proteinin özellikleri, görevleri, yapısı, dizisi gibi birçok bilgiye ulaşabiliriz. Aynı zamanda protein dizisinin FASTA formatını da elde edebiliriz.


FASTA Formatı Nedir?

FASTA, 1988 yılında W.R. Pearson ve D.J. Lipman tarafından geliştirilmiş, popüler bir sekans-dizileme ve veri tabanı-tarama programıdır. FASTA tarafından kullanılan sekanslar aşağıdaki formata uymak zorundadır:
>My_Sequence_Name
ACGTCGCTAGCTACTAACGTCGCTAGCTACCTAAGCTAGATCCATAGCTATC
  
Satır, tanım satırı ve kendine özgü tanımlayıcısı olan  ‘>’  işareti ile başlar ve isteğe bağlı olan kısa tanımla devam eder. Devam eden tanımlar;  ‘>’  karakteri yeni bir sekansın başlangıcını gösterene kadar DNA veya protein sekansları (tek harfli kodlar şeklinde) içerir.

FASTA çözümlemesi kolay olduğu için oldukça popüler olmuş, ve birçok sekans analiz yazılımı için, BLAST ve CLUSTALW dahil, giriş formatı olmuştur.

Bazı programlar RAW formatı ile tek seferde bir sekans analiz ederler. Bu, tanım satırı olmadan, basitçe FASTA formatının sekans bölümüdür-ama makinalar titiz olabilir. RAW formatı istenirken FASTA formatı kullanmak hatalara sebep olur ya da bazı tanım satırları protein veya DNA sekansları ile sonuçlanabilir.

Araştırmış olduğumuz E.coli bakterisinde bulunan dUTPase proteininin FASTA formatı aşağıdaki gibidir.
>sp|P06968|DUT_ECOLI Deoxyuridine 5'-triphosphate nucleotidohydrolase OS=Escherichia coli (strain K12) OX=83333 GN=dut PE=1 SV=2
MMKKIDVKILDPRVGKEFPLPTYATSGSAGLDLRACLNDAVELAPGDTTLVPTGLAIHIA
DPSLAAMMLPRSGLGHKHGIVLGNLVGLIDSDYQGQLMISVWNRGQDSFTIQPGERIAQM
IFVPVVQAEFNLVEDFDATDRGEGGFGHSGRQ

Bu yazımızda bir protein hakkında detaylı bilgileri elde etmek amacıyla kullanabileceğiniz ExPASy internet sitesini uygulamalı bir şekilde anlatmaya çalıştık. Umarız sizler için bilgilendirici bir yazı olmuştur. Bir sonraki yazımızda görüşmek üzere hoşçakalın😊

Yorumlar

Bu blogdaki popüler yayınlar

NCBI ve BLAST ' a Giriş

Biyoinformatikte Veri Tabanları

DNA Dizileme Yöntemleri