Bu rehber, NCBI BLAST (Basic Local Alignment Search Tool) aracının bir DNA, RNA veya protein dizisinin bilinen veritabanlarında nasıl benzerliklerini arayacağınızı, sonuçları nasıl yorumlayacağınızı ve biyolojik anlamlarını nasıl çıkaracağınızı adım adım açıklar. Özellikle yeni keşfedilen bir genin işlevini tahmin etmek veya evrimsel ilişkileri belirlemek için vazgeçilmez bir araçtır.
BLAST (Basic Local Alignment Search Tool), Ulusal Biyoteknoloji Bilgi Merkezi (NCBI) tarafından geliştirilen, bir “sorgu” dizisinin büyük biyolojik veritabanlarında (örneğin, GenBank) yer alan milyonlarca dizi ile lokal hizalamalar yaparak benzerliklerini bulan bir algoritma ve web tabanlı araçtır. Dizinin muhtemel işlevi, evrimsel kökeni veya ait olduğu organizma hakkında kritik bilgiler sağlar.
BLAST tamamen ücretsiz ve web tabanlıdır. Resmi NCBI BLAST sayfasına gidin:
Hiçbir kurulum gerekmez, modern bir internet tarayıcısı yeterlidir.
1. Uygun BLAST programını seçin (örneğin, protein diziniz varsa blastp).
2. “Enter Query Sequence” kutusuna FASTA formatında veya düz metin olarak dizinizi yapıştırın. FASTA başlığı (örn: >My_Protein) isteğe bağlıdır.
3. “Choose Search Set” bölümünden uygun veritabanını seçin. Varsayılan olarak nr (non-redundant) önerilir.
4. Gelişmiş kullanıcılar “Algorithm parameters” kısmından E-value, sözcük boyutu gibi ayarları değiştirebilir.
“BLAST” butonuna tıklayın. Arama birkaç saniye ile birkaç dakika arasında sürebilir.
Sonuçlar üç ana bölümden oluşur:
Description: Eşleşen dizinin açıklaması ve kaynağı.Max Score: Hizalamanın toplam skoru. Ne kadar yüksekse benzerlik o kadar güçlüdür.Query Cover: Sorgu dizisinin yüzde kaçının hizalandığını gösterir.E-value: İstatistiksel önem. Ne kadar düşükse (örn: 1e-50), eşleşme o kadar anlamlıdır. 0.05’in altında olması genellikle kabul edilir.Per. Ident: Hizalanan bölgelerdeki yüzde kimlik (identity).1. Sayfanın üstündeki “Download” butonu ile sonuçları HTML, Text, XML gibi formatlarda kaydedebilirsiniz.
2. Yayın yapmak için genellikle “Text” veya “XML” formatı tercih edilir.
3. Önemli eşleşmelerin Accession numaralarını not alın ve NCBI’da ilgili girdilere giderek daha fazla bilgi (organizma, fonksiyon, yayın) toplayın.
İpucu: Sonuçlarınızı yorumlarken sadece en yüksek skorlu eşleşmeye bakmayın. E-value, Query Cover ve Per. Ident değerlerinin hepsini birlikte değerlendirin.
1. Bilinmeyen proteininizin amino asit dizisini blastp ile nr veritabanında aratın.
2. En iyi eşleşmelerin %95’in üzerinde “Per. Ident” ve 0.0’a yakın E-value’ya sahip olduğunu görün.
3. Bu eşleşmelerin açıklamalarında “insulin”, “kinase”, “transcription factor” gibi anahtar kelimeler arayın.
4. Böylece bilinmeyen proteininizin muhtemelen aynı işlevi gördüğünü çıkarabilirsiniz.
1. Yeni keşfedilen türden bir genin nükleotid dizisini blastn ile nr/nt veritabanında aratın.
2. En iyi eşleşmelerin farklı organizmalardan olduğunu görün.
3. En yüksek skor ve en düşük E-value’ya sahip organizmayı, geninizin en yakın evrimsel akrabası olarak belirleyin.
4. “Taxonomy reports” seçeneği ile sonuçları taksonomik olarak gruplayabilirsiniz.
blastx veya tblastx deneyin.Soru 1: Bir protein dizisini protein veritabanında aramak için hangi BLAST türü kullanılmalıdır?
Soru 2: BLAST sonuçlarında bir eşleşmenin istatistiksel olarak anlamlı olduğunu gösteren en kritik parametre hangisidir?
Soru 3: Sorgu dizisinin %85’inin hizalandığını gösteren BLAST parametresi hangisidir?