BLAST: Biyolojik Dizilerde Benzerlik Arama Aracı

Bu rehber, NCBI BLAST (Basic Local Alignment Search Tool) aracının bir DNA, RNA veya protein dizisinin bilinen veritabanlarında nasıl benzerliklerini arayacağınızı, sonuçları nasıl yorumlayacağınızı ve biyolojik anlamlarını nasıl çıkaracağınızı adım adım açıklar. Özellikle yeni keşfedilen bir genin işlevini tahmin etmek veya evrimsel ilişkileri belirlemek için vazgeçilmez bir araçtır.

💡 Önemli Uyarı: BLAST, dizi benzerliği aramak için tasarlanmış bir araçtır, %100 kesin sonuç vermez. Düşük benzerlik oranları (< %30) dikkatli yorumlanmalıdır. Sonuçlar deneysel doğrulamayı gerektirebilir.

1. BLAST Nedir?

BLAST (Basic Local Alignment Search Tool), Ulusal Biyoteknoloji Bilgi Merkezi (NCBI) tarafından geliştirilen, bir “sorgu” dizisinin büyük biyolojik veritabanlarında (örneğin, GenBank) yer alan milyonlarca dizi ile lokal hizalamalar yaparak benzerliklerini bulan bir algoritma ve web tabanlı araçtır. Dizinin muhtemel işlevi, evrimsel kökeni veya ait olduğu organizma hakkında kritik bilgiler sağlar.

Temel Türleri:

blastn: Nükleotid dizisi → Nükleotid veritabanı.
blastp: Protein dizisi → Protein veritabanı.
blastx: Nükleotid dizisi (çevrilerek) → Protein veritabanı.
tblastn: Protein dizisi → Nükleotid veritabanı (çevrilerek).
tblastx: Nükleotid dizisi (çevrilerek) → Nükleotid veritabanı (çevrilerek). (En yavaş ama en kapsamlı)

2. Adım Adım Kullanım Kılavuzu

Adım 1: NCBI BLAST Web Sitesine Erişim

BLAST tamamen ücretsiz ve web tabanlıdır. Resmi NCBI BLAST sayfasına gidin:

NCBI BLAST Ana Sayfası: https://blast.ncbi.nlm.nih.gov/Blast.cgi

Hiçbir kurulum gerekmez, modern bir internet tarayıcısı yeterlidir.

Adım 2: Sorgu Dizisini Girme ve Veritabanı Seçimi

1. Uygun BLAST programını seçin (örneğin, protein diziniz varsa blastp).
2. “Enter Query Sequence” kutusuna FASTA formatında veya düz metin olarak dizinizi yapıştırın. FASTA başlığı (örn: >My_Protein) isteğe bağlıdır.
3. “Choose Search Set” bölümünden uygun veritabanını seçin. Varsayılan olarak nr (non-redundant) önerilir.
4. Gelişmiş kullanıcılar “Algorithm parameters” kısmından E-value, sözcük boyutu gibi ayarları değiştirebilir.

>My_Unknown_Protein
MKWVTFISLLFLFSSAYSRGVFRRDAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCDKCHTGLVRDFGDLVQK
                    

Adım 3: Arama Yapma ve Sonuçları Yorumlama

“BLAST” butonuna tıklayın. Arama birkaç saniye ile birkaç dakika arasında sürebilir.

Sonuçlar üç ana bölümden oluşur:

Grafik Görünüm: Sorgu dizinizdeki benzerlik bölgelerini grafiksel olarak gösterir.
Özet Tablo: En iyi eşleşmelerin (hits) listesi. Dikkat edilmesi gereken sütunlar:
- Description: Eşleşen dizinin açıklaması ve kaynağı.
- Max Score: Hizalamanın toplam skoru. Ne kadar yüksekse benzerlik o kadar güçlüdür.
- Query Cover: Sorgu dizisinin yüzde kaçının hizalandığını gösterir.
- E-value: İstatistiksel önem. Ne kadar düşükse (örn: 1e-50), eşleşme o kadar anlamlıdır. 0.05’in altında olması genellikle kabul edilir.
- Per. Ident: Hizalanan bölgelerdeki yüzde kimlik (identity).
Ayrıntılı Hizalamalar: Sorgu ve veritabanı dizilerinin nükleotid/baz veya amino asit seviyesinde nasıl hizalandığını gösterir.

Adım 4: Sonuçları Kaydetme ve Raporlama

1. Sayfanın üstündeki “Download” butonu ile sonuçları HTML, Text, XML gibi formatlarda kaydedebilirsiniz.
2. Yayın yapmak için genellikle “Text” veya “XML” formatı tercih edilir.
3. Önemli eşleşmelerin Accession numaralarını not alın ve NCBI’da ilgili girdilere giderek daha fazla bilgi (organizma, fonksiyon, yayın) toplayın.

İpucu: Sonuçlarınızı yorumlarken sadece en yüksek skorlu eşleşmeye bakmayın. E-value, Query Cover ve Per. Ident değerlerinin hepsini birlikte değerlendirin.

3. Pratik Uygulamalar ve Örnek Senaryolar

Senaryo 1: Bilinmeyen Bir Proteinin İşlevini Tahmin Etme

1. Bilinmeyen proteininizin amino asit dizisini blastp ile nr veritabanında aratın.
2. En iyi eşleşmelerin %95’in üzerinde “Per. Ident” ve 0.0’a yakın E-value’ya sahip olduğunu görün.
3. Bu eşleşmelerin açıklamalarında “insulin”, “kinase”, “transcription factor” gibi anahtar kelimeler arayın.
4. Böylece bilinmeyen proteininizin muhtemelen aynı işlevi gördüğünü çıkarabilirsiniz.

Senaryo 2: Yeni Bir Türdeki Genin Evrimsel Kökenini Belirleme

1. Yeni keşfedilen türden bir genin nükleotid dizisini blastn ile nr/nt veritabanında aratın.
2. En iyi eşleşmelerin farklı organizmalardan olduğunu görün.
3. En yüksek skor ve en düşük E-value’ya sahip organizmayı, geninizin en yakın evrimsel akrabası olarak belirleyin.
4. “Taxonomy reports” seçeneği ile sonuçları taksonomik olarak gruplayabilirsiniz.

4. Yaygın Sorunlar ve Çözümleri

“No significant similarity found” hatası: Diziniz çok kısa olabilir, yanlış BLAST türü seçmiş olabilirsiniz (örneğin, protein dizisi için blastn kullanmak) veya gerçekten benzersiz bir dizidir. blastx veya tblastx deneyin.
Çok fazla sonuç geldi: “Max target sequences” değerini azaltın veya “Organism” kutusuna spesifik bir organizma adı yazın.
Sonuçlar çok uzun sürüyor: “Algorithm parameters” altında sözcük boyutunu (word size) artırın veya daha küçük bir veritabanı seçin.

5. Bilgiyi Test Et

Soru 1: Bir protein dizisini protein veritabanında aramak için hangi BLAST türü kullanılmalıdır?

Cevap: blastp

Soru 2: BLAST sonuçlarında bir eşleşmenin istatistiksel olarak anlamlı olduğunu gösteren en kritik parametre hangisidir?

Cevap: E-value. Ne kadar düşükse (örneğin 1e-10), eşleşme o kadar anlamlıdır.

Soru 3: Sorgu dizisinin %85’inin hizalandığını gösteren BLAST parametresi hangisidir?

Cevap: Query Cover

Nasıl ders çalışmalıyım ve siteyi nasıl kullanırım?

NCBI BLAST

BLAST: Biyolojik Dizilerde Benzerlik Arama Aracı — Adım Adım Kullanım Kılavuzu