MODELLER: Homoloji Modelleme ile Protein Yapı Tahmini — Adım Adım Kullanım Kılavuzu
Bu rehber, MODELLER yazılımının bilinmeyen bir proteinin üç boyutlu (3B) yapısını, deneysel olarak çözülmüş benzer protein yapılarına (şablonlara) dayanarak nasıl tahmin edeceğinizi adım adım açıklar. Homoloji modelleme yöntemiyle, proteinin işlevi, ilaç hedefi potansiyeli ve mutasyon etkileri hakkında kritik çıkarımlar yapılabilir.
💡 Önemli Uyarı: MODELLER, deneysel yapıya sahip olmayan proteinler için tahmini bir model üretir. Modelin doğruluğu, şablon ile hedef dizi arasındaki benzerliğe doğrudan bağlıdır. %30’den düşük dizi benzerliğiyle oluşturulan modeller güvenilir değildir.
1. MODELLER Nedir?
MODELLER, Andrej Šali ve çalışma grubu tarafından geliştirilen, karşılaştırmalı protein yapı modellemesi (comparative protein structure modeling) için kullanılan bir yazılımdır. Hedef proteinin amino asit dizisi ile deneysel olarak belirlenmiş bir veya daha fazla şablon protein yapısı arasındaki hizalamaya dayanarak, enerji minimizasyonu ve istatistiksel potansiyeller kullanarak 3B yapıyı tahmin eder.
Temel Özellikler:
Homojen (tek şablon) ve heterojen (çoklu şablon) modelleme.
Otomatik şablon arama ve dizi-structure hizalaması (isteğe bağlı).
Loop bölgesi modellemesi ve yan zincir optimizasyonu.
Model kalitesinin değerlendirilmesi için dahili istatistikler (DOPE, GA341).
Python API’si ile otomasyon ve özelleştirme.
Modelleri PDB formatında çıktı olarak verir.
2. Adım Adım Kullanım Kılavuzu
Adım 1: Yazılımı Kurma ve Hazırlık
MODELLER, komut satırı tabanlı bir yazılımdır. Python ile entegre çalışır.
Lisans anahtarınızı almak için e-posta adresinizle kaydolmanız gerekir.
Python 3.x kurulu olmalı ve modeller paketi sisteminize tanımlanmalıdır.
Adım 2: Girdi Dosyalarını Hazırlama
MODELLER için iki temel girdi gerekir:
Hedef Dizi: FASTA formatında bilinmeyen proteininizin dizisi.
Şablon Yapısı: PDB formatında deneysel olarak çözülmüş benzer protein yapısı (örneğin, 1TUP.pdb).
Ayrıca, hedef dizi ile şablon yapı arasındaki hizalamayı içeren bir .ali dosyası oluşturmanız gerekir. Bu dosya, hangi bölgelerin hizalandığını belirtir.
Aşağıdaki Python script’ini (örneğin, model-single.py) oluşturun ve çalıştırın:
from modeller import *
from modeller.automodel import *
env = Environ()
env.io.atom_files_directory = ['.']
a = AutoModel(env, alnfile='example.ali',
knowns='1tup', sequence='hedef_protein')
a.starting_model = 1
a.ending_model = 5 # 5 adet model oluştur
a.make()
Komut satırında çalıştırma:
python model-single.py
Çıktı olarak hedef_protein.B9999XXXX.pdb şeklinde 5 adet model dosyası üretilir.
Adım 4: Model Kalitesini Değerlendirme ve Görselleştirme
1. MODELLER, her model için .pdb ve .sch (assessment) dosyaları üretir. .sch dosyasındaki molpdf ve DOPE score değerlerine bakın: ne kadar düşükse model o kadar iyidir.
2. En iyi modeli seçin ve PyMOL veya ChimeraX ile açın.
3. Şablon yapı ile hedef modeli süperpozisyon yaparak benzerliklerini ve farklılıklarını inceleyin.
3. Pratik Uygulamalar ve Örnek Senaryolar
Senaryo 1: İnsanda Yeni Keşfedilen Bir Proteinin Yapısını Tahmin Etme
1. NCBI’dan insandaki hedef proteinin amino asit dizisini alın.
2. BLASTp ile PDB’de %40’tan yüksek benzerliğe sahip bir şablon protein bulun (örneğin, faredeki homologu).
3. Dizi hizalamasını Clustal Omega veya benzeri bir araçla yapın ve .ali formatına dönüştürün.
4. MODELLER ile 5 adet model oluşturun.
5. En düşük DOPE skoruna sahip modeli seçin ve PyMOL’de analiz edin.
Senaryo 2: Bir Mutasyonun Protein Yapısına Etkisini Modelleme
1. Wild-type (normal) proteinin yapısını MODELLER veya deneysel yapıdan alın.
2. Hedef pozisyonda mutasyonu (örneğin, V600E) içeren bir dizi oluşturun.
3. MODELLER’in loopmodel veya mutate_model script’lerini kullanarak mutasyonlu modeli oluşturun.
4. Wild-type ve mutant yapıları süperpozisyon yaparak konformasyonel değişimi ve potansiyel işlev kaybını analiz edin.
4. Yaygın Sorunlar ve Çözümleri
“Segmentation fault” hatası: Genellikle hizalama dosyasında hata vardır. .ali dosyanızın formatını dikkatlice kontrol edin.
Model kalitesi çok düşük: Şablon ile hedef dizi arasındaki benzerlik çok düşüktür. Farklı bir şablon veya çoklu şablon modelleme deneyin.
Loop bölgeleri düzensiz çıktı:loopmodel sınıfını kullanarak loop bölgelerini yeniden modelleyin.
5. Bilgiyi Test Et
Soru 1: MODELLER hangi temel prensibe dayanarak protein yapısı tahmini yapar?
Cevap:Homoloji modelleme (karşılaştırmalı modelleme). Bilinen bir şablon yapısına dayanarak benzer bir hedefin yapısını tahmin eder.
Soru 2: MODELLER’da model kalitesini değerlendirmek için kullanılan en yaygın skorlama metriklerinden biri hangisidir?
Cevap:DOPE skoru (Discrete Optimized Protein Energy). Ne kadar düşükse model o kadar iyidir.
Soru 3: MODELLER girdisi için mutlaka gereken iki dosya türü hangileridir?
Cevap: 1) Hedef proteinin FASTA dizisi, 2) Şablon yapının PDB dosyası ve 3) Aralarındaki hizalamayı içeren .ali dosyası.