DESTEK OL

Galaxy Platform

Galaxy Platform: Kod Yazmadan Biyoinformatik Analiz — Adım Adım Kullanım Kılavuzu

Bu rehber, Galaxy Platform’un yüksek verimli dizi analizlerini (RNA-seq, ChIP-seq, varyant çağırma, BLAST, ClustalW vb.) nasıl gerçekleştireceğinizi, analiz akışlarını (workflow) nasıl kaydedip paylaşacağınızı ve sonuçlarınızı nasıl yorumlayacağınızı adım adım açıklar. Galaxy, komut satırı bilgisi olmadan karmaşık biyoinformatik analizler yapmanızı sağlayan, açık kaynaklı ve kullanıcı dostu bir web tabanlı platformdur.

💡 Önemli Uyarı: Galaxy’de analiz yaparken her adımda “Execute” butonuna basmayı unutmayın. Analizler uzun sürebilir, lütfen sabırlı olun. Büyük veri setleri için yerel kurulum veya bulut tabanlı hizmetler (UseGalaxy.eu, UseGalaxy.org) tercih edilmelidir.

1. Galaxy Platform Nedir?

Galaxy, Pennsylvania State University ve Johns Hopkins University’de geliştirilen, biyoinformatik analizleri görsel bir arayüz üzerinden yapabilmenizi sağlayan açık kaynaklı bir platformdur. Kullanıcılar, veri yükleyebilir, yüzlerce analiz aracını (tools) sırayla çalıştırabilir, analiz akışlarını (workflow) kaydedebilir ve sonuçlarını paylaşabilir. Her adım tamamen şeffaf ve tekrarlanabilirdir.

Temel Özellikler:

  • Kod yazmadan biyoinformatik analiz yapma.
  • Yüzlerce entegre araç: FastQC, HISAT2, DESeq2, BWA, GATK, BLAST, ClustalW, IGV vb.
  • Analiz geçmişini kaydetme ve her adımı tekrar inceleme.
  • Workflow (iş akışı) oluşturma ve paylaşım.
  • Veri görselleştirme ve raporlama.
  • Ortak kullanım ve paylaşım: Analizlerinizi ve verilerinizi başkalarıyla paylaşabilirsiniz.

2. Adım Adım Kullanım Kılavuzu

Adım 1: Galaxy Platformuna Erişim ve Hesap Oluşturma

Galaxy tamamen web tabanlıdır. Üç ana halka açık sunucu vardır:

“User → Register” menüsünden ücretsiz hesap oluşturun. Bu, analiz geçmişinizi ve verilerinizi kaydetmenizi sağlar.

Adım 2: Veri Yükleme ve Kalite Kontrolü

1. Sol paneldeki “Upload Data” butonuna tıklayın.
2. FASTQ dosyalarınızı bilgisayarınızdan veya URL’den yükleyin.
3. “Execute” butonuna basın.
4. Yüklenen veriler “History” panelinde (sağda) görünecektir.
5. Kalite kontrolü için “Tool” panelinden “FastQC” aracını bulun ve çalıştırın.
6. FastQC raporunu inceleyin: düşük kaliteli okumalar varsa “Trim Galore!” veya “Trimmomatic” ile kırpma yapın.

Adım 3: RNA-seq Analizi Örneği: HISAT2 + featureCounts + DESeq2

1. “Tool” panelinden “HISAT2” aracını bulun ve çalıştırın. Referans genom ve yüklediğiniz FASTQ dosyalarını seçin.
2. Çıktı olarak üretilen BAM dosyasını “featureCounts” aracına verin. GTF dosyası olarak referans annotasyonu seçin.
3. featureCounts çıktısını (sayım tablosu) “DESeq2” aracına verin. Tasarım matrisini (örneğin, “condition”) belirtin.
4. DESeq2 çıktısını inceleyin: p-value ve log2FoldChange sütunlarına göre diferansiyel ekspresyon analizi yapın.

Adım 4: Workflow Oluşturma ve Sonuçları Paylaşma

1. “Workflow” sekmesine gidin → “Create New” butonuna tıklayın.
2. “Extract workflow from history” seçeneğiyle yaptığınız analiz adımlarını otomatik olarak workflow’a dönüştürebilirsiniz.
3. Workflow’u kaydedin ve isim verin.
4. Sonuçları paylaşmak için “Share or Publish” butonunu kullanın. Analiz geçmişinizi veya workflow’unuzu başkalarıyla paylaşabilirsiniz.

3. Pratik Uygulamalar ve Örnek Senaryolar

Senaryo 1: Yeni Bir Türdeki Gen Ekspresyonunun Kontrol ile Karşılaştırılması

1. Kontrol ve tedavi gruplarına ait RNA-seq FASTQ dosyalarını yükleyin.
2. FastQC → Trim Galore! → HISAT2 → featureCounts → DESeq2 workflow’unu çalıştırın.
3. p-value < 0.05 ve |log2FC| > 1 olan genleri filtreleyin.
4. Volkan grafiği veya ısı haritası (heatmap) oluşturarak sonuçları görselleştirin.

Senaryo 2: SARS-CoV-2 Genomunda Varyant Çağırma

1. Hastadan alınan NGS verisini (FASTQ) yükleyin.
2. “BWA-MEM” ile referans SARS-CoV-2 genomuna hizalama yapın.
3. “GATK HaplotypeCaller” veya “FreeBayes” ile varyant çağırma yapın.
4. “SnpEff” ile varyantların fonksiyonel etkilerini (missense, synonymous vb.) belirleyin.
5. Önemli varyantları tablo halinde raporlayın.

4. Yaygın Sorunlar ve Çözümleri

  • “Tool not found” hatası: Aracın adını tam olarak yazdığınızdan emin olun. “Tool Shed” üzerinden eksik araçları yükleyebilirsiniz (sadece admin yetkisiyle).
  • Analiz çok uzun sürüyor: Sunucu yoğun olabilir. “UseGalaxy.eu” gibi alternatif sunucuları deneyin veya analiz parametrelerini optimize edin (örneğin, küçük bir alt kümeyle test edin).
  • “Dataset failed” hatası: Girdi formatı hatalı olabilir. Girdi dosyasının formatını (FASTQ, BAM, GTF vb.) doğru seçtiğinizden emin olun.

5. Bilgiyi Test Et

Soru 1: Galaxy Platform’un en büyük avantajı nedir?

Cevap: Kod yazmadan karmaşık biyoinformatik analizler yapabilmek. Her adımı görsel arayüz üzerinden yönetebilirsiniz.

Soru 2: Galaxy’de analiz geçmişinizi kaydetmek ve tekrar kullanmak için hangi özelliği kullanırsınız?

Cevap: Workflow (İş Akışı). Analiz adımlarını otomatikleştirmenizi ve paylaşmanızı sağlar.

Soru 3: Galaxy’de bir analiz adımını çalıştırmak için hangi butona basmalısınız?

Cevap: “Execute” butonu. Bu butona basmadan analiz başlamaz.