Bu rehber, Bioconductor projesinin yüksek verimli genomik verileri (RNA-seq, ChIP-seq, mikrodizin, SNP, flow cytometry vb.) nasıl analiz edeceğinizi, verileri nasıl görselleştireceğinizi ve biyolojik anlamları nasıl çıkaracağınızı adım adım açıklar. Özellikle diferansiyel ekspresyon analizi, yolak zenginleştirme ve kalite kontrol için vazgeçilmez bir kaynaktır.
BiocManager::install(version = "3.18") gibi komutlarla sabit versiyon kullanmanız önerilir.
Bioconductor, genomik ve yüksek verimli biyolojik verileri analiz etmek için geliştirilmiş, açık kaynaklı R paketleri koleksiyonudur. 2001 yılında Roswell Park Kanser Enstitüsü’nde Dr. Robert Gentleman ve Dr. Wolfgang Huber tarafından başlatılmıştır. Bugün 2000’den fazla paket içerir ve dünya çapında binlerce araştırmacı tarafından kullanılır.
1. Önce R’ı resmi sitesinden kurun: https://cran.r-project.org/
2. RStudio IDE’yi kurun (isteğe bağlı ama şiddetle önerilir): https://posit.co/download/rstudio-desktop/
3. R konsolunu açıp aşağıdaki komutlarla Bioconductor’u kurun:
Not: Belirli bir versiyon için: BiocManager::install(version = "3.18")
Örneğin, RNA-seq verisi için DESeq2 ve görselleştirme için pheatmap yükleyelim:
Veri genellikle iki dosyadan oluşur:
- count_matrix.csv: Genlere göre örneklerin okunma sayıları.
- sample_info.csv: Örneklerin grup bilgileri (örneğin, “Tedavi” ve “Kontrol”).
1. DESeq2 nesnesi oluşturun ve analizi çalıştırın:
2. Önemli genleri ısı haritası ile görselleştirin:
1. Önemli gen listesini CSV olarak kaydedin:
2. Görselleri PDF veya PNG olarak kaydetmek için:
İpucu: Yayın yapmak için ggplot2 veya ComplexHeatmap gibi daha özelleştirilebilir paketler tercih edilir.
1. Hastanın kanser ve normal dokularından alınan RNA-seq verilerini yükleyin.
2. DESeq2 ile analiz edin.
3. p-value < 0.05 ve |log2FoldChange| > 1 olan genleri filtreleyin.
4. Bu genlerin hangi biyolojik süreçlerde (GO) veya metabolik yollarda (KEGG) zenginleştiğini clusterProfiler ile analiz edin.
1. Bir ilacın uygulandığı ve uygulanmadığı hücrelerden alınan mikrodizin verisini yükleyin.
2. limma paketi ile normalizasyon ve diferansiyel ekspresyon analizi yapın.
3. Volkan grafiği ile önemli genleri görselleştirin.
4. Protein-protein etkileşim ağı oluşturmak için STRING veritabanına aktarın.
BiocManager::valid() ile kontrol edin.Soru 1: Bioconductor hangi programlama diline dayalıdır?
Soru 2: RNA-seq verilerinde diferansiyel ekspresyon analizi için en çok kullanılan Bioconductor paketlerinden biri hangisidir?
Soru 3: Bioconductor paketlerini yüklemek için hangi R komutu kullanılır?
BiocManager::install("paket_adi")