Yeni varyant veritabanı dbSNP 150 yayınlandı.

İnsan genetik varyant veritabanı dbSNPn’in “build 150” adlı yeni versiyonu hem GRCh38.p7 hem de GRCh37.p13 referans genomları için yayınlandı. 1

Bu versiyonun, öncekilere göre iki noktada önemli farklılıklara sahip. Bunlardan birincisi yeni kayıtlardaki büyük artış. Diğeri de tüm genom dizileme tabanlı mega-projelerden gelen veri katkıları. Bu projelerden gelen veriler ile önceki versiyon olan dbSNP 149’daki kayıtlı SNP sayısı 154 Milyon iken; son versiyonda bu sayı 324 Milyon’a ulaşarak %110 arttı.

Yıllara göre dbSNP veritabanında kayıtlı Homo sapiens’e ait SNP’lerin sayısı.

Bu artışın arkasında ise iki kurum bulunuyor. Bu kaynakların biri, başında ünlü genetikçi Dr. Craig Venter’ın olduğu Human Longevity firması, bir diğeri de ABD Ulusal Kalp, Akciğer ve Kan Enstitüsü’nde (National Heart, Lung, and Blood Institute) gerçekleştirilen TOPMed (Trans-Omics for Precision Medicine) programı.

Her iki kuruluş da son 6 yıldır büyük bir yoğunlukla tüm genom dizileme çalışmaları yürütüyor.  TOPMed araştırma programı kapsamında çeşitli kalp, akciğer ve kan hastalıklarına sahip bireylerin tüm genom dizilemesi gerçekleştiriliyor. Bu sayede, bu hastalıklara neden olabilecek veya görülme riskini attıracak biyolojik işaretlerin tanımlanması amaçlanıyor.

TOPMed programı kapsamında, Kasım 2016 itibari ile 54.000’den fazla kişinin tüm genom dizilenmesi tamamlanmış, 18.000 tane yeni dizileme işlemi de devam etmekte. Proje sonu hedefi ise 120.000 tüm genom dizileme işlemi gerçekleştirmek.2 Bu kapsam ile TOPMed programı tek seferde dizilenen en fazla insan örneğine sahip olan proje ünvanına da sahip oluyor. Proje büyük olduğu için önceki çalışmalarda gözden kaçan bir çok varyant da tespit ediliyor.

Bir diğer veri kaynağı ise Human Longevity adlı özel kuruluş. Firma, uzun yaşayamayı başarmış kişilerin tüm genom dizilemelerini gerçekleştirerek, sağlıklı yaşamın genetik kökenlerini arıyor. Bu süreçte binlerce genom dizilemesi gerçekleştiriyor. Ekim 2016 itibari ile projede 10.000 tüm genom dizilemesi gerçekleştirilmiş durumda ve bu sayı her gün daha da artıyor.

Kısa Notlar:
  • Human Longevity tarafından kayıt altına alınan SNP’ler şu anda sadece GRCh38 referans genomuna uyumlu. Bu sebeple GRCh37 kullanılan çalışmalarda yeni SNP’lerin ID’leri gözükmüyor. Gelecek güncellemelerde bu SNP’lerin eski referans genom ile uyumluluk sorunları giderilecek. TOPMed tarafından kaydedilen SNP’ler ise her iki referans genom için de (GRCh38.p7 and GRCh37.p13) uyumlu.
  • Yeni veritabanının boyutundaki artış sebebiyle, NCBI’ın yerel görüntüleme arayüzü olan NCBI Sequence Viewer’da sadece genler üzerinde yer alan SNP’ler gösterilebiliyor. İntergenik SNP’lerin incelenmesi için FTP üzerinden indirilmesi gerekmekte.
Referanslar
1.
ANNOUNCEMENT. dbSNP Human Build 150 Double in Size to 324 Million Reference SNP (rs) Available at: https://www.ncbi.nlm.nih.gov/mailman/pipermail/dbsnp-announce/2017q2/000175.html. (Erişim: 17. Nisan 2017)
2.
Whole Genome Sequencing in the NHLBI Trans-Omics for Precision Medicine. Whole Genome Sequencing in the NHLBI Trans-Omics for Precision Medicine Available at: https://www.nhlbiwgs.org. (Erişim: 17. Nisan 2017)

Moleküler Biyolog ve Genetikçi. İstanbul Teknik Üniversitesi’nde doktora öğrencisi. 5 yıldır biyoinformatik ve yeni nesil dizileme üzerine çalışıyor. R programlama dili üzerine R Konsol adlı blogda yazıyor.

Site Footer