生物信息學家一直在尋找新的工具來簡化和增強基因組分析管道。 NVIDIA Clara Parabricks 擁有 60 多種工具,能夠在研究和臨床環境中為種系和體細胞工作流程提供準確、快速的基因組分析。
NVIDIA Clara Parabricks 3.8 ,特點:
快速變體注釋工具。
腫瘤只需要臨床癌癥工作流程。
安培的額外支持 GPU 。
序列數據的快速增長要求更快的變體調用格式( VCF )讀寫速度。 Clara Parabricks 3.8 擴展了快速變量注釋、變量后調用、使用 snpswift 支持自定義數據庫注釋以及使用 bcftools 調用變量結果。在 Clara Parabricks 上, snpswift 提供了快速準確的 VCF 數據庫注釋,并利用了廣泛的數據庫。
測序技術的進步擴大了基因組學在臨床腫瘤學中的作用。 NVIDIA Clara Parabricks 現在為臨床癌癥工作流程提供了僅限腫瘤的體細胞呼叫者 LoFreq 和 Mutect2 呼叫。腫瘤正常呼叫可通過 LoFreq 、 Mutect2 、 Strelka2 、 SomaticSniper 、 Muse 在 Parabricks 上進行。
基因組科學家可以通過使用更廣泛的 GPU 體系結構運行 Clara Parabricks ,進一步加快基因組分析工作流程,包括 A6000 、 A100 、 A10 、 A30 、 A40 、 V100 和 T4 。這也支持客戶使用由特定 NVIDIA GPU 驅動的下一代測序儀器進行基址調用,這些客戶希望使用相同的 GPU 對 Clara Pararicks 進行二次分析。
擴展的快速變體注釋
在 1 月份發布的 Clara Parabricks 3.7 ,添加了一個新的變體注釋工具,有助于為下游基因組分析提供變體的功能信息。這一點很重要,因為正確的變體注釋有助于基因組研究和臨床診斷的最終結論。
Pararicks 的變體注釋工具 snpswift 提供了快速而準確的 VCF 數據庫注釋,與其他社區變體注釋解決方案(如 vcfanno )相比,它可以在更短的運行時內提供結果。 Snpswift 帶來了更多的功能和加速,同時保留了 VCF 文件的精確等位基因數據庫注釋的基本功能。新的 snpswift 工具還支持用 ENSEMBL 中的基因名稱數據注釋 VCF 文件,有助于理解編碼變體。
支持的數據庫包括 dbSNP 、 gnomAD 、 COSMIC 、 ClinVar 和 1000 個基因組。 Snpswift 可以對這些變量進行聯合注釋,為篩選 VCF 變量和解釋其重要性提供重要信息。此外, snpswift 能夠使用來自 ENSEMBL GTF 的信息注釋 VCF ,以添加詳細信息并利用該領域中其他廣泛使用的數據庫。
圖 1 Clara Pararicks 的變體注釋工具 snpswift 比其他社區變體注釋工具(如 vcfanno )提供更快、更準確的 VCF 數據庫注釋
除了這些廣泛使用的數據庫外,許多研究機構和公司都有自己豐富的內部數據集,這些數據集可以為每個變體提供有價值的特定領域信息。
Clara Parabricks 3.8 中的 Snpswift 現在使用多個自定義 TSV 數據庫對 VCF 進行注釋。 Snpswift 還能夠在 30 秒內用包含 500K 變體的自定義 TSV 注釋 600 萬變體 HG002 VCF 。用戶可以使用 VCF 、 GTF 和 TSV 數據庫聯合注釋 VCF ,所有這些都只需一個命令,只需一次運行。
最后, Clara Parabricks 3.8 包含了后果預測。預測變異的功能結果是對遺傳變異進行分類和排序注釋的關鍵步驟。 Parabricks 3.8 提供了一個 bcftoolscsq 命令,該命令封裝了眾所周知且速度極快的 bcftools csq 工具 ,提供了單體型感知的結果預測。這導致 VCF 文件中的變體分階段,以避免變體影響相同密碼子時出現常見錯誤。
圖 2 這張圖片拍攝于 調用 GitHub 鏈接的結果。 BCFtools / csq 與三個常用結果調用程序的性能比較,使用一個帶有 450 萬個站點的 VCF 示例
與基于CPU的環境相比,最先進的生物信息學工具的速度提高了60倍。全基因組工作流程的端到端分析只需22分鐘,外顯子組工作流程只需4分鐘。大規模測序項目和其他全基因組研究能夠在一臺DGX服務器上每天分析60多個基因組,同時降低相關成本,產生比以往任何時候都有用的見解。
關于作者
Vanessa Braunstein 在 NVIDIA 的醫療團隊從事產品營銷工作。此前,她在基因組學、醫學成像、制藥、化學和診斷公司從事產品開發和營銷。她學習分子和細胞生物學、公共衛生和商業。
Camir Ricketts是 NVIDIA ( NVIDIA )的一位生物信息學科學家,他正在開發新方法,以加速基因組分析并利用人工智能進行醫療保健。他在康奈爾大學威爾·康奈爾醫學院完成博士學位,專注于結構變異表征和腫瘤系統發育推斷的方法開發。
審核編輯:郭婷
-
cpu
+關注
關注
68文章
10878瀏覽量
212169 -
NVIDIA
+關注
關注
14文章
5013瀏覽量
103247 -
服務器
+關注
關注
12文章
9231瀏覽量
85626
發布評論請先 登錄
相關推薦
評論