云計算為什么可以基因測序中持續(xù)發(fā)展落地?
隨著基因工程在疾病風險、祖源分析等一些新應用新場景的出現(xiàn),催生了不同的算力需求,對計算架構也提出更高要求。生物測序可以說是信息技術和生物技術緊密結合的行業(yè),需要借助高性能計算來處理海量爆炸的數(shù)據(jù)資源!
基因測序通常會面臨以下三個痛點:
1 基因測序業(yè)務一般分為項目型,有波峰波谷的區(qū)別,為了足夠的資源支撐的同時不造成資源浪費,會選擇云計算彈性使用的資源。
2 復雜基因組在各個測序分析的階段需要借助不同規(guī)格的計算資源,線下計算集群往往無法適應快速的擴縮容。
3 目前的三代測序已成為重要的技術趨勢,云計算能夠更好的滿足其對算力方面的要求。
上述所說的是算力方面,而實際上,基因測序企業(yè)更偏愛云計算平臺,這就和傳輸/存儲拖不了干系:
1 基因測序最高每天甚至有十幾個T的基因下機數(shù)據(jù),海量的數(shù)據(jù)傳輸需求和存儲對傳輸帶寬要求極高。
2 行業(yè)數(shù)據(jù)存儲包括規(guī)劃、分配、回收、歸檔等過程,運維成本極高。
3 基因測序中涉及到相當多的敏感數(shù)據(jù),對于安全的要求極高。
北鯤云為基因測序行業(yè)用戶提供高性能計算完整解決方案,搭建NGS數(shù)字化全流程平臺,幫助用戶降低計算資源成本,解決IT/運維問題,提高研發(fā)效率。對于基因測序的各大痛點,都有招數(shù)一一化解。
最近北鯤云贊助天津大學生命科學學院團隊TJUSLS_China參賽并斬獲金獎(Gold Medal)。
今年 TJUSLS_China 團隊的研究對象是 Proteinase K(蛋白酶 K)。目前商業(yè)化的 Proteinase K 產品大都面臨鈣離子依賴性及不耐熱的問題。 TJUSLS_China 團隊2022年的項目利用合成生物學的方法設計生產出了既不依賴鈣離子,常溫下熱穩(wěn)定性也顯著增強的 Proteinase K 突變體(Capsid ripper)。 以上項目研究成果得到了大賽評委及專家的高度評價,特別是對隊伍提出的新穎蛋白質設計策略予以了充分肯定。
在項目的建模部分,團隊需要使用 AlphaFold 2和GROMACS兩款軟件,此過程既需要 GPU 算力,也需要 CPU 算力。算力不足,服務器連接困難、難以并行運算等多個問題導致項目進度緩慢。
項目實現(xiàn)過程中,北鯤云為團隊提供了有力的平臺支持和充足的算力支持,北鯤云基于通用、便捷、智能的作業(yè)調度系統(tǒng)和公共服務,為上層應用提供技術保障,也團隊提供了強大HPC云端算力。兩者融合,共同發(fā)力打造一站式高性能計算平臺,提供穩(wěn)定、高效、安全的計算服務,為團隊取得好成績奠定了堅實基礎。
團隊在計算過程中,無需改變平時使用習慣,軟件開箱即用,在SSH連接方式中通過Slurm命令即可輕松提交任務。極易上手的平臺操作大大提高工作效率。在算力資源方面,主要選擇了32核Intel Xeon(Cascade Lake) Platinum 8269/8269CY,在保證運算速度的同時大大的降低了成本。在時間緊張時,最高選擇了192核Intel Xeon Platinum (Cooper Lake) 8369 3.3 GHz/3.8 GHz進行運算,極大的縮短了計算時間。
更多與基因測序相關的信息,歡迎聯(lián)系我們!
審核編輯黃昊宇
-
云計算
+關注
關注
39文章
7837瀏覽量
137540
發(fā)布評論請先 登錄
相關推薦
評論