讀分割最優匹配的indels識別算法
大小:0.83 MB 人氣: 2017-12-25 需要積分:3
高通量測序技術的發展,極大地推動了基因組結構變異識別的研究,當前,該領域主要使用覆蓋度、讀分割或片段組裝方法來識別變異,但目前的方法識別結果不夠準確,敏感度高,對基因組結構變異的信息(如變異序列、變異坐標等)挖掘不充分.插入和刪除類型的結構變異統稱為indels,在基因組結構變異中最為常見.為此,針對indels的精確識別,提出了基于讀分割和動態規劃的最優序列匹配算法(optimal split-read matching algorithm,簡稱OSRM).OSRM算法能將異常讀片段以最少的空位打斷比對到參考序列上.首先建立異常讀片段與特定參考序列的匹配得分矩陣;然后,建立回溯路徑矩陣;最后,用以變異特點設計的得分公式對每條路徑進行最優匹配篩選,輸出精確識別的indels坐標及序列.實驗結果顯示。該方法對小中型的indels有很高的識別性能.此外,與讀分割法的經典算法Pindel進行了比較,證買OSRM算法在小中型的indels識別方面有更好的效果,可識別更復雜的情況.
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%