EN
chi-biotech 近緣物種基因組修正策略


策略背景介紹


  非模式物種的高通量測序項目, 采用De novo組裝參考序列,將面臨費時費力費錢、組裝錯誤率高,注釋困難等系列問題。如果能找到近緣物種基因組并進行修正,是一種省力省錢,且準確可靠的策略。然而傳統算法因容錯率低,不能修正高差異度的參考序列。FANSe由于其高精準度、高容錯能力,在近緣物種基因組修正上表現突出,可以在很大程度上解決非模式物種高通量測序的參考序列問題。



優勢


 避免了采用De novo組裝參考序列面臨的費時費力費錢、組裝錯誤率高,注釋困難等系列問題
 近緣物種基因組修正策略,相對省力省錢,且結果準確可靠
 基于FANSe的近緣物種基因組修正,能完美應對高差異度的參考序列


應用方向



案例【臨床分離修正基因組】[1]


背景


  臨床分離一株短小芽孢桿菌(Bacillus pumilus),與標準模式菌株Bacillus pumilus SAFR-032基因組差異度高達5%。 用Illumina HiSeq-2000測序儀測序其基因組,將reads向標準模式菌株參考基因組進行逐次累進比對,以尋找基因組突變及修正基因組。隨機挑選1994個位點,使用毛細管測序(一代測序)方法測定真實的基因組,以檢驗幾種算法檢測突變和修正基因組的能力。


結果


  在實驗驗證的1994個位點中,FANSe 修正基因組的結果無一假陽性、無一假陰性,完美符合真實基因組。而傳統算法 Bowtie2 和 Stampy 修正的結果存在大量的假陽性和假陰性,其修正的基因組有許多堿基不符合真實狀況,被實驗所否定。下圖展示了部分實驗驗證結果,標灰色的堿基為不符合實際的堿基。這一結果顯示了FANSe2驚人的準確性和可驗證性。






 基因名




 驗證區段長度

不符合實驗驗證的堿基數量(假陰性、假陽性)



原始參考序列



Bowtie2修正



Stampy修正



FANSe修正

BPUM_11_39

360 69(19.2%) 69 16 0

hisC

720 38(5.3%) 38 5 0

yceD

360 40(11.1%) 40 4 0

rpsC

554 2(0.4%) 3 0 0




參考文獻


[1] X Wu, L Xu, W Gu, Q Xu, QY He *, X Sun *, G Zhang * Iterative Genome Correction Largely Improves Proteomic Analysis of Nonmodel Organisms. Journal of proteome research (2014), 13 (6), 2724–2734.

















北京时时彩开奖在哪查