PacBio 是第三代定序技術 (Third generation sequencing)的技術公司,目前的最新機型為RSII,最長長度可到30kb。
出來的rawdata其檔案格式為hdf5,其中有兩種,一個是bas.h5和bax.h5,其PacBio的文件有寫到以下:
PacBio 是第三代定序技術 (Third generation sequencing)的技術公司,目前的最新機型為RSII,最長長度可到30kb。
出來的rawdata其檔案格式為hdf5,其中有兩種,一個是bas.h5和bax.h5,其PacBio的文件有寫到以下:
allpath-LG 是目前bioinformatics裡認為最好的de novo assembler tool,雖然他的組裝結果很好,但是其input的限制很大,一定要有兩組paired-end,一組為一定要有overlap,另一組則要mate-paired,才能執行allpath-LG。
其中input還需要兩個檔案,一個為in_group.csv,一個為in_lib.csv,目前曾經碰到的問題是在這兩個檔案的格式裡,要注意他是以逗號分隔,但是最後一個選項是沒有逗號的!!!
Bioinformatics (生物資訊)在DNA研究部份,sequence assembly最重要的一環,其中最困難的就是de novo assembly,因此發展了許多演算法與軟體。
SOAPdenovo為SOAP(Short Oligonucleotide Analysis Package)相關應用程式中,用來進行de novo assembly的工具,其演算法為de bruijn,專門處理short-read(Illumina Genome Analyzer,IGA)。