亚州综合一区_啪啪av大全导航福利_韩国一级片免费看_国产对白做受_夜夜躁很很躁日日躁2020_第一色网站

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > 腫瘤純度和倍性評估工具Sequenza的安裝和使用方法

腫瘤純度和倍性評估工具Sequenza的安裝和使用方法

瀏覽次數:2659 發布日期:2024-5-13  來源:本站 僅供參考,謝絕轉載,否則責任自負

腫瘤樣本中癌細胞總是混合一定未知比例的正常細胞,我們稱腫瘤樣本中癌細胞所占的比例為腫瘤純度(Tumor purity),稱由染色體結構和數目異常導致的腫瘤樣本中癌細胞的真正含量為倍性(Tumor ploidy)。估計腫瘤的純度和倍性有利于癌癥基因組進化和腫瘤內的異質性研究。

Sequenza是一個使用配對的腫瘤/正常樣本DNA測序數據來估計腫瘤樣本純度和倍性的軟件,同時還檢測腫瘤樣本拷貝數變異。本期小編詳細給大家介紹該軟件的安裝及使用。

1 軟件安裝   

首先是軟件安裝,該軟件依賴python包sequenza-utils和R包sequenza,分別安裝這兩個包,有很多小伙伴在安裝軟件的過程中總會遇到各種版本問題,建議使用conda虛擬環境安裝,首先在虛擬環境中安裝python和R:

# 創建虛擬環境Sequenza,并安裝python

conda create -n Sequenza python=3.8

# 為虛擬環境安裝R

conda install -n Sequenza r=3.6.3

# 進入虛擬環境Sequenza

conda activate Sequenza

然后就是在虛擬環境中進行python和R包安裝,跟在linux環境下安裝一樣。

1.1.sequenza-utils安裝(python包)

sequenza-utils包安裝比較容易,以下有兩種安裝方式:

官方說明:https://sequenza-utils.readthedocs.io/en/latest/

# 安裝方法1(推薦)

pip install sequenza-utils

# 安裝方法2

git clone https://bitbucket.org/sequenza_tools/sequenza-utils

cd sequenza-utils

python setup.py test

python setup.py install

# 安裝成功后,查看幫助

sequenza-utils -h

1.2.sequenza安裝(R包)

# 安裝sequenza包前,需要先安裝copynumber包

install.packages("BiocManager")

library(BiocManager)

BiocManager::install("copynumber")

# 或者使用conda安裝(推薦)

conda install -c bioconda bioconductor-copynumber

# 安裝sequenza包

install.packages("sequenza")

# 安裝成功后,查看幫助

library(sequenza)

library(help="sequenza")

2 使用方法   

Python和R包安裝成功后,就可以進行腫瘤純度和倍性評估,我們使用處理后的腫瘤配對樣本BAM文件、參考基因組ref文件作為輸入,BAM文件通過基因組比對流程得到(如GATK標準流程),參考基因組文件可以通過UCSC下載(hg19/hg38)。

2.1. 基于python的預處理sequenza-utils

# 制作參考基因組GC標準化文件,通過-w參數分割基因組文件,設置越小檢測敏感性越高。

sequenza-utils gc_wiggle -f $ref -w 50 -o - | gzip > hg19.gc50Base.txt.gz

# 根據腫瘤樣本和對照樣本BAM文件統計GC標準文件每個堿基的深度和等位堿基頻率等。

sequenza-utils bam2seqz \

-gc $out/hg19.gc50Base.txt.gz \

-F $ref \

-n $normalbam \

-t $tumorbam | gzip >$out/$tumor/${tumor}.seqz.gz \

# 提取測序深度,確定正常標本中的純合和雜合位置,并從腫瘤標本中計算出變異等位基因和等位基因頻率。減小seqz文件的大小,提高模型運行效率

sequenza-utils seqz_binning -w 50 \

-s $out/$tumor/${tumor}.seqz.gz | gzip >$out/$tumor/${tumor}_small.seqz.gz

2.2. 模型擬合及可視化工具sequenza

# 輸入文件(${tumor}_small.seqz.gz)預處理

(1)需要刪除chrM或非常規染色體數據,否則會報錯xlim有非限制值;

(2)為了提高評估準確性,可以對數據進行篩選,比如篩選DP > 10。

       這個處理步驟自行使用python或R編程,然后再壓縮,名字還是一樣。

# 導入預處理數據,并對腫瘤進行GC含量歸一化與正常深度之比,并使用“copynumber”軟件包進行等位基因特異性分割。

test <- sequenza.extract(“${tumor}_small.seqz.gz”, verbose = FALSE)

# 推斷細胞性和倍性參數以及拷貝數分布圖,使用后驗概率空間的局部最大值來提供替代解決方案

CP <- sequenza.fit(test)  

#計算純度和倍性,很耗時間

# 返回估計結果以及替代解決方案以及沿基因組和單個染色體的數據和模型的可視化

sequenza.results(sequenza.extract = test,

cp.table = CP,

sample.id = sample,

out.dir=sample)

3 結果說明

所有的結果文件說明如下:

img1

結果有很多,但是純度和倍性的相關結果其實就3個文件,如下:

img2

我們依次打開這三個文件,一起來看看結果長啥樣:

(1)result_alternative_solutions.txt

img3

表1 腫瘤樣本純度和倍性評估結果

 

說明:Cellularity:腫瘤樣本純度 Ploidy:腫瘤樣本倍性 SLPP:對數后驗概率

(2)result_CP_contours.pdf

img4

圖1 腫瘤樣本純度與模型結果

說明:橫坐標為倍性值,縱坐標為純度值,背景藍色表示最有可能的分布,白色表示最不可能的分布,其中紅色圈點為最優值,即SLPP值最大,其它為次優解(圖中“+”)

(3)result_model_fit.pdf

img5

圖2 腫瘤樣本倍性模型評估結果

說明:橫坐標為B allele frequency,縱坐標左側Depth ratio代表每個基因組片段腫瘤樣本與正常樣本測序深度比(低比值下估算的腫瘤樣本拷貝數不可信),縱坐標右側copy number代表模型估算的拷貝數(黑色圓圈和點),背景顏色越紅表示越可信。

好了,以上就是使用基因組數據評估腫瘤樣本純度和倍性的過程。更多實用生信分析方法,小編將持續更新。

發布者:上海生物芯片有限公司
聯系電話:400-100-2131
E-mail:marketing@shbiochip.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 欧美天天澡天天爽日日A | 好吊妞988gao在线视 | 91嫩草精品 | 国产日韩欧美一区二区在线播放 | 欧美日韩一区三区 | 9久热久爱免费精品视频在线 | 亚洲一区二区三区在线免费观看 | 欧美电影在线看 | 亚洲AV永久无码嘿嘿嘿嘿 | 欧美性猛交xxxx免费视频软件 | porno日本ⅹxxx老师 | 五月激情六月天 | 成人性生交大片免费看5 | 青苹果乐园在线观看免费动漫 | 丰满的少妇被猛烈进入白浆91 | 一精品久久久 | 久久亚洲av成人无码国产最大 | 日本久久久久中文视频字幕 | 亚洲日韩av片在线观看 | 5哈第4季在线观看免费 | 在线播放一区 | 无码视频一区二区三区线观看 | 伦理久久 | 欧美精品第20页 | 好姑娘西瓜在线观看免费 | 欧美性猛交xxxx乱大交退制版 | 97久久精品国产一区二区三区 | 绯色aV无码一区二区人妻 | 国产精品久久久久久久嫩草影视 | 天天爽夜夜爽成人爽 | 脱了内裤猛烈进入A片费 | 欧美成人三区 | 亚洲国产一线二线三线 | 在线亚洲一区观看 | 干干人人 | 哺乳一区二区三区中文视频 | 黑人寡妇xxxⅹ黑人猛交 | 91久久久精品国产一区二区蜜臀 | 国产综合网址 | 精品无码久久久久久久久 | 久久丫精品系列 |