变异信息定位染色体

变异信息定位染色体

确定基因组染色体长度信息

在进行变异信息定位到染色体上之前,需要先有染色体的长度信息才能进行定位,可以使用 TBtools或者samtools faidx

之前先写过推文了 染色体长度计算

染色体长度计算

变异位点信息文件准备

首先使用的是VCFtools过滤后的结果文件,其中包含变异存在的 染色体、位点及突变类型信息

变异信息结果文件

操作流程是: 服务器下截取结果文件中染色体标记以及位置信息生成txt格式的文件之后,放出来用Rstudio中使用RIdeogram实现定位到染色体上

1. 截取变异位点信息

因为使用 VCFtools 进行过滤之后的结果文件中包含的全部信息不能直接用于定位,所以需要截取 染色体及位点信息即可

cat XXX.tped | tr ":" "\t" | cut -f 2,4,5 >> XXX.txt
#tr ":" "\t"  将染色体位置信息后的:转换为tab
#cut -f 2,4,5 >> XXX.txt  截取需要的信息生成txt文件
截取需要的信息

2. 将文件传输到本地电脑

我用的连接服务器的软件是 Xshell ,所以用来的传输文件的是配套的 Xftp

简单的窗口拖动文件即可

传输文件

变异信息定位染色体

用到的R包是** RIdeogram **

(之前找教程的时候发现 TBtools 也是可以实现染色体定位的,但是我失败了,教程: TBtools | 全基因组特征标记可视化 - 太简单

1. 下载安装RIdeogram

install.packages('RIdeogram')
library(RIdeogram) 

2.加载需要的示例数据

data("human_karyotype",package = "RIdeogram")
data("gene_density",package = "RIdeogram")

3. 导入自己的数据

导入染色体长度文件

#读取染色体长度文件
XXX_karyotype <- read.table("XXX_Chr_len.txt",sep = "\t",header = T,stringsAsFactors = F)
#使用软件提供的示例数据进行格式整理
data <- human_karyotype[,1:3]
data <- data[1:16,]
data$Chr <- XXX_karyotype$Chr
data$End <- XXX_karyotype$End

导入变异位点信息文件

#导入变异位点信息文件
XXX_density <- read.table("XXX.txt",sep = "\t",header = T,stringsAsFactors = F)
#使用示例数据进行列名更替