国产精品网红尤物福利在线观看_欧美经典一区二区_辽宁老熟女高潮狂叫视频_日日草日日干_成人免费观看毛片_久久激情免费视频

伯豪生物
TCGA and GEO 轉(zhuǎn)錄組數(shù)據(jù)挖掘超級干貨
發(fā)布時(shí)間:2020-09-29 瀏覽次數(shù):10131
伯豪生物鄧?yán)蠋熃o大家介紹一下對轉(zhuǎn)錄組TCGA & GEO的數(shù)據(jù)進(jìn)行分析,包括差異分析、富集分析、單基因展示以及其它個(gè)性化做圖。

信息時(shí)代就是好,沒有自己的數(shù)據(jù)咱可以從免費(fèi)的數(shù)據(jù)庫找數(shù)據(jù)呀!目前 TCGA 和 GEO 數(shù)據(jù)庫簡直就是專為科研人員準(zhǔn)備的免費(fèi)的寶庫。前面一直講的空間轉(zhuǎn)錄組,今天來穿插著講一節(jié) TCGA & GEO 數(shù)據(jù)分析換換口味吧。

今天主要給大家介紹一下對轉(zhuǎn)錄組 TCGA & GEO 的數(shù)據(jù)進(jìn)行分析,包括差異分析、富集分析、單基因展示以及其它個(gè)性化做圖。除了想利用公共數(shù)據(jù)庫挖掘轉(zhuǎn)錄組數(shù)據(jù)的發(fā)文章的同學(xué)之外,這篇教程其實(shí)特別適合自己做了少量轉(zhuǎn)錄組樣本又不想做后期驗(yàn)證,想直接用公共數(shù)據(jù)庫的數(shù)據(jù)來驗(yàn)證自己數(shù)據(jù)結(jié)果的朋友。

目前各種 TCGA & GEO  數(shù)據(jù)下載的教程太多了,所以今天直接省略這部分部分,直接從后面的分析開始。廢話不多說,直接上干貨!

一、準(zhǔn)備文件

基因表達(dá)矩陣文件,可以是 TCGA 下載的轉(zhuǎn)錄組數(shù)據(jù),也可以是 GEO 下載的轉(zhuǎn)錄組數(shù)據(jù),格式如下(行是基因,列是樣本):

1

樣本分組文件,格式如下(type 是分組):

2

二、差異分析

一般 TCGA 或 GEO 上大量樣本數(shù)據(jù)的差異分析 limma 用的比較多,所以這里也使用 limma 包來分析差異基因,注意需要先安裝 limma R 包。

安裝 limma 包:

if (!requireNamespace("BiocManager", quietly = TRUE))

    install.packages("BiocManager")

BiocManager::install("limma")

分析差異:

## 讀取基因表達(dá)件,取 log2

geneexp = read.table("gene_exp_BRCA.txt",header=T,row.names=1,sep="\t")

geneexp = log2(geneexp+1)

## 讀取分組文件

group_file = read.table("sample_group_BRCA.txt",header=T,row.names=1,sep="\t",as.is =TRUE)

rownames(group_file) = gsub('-','.',rownames(group_file))

geneexp = geneexp[,rownames(group_file)]

### 差異分組設(shè)置

samps<-factor(group_file$type)

design <- model.matrix(~0+samps) ;

colnames(design) <- levels(samps)

### 模型擬合

fit <- lmFit(geneexp, design)

cont.matrix<-makeContrasts(Basal-Normal,levels=design)

fit2 <- contrasts.fit(fit, cont.matrix)

fit2 <- eBayes(fit2)

final<-topTable(fit2, coef=1, number=dim(geneexp)[1], adjust.method="BH")

> head(final)

           logFC  AveExpr         t       P.Value     adj.P.Val        B

SDPR   -4.358861 2.679133 -46.10828 8.888505e-122 4.738017e-117 267.4862

TPX2    4.030685 3.807811  45.39822 2.571983e-120 6.854979e-116 264.1584

UBE2C   4.089727 3.270516  43.72542 8.428935e-117 1.497681e-112 256.1483

CDC20   3.971916 3.450304  42.85468 6.270780e-115 8.356598e-111 251.8811

FIGF   -3.220704 1.583802 -40.93757 1.053838e-110 1.123497e-106 242.2399

FAXDC2 -2.179867 1.637909 -39.05494 2.084335e-106 1.851758e-102 232.4283

三、繪制差異基因散點(diǎn)圖和火山圖

這一步需要用到 ggplot2 繪圖,沒有安裝的話需要先安裝 ggplot2 包。

# 繪制差異基因散點(diǎn)圖和火山圖

library(ggplot2)

g1 = "Normal"

g2 = "Basal"

g1_exp = geneexp[rownames(final),rownames(group_file)[which(group_file$type==g1)]]

g2_exp = geneexp[rownames(final),rownames(group_file)[which(group_file$type==g2)]]

g1_mean = apply(g1_exp,1,mean)

g2_mean = apply(g2_exp,1,mean)

type=rep('No',length(g1_mean))

type[which(final$logFC> 1 & final$adj.P.Val <0.05)] = "Up"

type[which(final$logFC < -1 & final$adj.P.Val < 0.05)] = "Down"

datam = data.frame(g1_mean,g2_mean,logFC=final$logFC,FDR=final$adj.P.Val,type,stringsAsFactors=FALSE)

## 散點(diǎn)圖

ggplot(datam,aes(g1_mean,g2_mean,colour=type))+

geom_point(stat="identity",size=1)+theme(legend.title=element_blank())+scale_color_manual(values =c("Down"='blue',"No"='grey',"Up"='orange'))+

    labs(x=paste(g1,'Log2(FPKM+1)'),y=paste(g2,'Log2(FPKM+1)'),title=paste(g2,'VS',g1,sep=""))+

    coord_cartesian(ylim=c(0,10),xlim=c(0,10))+geom_segment(aes(x = 0, y = 0, xend = 10, yend = 10),size=1,colour="#999999",linetype="dotted")+theme(plot.title = element_text(hjust = 0.5),title=element_text(face="bold",size=15,colour="black"),axis.title=element_text(face="bold",size=13,colour="black"),axis.text.x=element_text(face="bold",size=12,colour="black"),axis.text.y=element_text(face="bold",size=12,colour="black"),legend.text=element_text(face="bold",size=13,colour="black"))

散點(diǎn)圖結(jié)果如下:

3

## 繪制火山圖

ggplot(datam,aes(logFC,-log10(FDR),colour=type))+

            geom_point(stat="identity",size=1.2)+theme(legend.title=element_blank())+scale_color_manual(values =c("Down"='blue',"No"='grey',"Up"='orange'))+

            labs(x="Log2 (FC)",y="-Lg10 (FDR)",title=paste(g2,'VS',g1,sep=""))+coord_cartesian(xlim=c(-5,5))+

            geom_hline(aes(yintercept=1.3),colour="white",size=1.1)+

            geom_vline(aes(xintercept =-1),colour="white",size=1.1)+geom_vline(aes(xintercept =1),colour="white",size=1.1)+

            theme(axis.title.y = element_text(vjust=-0.1),axis.title.x = element_text(vjust=-0.6),title = element_text(vjust=0.8))+theme(plot.title = element_text(hjust = 0.5),title=element_text(face="bold",size=15,colour="black"),axis.title=element_text(face="bold",size=13,colour="black"),axis.text.x=element_text(face="bold",size=10,colour="black"),axis.text.y=element_text(face="bold",size=10,colour="black"),legend.text=element_text(face="bold",size=12,colour="black"))

火山圖結(jié)果如下:  

4     

四、差異基因富集分析

這里我們介紹一下怎么用  clusterProfiler R 包來做差異基因富集分析。需要先安裝好 clusterProfiler,org.Hs.eg.db 兩個(gè) R 包。

if (!requireNamespace("BiocManager", quietly = TRUE))

    install.packages("BiocManager")

BiocManager::install("clusterProfiler")

BiocManager::install("org.Hs.eg.db")

GO 富集分析

library(clusterProfiler)

library(org.Hs.eg.db)

### 提取差異基因 list

diffgenes <- final[(final[,"adj.P.Val"]<0.05 & abs(final[,"logFC"])>=1),]

genelist <- diffgenes[,"logFC"]

names(genelist) = rownames(diffgenes)

##id 轉(zhuǎn)換,將 SYMBOL 轉(zhuǎn)換成 ENTREZID

gene = bitr(rownames(diffgenes), fromType = "SYMBOL", toType = "ENTREZID", OrgDb = "org.Hs.eg.db")

#####################GO 富集

ego <- enrichGO(

    gene  = gene$ENTREZID,

    keyType = "ENTREZID", 

    OrgDb   = "org.Hs.eg.db",

    ont     = "ALL",

    pAdjustMethod = "BH",

    pvalueCutoff  = 0.05,

    qvalueCutoff  = 0.05,

    readable      = TRUE)

# 再用 setReadable 函數(shù)將基因 ID 映射到基因 Symbol

ego2 <- setReadable(ego, OrgDb = "org.Hs.eg.db", 'ENTREZID')

繪制柱狀圖:

barplot(ego2,showCategory = 20)

5

繪制氣泡圖:

dotplot(ego2, showCategory = 20)

6

繪制網(wǎng)絡(luò)圖 1:

cnetplot(ego2, showCategory = 3,foldChange=genelist, circular = TRUE, colorEdge = TRUE)

7

繪制網(wǎng)絡(luò)圖 2:

emapplot(ego2, foldChange=genelist, showCategory = 20)

8

KEGG 富集分析

注意這一步需要連接網(wǎng)絡(luò),因?yàn)?clusterProfiler 是在線抓取新的 pathway 數(shù)據(jù)庫的。當(dāng)然也有用 kegg.db R 包直接內(nèi)置數(shù)據(jù)庫的情況,這里不做介紹。

######################KEGG 富集

kegg <- enrichKEGG(

    gene = gene$ENTREZID,

    keyType   = "kegg",

    organism  = 'hsa',

    pvalueCutoff  = 1,

    pAdjustMethod  = "BH",

    qvalueCutoff  = 1,

    use_internal_data = FALSE)

kegg2 <- setReadable(kegg, OrgDb = "org.Hs.eg.db", 'ENTREZID')

繪制柱狀圖:

barplot(kegg2,showCategory = 20)

9

繪制氣泡圖:

dotplot(kegg2, showCategory = 20)

10

繪制網(wǎng)絡(luò)圖 1:

cnetplot(kegg2, showCategory = 10,foldChange=genelist, circular = TRUE, colorEdge = TRUE)

11

繪制網(wǎng)絡(luò)圖 2:

emapplot(kegg2, foldChange=genelist, showCategory = 20)

12


五、差異基因熱圖標(biāo)記基因

當(dāng)我們已經(jīng)用自己的數(shù)據(jù)做過分析得到了差異基因,或者是已經(jīng)有自己關(guān)注的基因,想用  TCGA & GEO 數(shù)據(jù)來驗(yàn)證自己的數(shù)據(jù)或結(jié)論的時(shí)候,用 TCGA & GEO 數(shù)據(jù)差異基因熱圖同時(shí)標(biāo)記特定基因來展示結(jié)果就特別合適。

###### 差異基因熱圖標(biāo)記關(guān)注基因

library("ComplexHeatmap")

library("circlize")

diff_exp = geneexp[rownames(diffgenes),]

# 進(jìn)行 zscore 歸一化

diff_exp_scaled = t(apply(diff_exp, 1, scale)) 

colnames(diff_exp_scaled) = colnames(diff_exp)

# 需要標(biāo)記的基因

genes = c('CDC20','THRB','FAM13A','CCNA2','PRR15','CHI3L1','CLCA2','ABCA10','A2ML1','LCN2')

## 設(shè)置位置

gene_pos = which(rownames(diff_exp) %in% genes)

ha = rowAnnotation(foo = anno_mark(at = gene_pos, labels = genes))

m=round(max(abs(diff_exp_scaled)))

## 畫熱圖

Heatmap(diff_exp_scaled, colorRamp2(c(-m,0,m),c("blue", "#EEEEEE", "red")),

right_annotation = ha,name = "Z-score",show_row_names =FALSE,show_column_names =FALSE)

繪圖結(jié)果如下:

13

六、單個(gè)基因繪圖

要在 TCGA & GEO 數(shù)據(jù)中驗(yàn)證自己的關(guān)注的基因的差異情況,除了前面說的差異基因熱圖標(biāo)記特定基因之外,也可以對單個(gè)基因直接進(jìn)行繪圖。這里我們提供三種展示方式,選擇自己喜歡的一種展示形式就行。

用箱線圖展示:

## 單個(gè)基因箱線圖

exp2 = data.frame(t(diff_exp))

exp2$type = group_file$type

ggplot(exp2, aes(x=type, y=CDC20,fill=type)) + 

    geom_boxplot()+geom_jitter(alpha = .3, width =0.2,size=1)+labs(title = "") + ylab("log2 (FPKM)")+ xlab("")+theme_bw()+

  theme(title=element_text(face="bold",size=16),axis.title=element_text(face="bold",size=15),axis.text.x=element_text(face="bold",angle=80,size=13,hjust=1),

  axis.text.y=element_text(face="bold",size=12),legend.text=element_text(face="bold",size=13),legend.title=element_text(face="bold",size=13))

結(jié)果如下:

   14

小提琴圖展示:

### 單個(gè)基因小提琴圖

ggplot(exp2, aes(x=type, y=CDC20,fill=type)) + 

    geom_violin(alpha=0.5) + geom_boxplot(alpha = .5,fill="white", width= .2)+labs(title = "") + ylab("log2 (FPKM)")+ xlab("")+theme_bw()+

  theme(title=element_text(face="bold",size=16),axis.title=element_text(face="bold",size=15),axis.text.x=element_text(face="bold",angle=80,size=13,hjust=1),

  axis.text.y=element_text(face="bold",size=12),legend.text=element_text(face="bold",size=13),legend.title=element_text(face="bold",size=13))

結(jié)果如下:

15

散點(diǎn)圖展示:

### 單個(gè)基因散點(diǎn)圖   

ggplot(exp2, aes(x=type, y=CDC20)) +

  geom_dotplot(binaxis='y', stackdir='center',binwidth = 0.1)+stat_summary(fun.y=median, geom="point", shape=18,size=3, color="red")+

  theme(axis.title=element_text(face="bold",size=15),axis.text.x=element_text(face="bold",angle=80,size=13,hjust=1),axis.text.y=element_text(face="bold",size=12))

結(jié)果如下:

16

這里只展示一個(gè)基因的情況,如果是有多個(gè)基因需要繪圖的,把代碼里的基因名替換一下就好了。

好啦,今天的分享就到次為止啦,下次再繼續(xù)哦!

更多伯豪生物人工服務(wù):

伯豪學(xué)院單細(xì)胞測序服務(wù)人工客服


在線客服
登錄/注冊
在線留言
返回頂部
主站蜘蛛池模板: 樱花草无码专区日本_2021年亚洲精品无码久_特级精品毛片免费观看_日本人又黄又爽又大又色_天天干天天日_天天操天天操 | 蜜桃视频免费在线观看_精品久久久久久免费人妻_西出玉门在线观看_国产a一片_免费观看Aⅴ成人片_久久人体rtys | 久久久久亚洲AV成人片乱码_成人无码区免费a片视频_中国熟女仑乱hd_亚洲a一级视频_古装A级野外爱做片视频_办公室娇喘的短裙老师 | 国产成人精品久久久_欧洲无线一线二线三线区别大吗_欧美综合天天夜夜久久_亚洲乱码国产乱码精品天美传媒_国产精品久久亚洲不卡_深夜久久久 | 成人免费av_野花社区在线视频最新_高清在线一区二区_图片区小说区欧洲区_一区二区三区在线视频观看_久久国产高潮流白浆免费观看 | 少妇伦子伦情品无吗_黄色网一区_国产情侣作爱视频免费观看_1204人成网站色www_蜜臀一区二区三区_国产人妻人伦精品潘金莲 | 国产日韩AV无码免费一区二区_国产欧美日韩一级_a级特黄的片子_成人午夜av_日韩A片中文字幕视频免费_国产免费一区 | 国产91爱_1000部毛片A片免费观看_亚洲情趣视频_欧美另类videosbestsex日本_国产AV无码专区亚洲AV手机_国产成人在线视频播放 | 亚洲不卡视频一区二区_精品一区在线视频_久久久www免费人成人片_国产亚洲成av人在线观看导航_日韩中文字幕精品视频_jazzjazz国产精品 | 欧美黑人xxxx性高清版_113美女写真午夜一级观看_国产欧美日韩在线_国产黄色小视频_国产精品久久久久久人_欧美暴力捆绑xxxxhd | 中文字幕人妻第一区_亚洲日韩精品无码专区网址_av在线中文_免费99精品国产自在现线_强姧伦久久久久久久久_自拍视频网站 | 国产亚洲综合网_亚洲精品久久久蜜臀av站长工具_国产一级片儿_久久综合热88_人成午夜_日本特级黄 日韩精品视频在线一区_中国老熟女重囗味HDXX_日韩人妻高清精品专区_在线中文天堂_最近2018中文字幕视频免费看_午夜精品久久久久久99热明星 | 亚洲av毛片一区二二区三三区_91传媒91久久久_一本一道久久a久久综合精品图_无码国模大尺度视频在线观看_亚洲精品无码中文久久字幕_久草在线国产视频 | 亚洲一区二区免费在线观看_十八岁污网站在线观看_国产精品无码首页自拍_国产福利视频一区二区_91视频中文_玖玖玖精品 | 人妻熟妇乱又伦精品HD_国产一区二区三区久久久_国产XXXX视频在线_白丝女仆裸体被强趴内裤啪啪_日本一区二区影院_精品在线手机视频 | 精品久久二区_免费女上男下xx00xx00视频_日韩精品无码中文字幕一区二区_在线成人免费观看_国内伊人久久久久久网站视频_a级毛片三个男人一女 | 亚洲国产精品一区二区第四页av_亚洲国产激情_av今日在线_成人三级视频在线观看一区二区_最近韩国日本免费观看mv百度_av蜜桃在线 | 国产精品真人片久久久久久久_国产免费av片在线看vr_精品日韩三级_精品999日本_性猛交ⅹxxx富婆视频_亚洲欧美在线综合色影视 | 国产不卡一卡二新区_国产成人午夜福利在线播放_日本日本精品二区免费_日韩成人无码中文字幕_青青草原一区二区_中文亚洲av片不卡在线观看 | 一二三四免费观看在线视频中文版_大学生高潮无套内谢视频_亚洲午夜精品久久久久久久久_小14萝裸体洗澡视频免费网站_夜夜夜高潮夜夜爽夜夜爰爰_2024最新黄色网址 | 欧美精品3_国产视频不卡_亚洲春色αV无码专区在线播放_欧美久久久久久久久久_色在线亚洲视频www_日韩精品一区二区亚洲A∨观看 | 卡一卡二卡三精品_一区精品久久_狠狠色噜噜狠狠狠狠色综合久_视频1区_欧美成人官网二区_亚洲成熟女人毛毛耸耸多 | 国产美女视频网站免费_操出白浆av_日本饥渴人妻欲求不满_亚洲欧美日韩在线免费观看_日日大香人伊一本线久_中文字幕乱码免费视频 | 视频在线观看视频_欧美一区二区免费观在线_日本一级作爱片_国产精品va尤物在观看2021_校花高潮抽搐冒白浆视频_波多一区 | 丰满少妇裸体免费视频_国产不卡在线观看视频_精品社区_99久久精品费精品国产一区二区_在线观看av你懂的_午夜琪琪网 | 成年女人免费v片_国产精品免费高清_日本高清一区二区三区四区_第一福利社区1024_中国黄色软件_国产视频久久久 | 美女疯狂连续喷潮视频_亚洲日产精品_av性色在线观看_亚色精品_日韩黄色录像_在线观看亚洲专区 | 黄色一级播放_久久91精品国产91久久小草_美女黄网站免费福利视频_欧美亚洲综合网_久久人与动人物a级毛片_欧美视频网站在线观看 | 欧美一区二区在线观看_美女久久久久久久久久久_激情欧美日韩一区二区_亚洲国产精品网站_曰本人一级毛片免费完整视频_男人久久天堂 | 国产白丝无码视频在线观看_久久久免费视频观看_国产成人小视频在线_999免费视频_国产精品久久久久久久久久精爆_欧美日韩国产综合网 | 99精品视频在线观看免费_少妇无码太爽了在线播放_XXX欧美性兽交_99久久国产精_白嫩少妇激情无码_乱人伦中文字幕成人网站在线 | 末成年女A∨片一区二区_黄色一级视频播放_区一区二视频_亚洲国产精品专区_欧美精选一区_69av视频 | 日本免费看视频_69pao强力打造_亚洲AV伊人久久综合密臀性色_国产真实伦在线观看_国产综合精品一区_强行扒开女同学腿看屁股眼 | 97超碰人人做人人爽3d_黄色片免费看._免费观看日韩毛片_中文字幕在线观看视频网站_亚洲精品久久五月天堂_亚洲色偷偷综合亚洲AV伊人 | 免费人妻无码不卡中文字幕系_性日本xxxx_亚洲人精品亚洲人成在线_欧美性猛交xxxx乱大交少妇_狠狠色婷婷j丁香综合社区_久久无码潮喷无码高潮 | 亚洲第一网站在线观看_任你操在线观看_免费黄在线_久草色站_18禁美女裸体无遮挡网站_亚洲高清在线免费 成人福利视频在线观看_欧美黑人性生活视频_一边添奶一边添P好爽视频_亚洲看片lutube在线入口_操操操综合_jvid在线观看 | 中文字幕一区二区三区乱码_天天干b_538国产精品一区二区_中文字幕丁香五月天_中国美女av_大地资源免费第二页 | 久草久草久草久草_亚洲日韩国产一本视频_蜜桃一级网站._中文字幕av一区二区三区佐山爱_成A∨人片在线观看无码_美女在线一区二区 欧美日韩亚洲国产_久久99精品久久久久婷婷暖91_av青青_国产精品看高国产精品不卡_国产青青在线视频_亚洲av永久无码天堂网 | 人人干人人爱人人爱_国产二区三区视频_欧美精品一区二区黄A片_日韩国产在线_色偷偷色噜噜狠狠成人免费视频_51福利国产在线观看午夜天堂 | 最近国产精品视频_永久黄色网_作爱视频免费观看_gg在线精品视频_9色在线_99国产精品欧美一区二区三区 | 欧美极品视频一区二区三区_a级黄色影视_肉大捧一进一出免费视频_亚洲图片视频_伊人嫩草久久欧美站_亚洲AV成人片无码网站网 |