文章简介
文章题目 | Analysis of Bulk RNA Sequencing Data Reveals Novel Transcription Factors Associated With Immune Infiltration Among Multiple Cancers |
中文题目 | 大规模RNA-seq数据分析揭示与多种癌症免疫浸润相关的转录因子 |
期刊名 | Frontiers in Immunology IF: 7.561 |
作者 | Lei Liu1† , Qiuchen Zhao2,3† , Chao Cheng2 , Jingwen Yi 4 , Hongyan Sun5 , Qi Wang2, Weili Quan2 , Yaqiang Xue2 , Luguo Sun1,4*, Xianling Cong5* and Yi Zhang2* |
发表时间 | 2021 |
实验材料 | 肿瘤组织RNA-seq数据 |
测序平台 | Illumina Nextseq 500 |
相关产品 | RNA-seq,大数据分析挖掘 |
研究背景
癌症免疫治疗是指使用药物缓解肿瘤微环境的免疫抑制或增强免疫系统而消除癌细胞的治疗方式;癌症免疫为多种肿瘤的晚期癌症患者带来巨大持久的临床益处。一些转录因子(TFs)被报道在各种实体瘤中抑制肿瘤免疫反应。也有一些TFs能够激发免疫细胞以增强其免疫反应。也有研究报道TFs可以控制关键基因的表达,从而在控制免疫细胞的浸润和功能方面发挥重要作用,但仍缺乏TFs与泛癌免疫浸润之间的关系的系统研究。
因此,作者对包含9种不同癌症的50对RNA-seq数据进行了与免疫浸润相关的差异表达基因模块以及免疫相关基因表达网络 (TF-iGENs)的分析,即分析TCGA 数据中参与同一 TF-iGEN相关基因的表达的生存关系,TF-iGEN 网络与免疫浸润之间的联系以及eQTL分析等,从而提出一种识别调节免疫浸润的 TFs 的方法,并且为多种癌症提供了新的潜在预后指标和可能的治疗靶点。
研究内容和方法
作者首先对来自9种不同实体肿瘤的癌组织和癌旁组织共50对样本的RNA-seq数据进行分析,主要分析与免疫浸润相关差异表达基因的模块,获得相关的候选基因;在此基础上,作者下载了TCGA数据库中33个癌症类型的数据对上述候选基因的表达进行进一步验证。本研究使用CIBERSORT和EPIC算法对从50对来自9种不同癌症患者获得的RNA-seq测序数据进行分析,比较了肿瘤样本中浸润的不同免疫细胞的比例变化。通过加权基因共表达网络分析(WGCNA)确定了与肿瘤发生和CD4+记忆T细胞、树突状细胞和巨噬细胞激活密切相关的特征基因模块。基于这些基因模块,作者又构建了TF基因FOXM1、MYBL2、TAL1和ERG与免疫相关基因的调控网络。对TCGA癌症数据的分析证实了这些发现,且进一步证明,这些调节免疫浸润的潜在TF基因以及被其调节的免疫相关基因的表达与多种癌症患者的生存相关。此外,作者还使用Exome-seq数据,进一步分析了基因的表达与数量性状基因座(eQTL),通过eQTL分析发现与非TF基因相比,TF基因侧翼区域的突变频率更高。
该研究为识别调节肿瘤免疫浸润的TF基因提供了一种实用有效的方法。并且这些免疫浸润相关基因可能是癌症预后的潜在生物标志物和可能的治疗靶点。
研究成果
1. 使用加权基因共表达(WGCNA)分析获得了与肿瘤特异免疫细胞比例相关的特征基因模块
肿瘤浸润性免疫细胞可形成肿瘤微环境,且与免疫治疗密切相关。本研究作者使用CIBERSORT算法,分析了50对9种不同实体肿瘤包括CSCC、ESCC、GAC、HCC、LUAD、LUSC、PTC、SCLC和SRCC患者组织RNA-seq数据,分析了其中21个免疫细胞亚群的比例在癌与癌旁组织间的变化。发现:泛癌组织中调节性T细胞(Treg)、M0巨噬细胞、T滤泡辅助细胞、M1巨噬细胞、记忆性CD4活化T细胞和树突状细胞的比例显著高于邻近正常组织(p<0.05),从而表明它们在肿瘤发生过程中的浸润。相反,记忆性CD4静止T细胞和CD8 T细胞的比例显著降低(p<0.05)(图1A)。
接着,作者使用WGCNA分析,系统鉴定了肿瘤和免疫细胞类型比例相关的基因共表达模块。作者分析了MEyellow、MEwhite、MEblue、MEmediumpurple3和MEdarkred模块的基因表达特征以及这些模块的表达与特定免疫细胞类型的浸润相关(图1C-F)。
分析结果表明:一些基因共表达网络与特定免疫细胞类型的比例密切相关,有利于肿瘤微环境中特定免疫细胞群的发展。
2. MEyellow和MEblue模块中TF-iGEN的构建
由于转录因子(TFs)可以控制一些关键基因的表达,从而在控制免疫细胞的浸润和功能方面发挥重要作用。作者决定重点分析以上MEyellow和MEblue模块中的关键调节的TFs,以及TFs与肿瘤浸润性免疫细胞动力学的相关性。
TFs在MEyellow和MEblue模块中与免疫相关基因的表达网络(TF-iGENs)构建方法如下:首先筛选TF基因、LM22标记基因(CIBERSORT免疫细胞marker gene)和分析免疫相关基因的表达水平。然后,计算每个基因对的Spearman相关性。然后,根据算法筛选出TF-免疫基因对或TF-LM22基因对。使用Cytoscape构建TF-免疫相关基因表达网络,其中三角形代表TF,绿色代表免疫基因,红色代表LM22标记基因。(图2B)。
通过上述分析,作者发现在MEyellow模块中两个hub TF基因FOXM1和MYBL2与免疫相关基因显著相关,包括BIRC5、CACYBP、CDK4和HDGF(图2B)。另一个TF基因TP53与其他免疫相关基因略有关联(图2B)。而在MEblue模块中鉴定出两个hub TF,TAL1和ERG,它们与免疫相关基因显著相关,包括SLC11A1、EDN1、ICAM2、ICAM1、RARA、IFNGR1和ARRB1;TF基因RARA也参与免疫应答途径,与其他免疫相关基因有关联。与MEyellow模块不同,MEblue模块的TF -iGENs基因表达在相邻正常样本中的表达高于在肿瘤中的表达水平(图2F)。这些结果表明,来自这两个模块的TF-iGEN可能具有不同的功能。
3. TCGA数据库中验证TF-iGEN
为了进一步验证TF-iGEN的临床相关性,作者从TCGA数据库下载33种癌症类型的数据,分析了以上这些候选基因的表达,以进一步研究肿瘤中TF-iGEN的临床相关性(图3A-D)。
通过分析发现,70%(23/33)的癌症中,肿瘤中的FOXM1和MYBL2显著高于癌旁正常组织(图3A,B)。相比之下,与正常组织相比,TAL1在52%(17/33)的肿瘤中显著低表达(图3C),而ERG在33%(11/33)的肿瘤中显著低表达(图3D)。
作者发现TF-iGEN对癌症患者有较高的预后价值。对于来自MEyellow模块的TF- iGENs,其高表达意味着高风险。尤其是在ACC、KIRP、LGG、LIHC、LUAD、MESO、SARC和SKCM等癌症中,TF-iGENs中至少有五个基因对预后的影响是一致的(图3E)。而相反,对于来自MEblue模块的TF- iGENs,高表达则意味着低风险(图3F)。
该分析结果表明生存时间与这些基因的表达呈负相关,来自TF-iGENs的一些基因可以作为癌症患者预后分析的重要指标。
4. 与非TF基因相比,TF-iGENs中的TF基因表现出更频繁的顺式eQTL
在癌症中,经常发生TF的结合位点的体细胞突变,从而导致致癌基因激活。
为了进一步探讨TF-iGEN网络中基因的表达改变是否与体细胞突变有关,作者对50名患者中的24例配对样本进行外显子组测序。作者使用Matrix eQTL软件对外显子测序数据进行了eQTL分析,鉴定了TF-iGENs的每个基因的cis-eQTL的数量,用来评估关于基因表达的突变效应,包括TF基因。
作者发现:与非TF基因相比,TF基因侧翼区域的突变频率明显高于非TF基因区域(图5D)。这个发现暗示关键免疫基因相关TF中的体细胞突变可能引发肿瘤特异性免疫细胞浸润。
综上所述,作者通过对癌症大数据的分析,系统分析并鉴定了一些与多种癌症免疫浸润相关的转录因子。这些转录因子以及相关的免疫基因在多种癌症中表现出显著的预后意义。并且这些转录因子可能成为潜在的癌症免疫治疗靶标。本文提出的方法也为揭示肿瘤免疫相关biomarker的鉴定提供重要的基础和依据。