1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 【论著】基于生物信息学筛选炎症相关结直肠癌基因及其特征分析

【论著】基于生物信息学筛选炎症相关结直肠癌基因及其特征分析

时间:2020-12-06 20:20:47

相关推荐

【论著】基于生物信息学筛选炎症相关结直肠癌基因及其特征分析

点击标题下「蓝色微信名」可快速关注

引用本文:刘欣然, 康悦, 于守江, 等. 基于生物信息学筛选炎症相关结直肠癌基因及其特征分析 [J/CD] . 中华结直肠疾病电子杂志,,9 (3): 245-253. DOI: 10.3877/cma.j.issn.2095-3224..03.007

摘要

目的

通过对炎症性肠病差异基因的筛选以及结直肠癌队列生存特征和表达模式的探究,为炎症相关结直肠癌的发生与发展的后续研究提供候选基因。

方法

从GEO数据库中选择RNA测序表达谱数据集GSE95473和GSE107597,通过常规转录组表达谱差异分析,筛选出炎症性肠病差异表达基因(DEG),利用GO数据库获取DEG的功能注释,并利用KEGG数据库进行通路富集分析。同时基于TCGA数据库进一步在结直肠癌数据集中筛选具有预后意义的基因,并评价其在结直肠肿瘤中的表达特征。

结果

两个数据集筛选到了共有DEGs 100个,通过主成分分析证实这些基因能够对结直肠癌肿瘤和黏膜区分良好。进一步筛选,获得ALDOB,SPINK4,REG4,IL1B,C2CD4A,CXCL8,NOS2,CXCL3等候选基因。这些基因在结直肠肿瘤中高表达,并且这些基因的高表达往往提示患者预后较好。

结论

ALDOB,SPINK4,REG4,IL1B,C2CD4A,CXCL8,NOS2,CXCL3可能在炎症相关结直肠癌的发生发展中发挥重要作用,有待于后续炎癌转化相关功能验证和机制探究。

结直肠癌作为最常见的消化道恶性肿瘤之一,严重影响着公众健康[1]。结直肠癌的发病机制一直是肿瘤研究领域的重点问题,而其中炎癌转化作为癌变潜在的原因越来越多地受到研究者关注[2,3]。炎症和肿瘤之间存在千丝万缕的联系,既往研究已经证实炎症性肠病患者患结直肠癌的风险明显增加[4,5],而口服非甾体抗炎药能够降低肠道肿瘤的发生率及炎症性肠病癌变的风险,一定程度上验证了炎癌转化这一机制的存在[6,7]。但是由于炎症性肠病发生癌变的过程较为隐匿且时间较长,也对这一过程的研究增加了一定难度[8]。

近年来,随着大数据和多组学技术的发展,生物信息学在疾病发生与发展机制探究和疾病诊断和分型的应用中越来越广泛[9]。包括表达谱芯片和转录组测序在内的技术方法能够通过基因差异表达的筛选,确定不同病理状态下的转录差异,找出全新生物标志物,从而更好地探究和理解疾病的发生发展机制,并进一步用于临床的诊断及治疗。与此同时,GEO,TCGA等数据库将不同中心的数据进行汇总储存,并且作为开源数据为研究者提供下载服务,成为当今生物科学,尤其是为肿瘤领域的研究开启全新的格局。

本研究结合GEO和TCGA两个公共数据库,从生物信息学角度着手获得炎症性肠病相关的差异基因,然后结合结直肠癌表达谱和生存数据,筛选炎症性肠癌相关的候选基因,为后续炎癌转化机制和炎症性肠癌预防及治疗提供研究基础和出发点。

资料与方法

一、在GEO数据库中筛选炎症性肠病相关基因

在GEO中筛选炎症性肠病表达谱数据,经过全面筛选获取RNA-seq数据集GSE95473和GSE107597。前者数据集中包含25例溃疡型结肠炎(活动期)病灶标本,20例克隆恩病(活动期)病灶标本,还有29例健康对照组正常肠黏膜标本。后者则包括24例溃疡型结肠炎的炎症病灶和配对的非炎性的黏膜。在确定了候选数据集后,则进行下一步差异基因筛选,利用BioJupies分别对两个数据集中的病灶和肠黏膜的数据进行处理。通过使用limma R包比较对照组和实验组之间的基因表达水平来产生基因表达特征(表1)。

通过基于R语言limma包中的DESeq2法进行差异基因表达分析,对炎性病灶和正常黏膜样品之间的差异表达基因(differentially expressed genes,DEGs)进行分析筛选。DEGs的阈值设定为P<0.01和|logfoldchange|>2。

二、功能富集分析

通过基因本体论(gene ontology,GO)富集分析可以利用这些信息来识别生物过程,分子功能和细胞成分。通过从基因表达特征中分别提取具有最高和最低值的500个基因来产生上调和下调的基因组。使用Benjamini-Hochberg校正后,P<0.1作为截止值。同时,生物学通路是细胞学行为中起关键作用的生物化合物之间相互作用序列。包括KEGG在内的数据库包含了这些基因和通路的大量关联信息,使用Benjamini-Hochberg校正后,P<0.1作为截止值。

三、通过TCGA进一步筛选结直肠癌预后相关基因及数据库内验证

在TCGA数据库中查找与结直肠癌预后相关的基因,筛选出的差异表达基因谱进行取交集,筛选出结直肠癌预后相关的基因。与此同时,利用GEPIA的工具(http://gepia.cancer-/index.html)分析来自TCGA项目的RNA测序表达数据,用于本研究中的批量TCGA数据处理。差异分析的方法采用单向ANOVA,使用疾病状态(肿瘤或正常)作为计算差异表达的变量。

四、统计学分析

采用SPSS 20.0统计软件对数据进行处理。计量资料采用均值±标准差表示,计数资料采用频率和百分比表示。采用独立样本t检验和单向ANOVA评估连续变量的统计学显着性,通过Tukey检验进行多重比较。通过卡方检验或Fisher精确检验来分析等级资料之间的差异。采用Kaplan-Meier方法绘制存活曲线,并使用log-rank检验方法比较不同分组的结直肠癌患者总生存期。P<0.05被认为差异具有统计学意义。

结果

一、GEO数据库中炎症性肠病相关基因筛选结果

我们在GEO中筛选炎症性肠病表达谱数据,经过全面筛选获取RNA-seq数据集GSE95473和GSE107597。前者数据集中包含25例溃疡型结肠炎(活动期)病灶标本,20例克隆恩病(活动期)病灶标本,还有29例健康对照组正常肠黏膜标本。后者则包括24例溃疡型结肠炎的炎症病灶和配对的非炎性的黏膜。

采用将P<0.01和|logfoldchange|>2作为阈值,其中GSE95473中通过比较炎症性肠病病灶和正常对照组肠黏膜进行差异表法分析,获得114个DEGs,同样地通过比较GSE107597中炎症病灶和非炎症黏膜,筛选到了709个DEGs。两个数据集筛选到的DEGs按照|logFoldChange|由大到小的顺序进行排列,前30的基因展示在表2和表3中。

二、炎症性肠病相关差异表达基因的功能富集分析

将上述两个数据集筛选出的基因取交集,获得100个DEGs。为了进一步探索其肿瘤生物学行为,我们对其进行了功能富集分析。100个DEGs按照GO细胞组分、分子功能和生物学过程进行注释。并富集到包括KEGG在内信号通路中。结果证实,在细胞组分上与颗粒腔、囊泡腔以及各种颗粒有关。在这分子功能上,与趋化因子受体结合、趋化因子的激活以及各种金属离子的结合有关。在生物过程中,则与炎性反应、粒细胞调控、中性粒细胞介导的免疫反应和趋化因子介导的一系列信号通路有关。在信号通路上与IL-17信号通路,趋化因子-趋化因子受体相互作用、趋化因子信号通路等关系密切,见图1。

图1GO富集和KEGG通路富集分析结果。该图包含交互式条形图,显示使用Enrichr生成的GO富集分析和KEGG信号通路的结果。条形图的长度表示每个条目的富集分数

三、通过TCGA筛选出提示结直肠癌预后不良的基因

为了建立炎症性肠病和结直肠癌之间的关联,我们将从上述两个炎症性肠病数据集筛选到的100个DEGs在TCGA肿瘤数据库中进行验证。基于上述差异基因在TCGA数据库中对结肠肿瘤及正常黏膜、直肠肿瘤及正常黏膜表达谱数据进行主成分分析。从结果可以看出,数据结果能够被明显聚成两类,肿瘤跟正常组织能够明显区分,进而提示这100个DEGs跟结直肠癌的表达特征存在内部关联,见图2。

图2主成分析结果。基于两个队列重合的100个差异基因在TCGA数据库中对结肠肿瘤及正常黏膜、直肠肿瘤及正常黏膜表达谱数据进行主成分分析。2A:是降维过程中每一个主成分中的比例。2B和2C:显示了结直肠癌病灶及正常黏膜测序数据的散点图(二维和三维)。每个点代表RNA-seq样品。具有相似基因表达谱的样品在三维空间中更接近

与此同时,为了进一步探究上述基因跟肿瘤预后的关系,我们筛选结直肠癌数据(COAD+READ)中总生存率LogrankP<0.05的差异表达基因,共获得10个。分别为AQP8,ALDOB,SPINK4,REG4,IL1B,C2CD4A,TNIP3,CXCL8,NOS2,CXCL3,见图3。

图3基于TCGA数据集候选基因在结直肠癌中的预后意义。根据TCGA的数据,候选基因的表达情况对结直肠癌的总生存期的影响,采用对数秩检验进行计算

四、在TCGA数据库中探索候选基因在结直肠癌中的表达模式

为了进一步研究上述基因在结直肠癌中的表达模式,我们在TCGA数据库中进一步探究其表达。结果显示AQP8在结肠癌数据集中表达下降,TNIP3在结肠和直肠两个数据集中肿瘤灶与正常黏膜之间的表达差异无统计学意义,而其他8个基因和正常黏膜相比肿瘤中的表达明显升高,差异有统计学意义,见图4。

图4基于TCGA数据集候选基因在结直肠癌中的表达模式。结直肠癌原发灶和正常黏膜中的候选基因的表达情况,肿瘤灶用红色表示,正常组织用绿色表示,*表示P<0.05

讨论

随着组学技术的应用和发展,有学者根据结直肠癌的病理特征和特征性表达谱将其分为杯状细胞型、肠上皮细胞型、干细胞型、炎症型和转化放大型[10]。同时发现其中的炎症型肠癌患者对放疗相对敏感,并且可以通过口服阿司匹林等抗炎治疗能够达到预防肠癌发生的目的[11]。炎症性肠病作为结直肠癌发生的高危因素,慢性炎症肠病患结直肠癌的风险明显高于普通人群[12]。与此同时,也有文献证实对于结直肠癌的影响不仅限于炎症性肠病,结直肠癌的发生发展与某些隐匿性炎症有关[13]。炎症性肠病相关结直肠癌的研究对于炎癌转化和炎症相关结直肠癌的发生与发展具有重要的价值[14]。

本研究首先在GEO数据库中找到两个炎症性肠病相关的RNA测序数据,通过常规的差异表达分析流程,获得了100个共有的DEGs。这些基因能够反映出炎症性肠病的表达特征,在此基础上我们提出假设,即这些基因中包含肠癌发生与发展过程相关的基因。为了验证这一想法,我们对TCGA中的结直肠癌的肿瘤病灶和正常黏膜中这100个基因进行主成分分析,从结果可以明显看出这些基因能够很好区分肿瘤和正常组织。此外,如果一个基因的表达能够影响肿瘤的预后,我们可以认为该基因在肿瘤的病理生理过程中发挥一定的作用,基于此点,本研究中利用TCGA数据库中生存相关的数据信息,在结直肠癌中筛选有预后意义的基因。同时,为了进一步了解这些基因在肿瘤和正常黏膜中表达情况,我们再一次在TCGA的数据集中进行验证,发现10个基因中有8个在结肠癌和直肠癌中的表达均显着升高,而另外两个基因AQP8和TNIP3则没有这个趋势,这可能跟这两种基因本身的表达量基线较低有关。这也从另一个角度说明通过预后来筛选肿瘤差异基因的科学性和可行性。

通过上述流程,我们最终获得了8个候选基因。在这些基因中,已有一部分已在多个研究中证实其介导炎症反应,并同时在结直肠癌发生发展甚至是远处转移过程中发挥重要作用,如IL1B,CXCL8,NOS2,CXCL3[15,16,17,18]。既往研究已经证明,IL-1β作为一个促炎因子,炎症性肠病活动期往往伴随高水平的IL-1β,与此同时IL-1β能够促进肿瘤侵袭,并且在多种消化道肿瘤的发生与进展中发挥作用[15,19,20,21]。同时在体外实验中证实IL-1β可以调节VEGF-α和COX-2的表达,参与肿瘤血管的形成[22,23]。已有文献证实CXCL8与结直肠癌关系密切,CXCL8能够诱导结肠癌上皮间质转化、同时抵抗失巢凋亡,促进肿瘤的侵袭、迁移,还可介导肿瘤细胞-免疫细胞之间的相互作用,负向调节机体免疫功能[16,24,25]。而诱导型一氧化氮合酶(nitric oxide synthase 2,NOS2)在结直肠癌中的表达有助于判断结直肠癌的恶性程度,并且抑制NOS2在结直肠癌中表达可以抑制肿瘤血管生成[26,27,28]。有另研究表明,CXCL3的表达水平在结直肠肿瘤组织中显着提高,并且具有潜在的诊断价值,CXCL3可能通过调控DNA修复,细胞凋亡及TP53的表达水平影响患者预后[18,29]。本研究还发现了ALDOB,SPINK4,REG4,C2CD4A等四个候选基因,这些基因既往关于结直肠癌的炎癌转化相关研究较少,而本研究发现这些基因在结直肠肿瘤中高表达,并且这些基因的高表达往往提示患者预后较好。而这些相关转化机制和人群队列研究有待于后续进一步的探索和验证。

关于尚存在以下局限有待于后续研究,首先,本课题筛选到了8个候选基因,尤其有4个既往研究报道较少的基因,有进一步探索的价值。同时本研究假设的前提是由炎症性肠病发展而来的结直肠癌和散发性结直肠癌基因特征相近。因此在后续研究中我们会纳入炎症性肠病发展而来的结直肠癌的相关意义基因。其次,从当前筛选的方法来看,只能够说明这些基因跟炎症性肠病和结直肠癌的表达及预后有关,而具体这些基因是如何通过调节炎症反应,诱导肿瘤的发生与发展,最终影响患者预后的,仍有待于进一步机制探究和模型验证。第三,本研究应用公共数据来筛选和探究结直肠癌的表达模式,缺乏大样本的队列的验证和临床因素对于这些标志物表达水平相关性的研究;只是研究了炎症性肠病的差异表达基因,以及候选基因的表达模式和预后意义。此外,本研究发现一个有趣的结果,筛选出的生存相关的差异表达基因,高水平表达提示预后良好,可能由于这些基因在肿瘤癌变之后,发挥炎症反应的作用,抑制肿瘤细胞的恶性生物学行为,相对好的预后,这也是本研究发现的一个重要的结果,其生物学作用仍有待于进一步探索。

参考文献略

版权声明

本文为《中华结直肠疾病电子杂志》原创文章,版权归中华医学会所有。其他媒体、网站、公众号等如需转载本文,请联系本刊编辑部获得授权,并在文题下醒目位置注明“原文刊发于《中华结直肠疾病电子杂志》,年,卷(期):起止页码”。谢谢合作!

《中华结直肠疾病电子杂志》

一、刊物简介

《中华结直肠疾病电子杂志》是由中华人民共和国国家卫生健康委员会主管,中华医学会主办,中国国家癌症中心/中国医学科学院肿瘤医院承办,中华医学电子音像出版社有限责任公司出版的专业学术电子期刊。总编为中国医学科学院北京协和医学院肿瘤医院结直肠外科主任王锡山教授。杂志为中国科技核心期刊。

目前,《中华结直肠疾病电子杂志》是我国唯一的结直肠疾病专业学术期刊。重点刊登结直肠疾病及相关学科的主要研究成果和最新进展方面的文章,具有较高的学术权威性和一定的学术导向性。本刊面向国内外公开发行,中国批准刊号ISSN 2095-3224,CN 11-9324/R。目前已被《中国学术期刊网络出版总库》、《中文科技期刊数据库(全文版)》、《万方数据库》、《重庆维普数据库》收录。

本刊为双月刊,以DVD-ROM(光盘)+纸版的形式出版发行;图文声像并茂,具有很强的实用性,实现了传统纸质与电子媒体的结合,除具有传统纸质期刊的特性,在形式上又具有新的突破,体现在负载内容呈现的多样性,不仅可以传递文字信息和图形信息,还可以传递语音、视频,使期刊传播信息的功能达到新的高度。

二、品牌栏目

本刊栏目多样、内容丰富,设有:大家、指南与共识、述评、专家论坛、青年专家论坛、论着、综述、经验交流、病例报道、病例讨论、教训与反思、名家手术(视频)、护理天地、医学人文与管理、名院名科等。

其中,特色栏目“大家”展示行业榜样;“名院名科”宣传品牌团队;“医学人文与管理”从人文观念角度出发对各种医学现象,传达医学人文精神;“教训与反思”发挥“一人吃一堑,行业涨一智”的作用;“名家手术”展示国内外大家精彩手术视频;“病例讨论”呈现多学科团队的治疗方案。

本刊内容涵盖结直肠的肿瘤、炎症性疾病、痔、便秘、肠内外营养等相关领域的基础与临床、诊断与治疗全方面内容。

本刊、、被“中国学术期刊影响因子年报”收录为统计源期刊。

本刊自起连续四年被“中国科技核心期刊”收录,版《中国科技期刊引证报告(扩展版)》显示,《中华结直肠疾病电子杂志》度扩展影响因子为1.190;度核心影响因子0.679(学科排名第14位)。

投稿请登录中华结直肠疾病电子杂志投稿系统:

/

↓↓↓ 点击"阅读原文" ,查看更多信息

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。