GEO数据怎么发掘?事例解析!

   刊发时间:2021-09-09 17:57:25   来源:火狐体育官方投注 作者:火狐体育注册网址

  它创建于2000年,收录了世界各国研究机构提交的基因表达数据(首要包括芯片表达数据,也包括一些高通量测序表达数据)。这儿含有海量的揭露的免费的数据,咱们能够使用这些数据凭借生物信息学东西再次发掘这些数据,宣布SCI论文。

  Gene 上IF=2.6分左右。该文章宣布的杂志影响因子尽管不高,剖析的内容呢也会少一些,可是关于生信数据发掘刚刚入门的生物汪来说却是一个非常好的入门级其他文章。文章的意图是经过生物信息剖析的办法,发掘GEO和TCGA数据库傍边的揭露数据,然后发现与直肠癌预后相关的biomarker,为直肠癌的确诊和医治供给分子确诊根据。

  然后,又下载TCGA傍边的直肠癌相关的转录组数据做差异剖析,差异剖析成果制作火山图(下图 A)。关于4组数据傍边的差异基因依照上调基因(下图B)和下调基因(下图C)别离做韦恩图,终究得到共有的上调基因57个和下调基因150个。

  Kaplan-Meier曲线显现,模型猜测的低危险组与高危险组比较,高危险组患者的逝世危险显着高于低危险组(下图A),ROC曲线年生计猜测危险评分的AUC值为0.741(下图B),模型对直肠癌的预后作用很好。

  两个数据集别离做差异剖析,然后取交集得到终究的差异基因集,将这些差异基因提交到DAVID数据库做差异基因的功用富集剖析,发现差异基因地点通路或许功用与直肠癌相关。经过蛋白互作网络剖析找到hub基因,与直肠癌的确诊相关,最终经过Cox回归剖析找到与直肠癌预后相关的基因,并树立预后模型,并查验该模型具有很好的预后准确性。

 

版权所有: 火狐体育在线注册|网址-官方投注 

京ICP备05050114号      400-160-1670