摘要:[摘 要] 目的 识别结直肠癌中的差异表达基因(DEGs),探索结直肠癌的关键通路和基因。方法 选 取来自基因表达综合数据集的基因表达谱GSE211496、GSE6988和GSE29900数据集,使用GEO2R分析工具 进行分析并下载相关数据,通过在线数据库miRDB和 TargetScan对GSE29900数据集的差异miRNAs进行 靶基因预测,然后使用韦恩图取3个数据库的DEGs交集,使用DAVID数据库工具进行GO 和KEGG 通路富 集分析,接着使用PPI进行网络构建并由Cytoscape软件进行可视化,使用TCGA 数据库验证Hub基因表达, 使用pROC包对与TCGA 数据库表达一致的Hub基因进行ROC曲线分析,最后,利用Kaplan-Meier绘图仪 在线工具对结直肠癌患者进行预后分析。结果 筛选出GSE211496数据集2 570个DEGs(p.adj<0.01且 |log2FC|≥1),GSE6988数据集406个DEGs(p.adj<0.01且|log2FC|≥1)和 GSE29900数据集99个差异表 达 miRNA(p.adj<0.01且|log2FC|≥1),预测出差异表达miRNAs的靶基因14 938个,将靶基因与 DEGs 重 叠共获得30个目标基因。KEGG通路结果显示,目标基因主要富集于血管平滑肌收缩和矿物吸收通路。通过 连接度从PPI网络中筛选出前10个Hub基因;Hub基因经TCGA 数据库验证,发现MYL9、ACTG2、AGT和 PDGFRA 与GSE211496数据集表达一致。分析这4个Hub基因对结直肠癌的诊断情况发现,基因AGT (AUC=0.901,95%CI 0.868~0.933)与预测结直肠癌的发生呈正相关,基因MYL9(AUC=0.820,95%CI 0.757~0.884)、ACTG2(AUC=0.855,95%CI 0.802~0.908)和PDGFRA(AUC=0.815,95%CI 0.772~ 0.858)与预测结直肠癌的发生呈负相关。基因MYL9、ACTG2和PDGFRA 对结直肠癌诊断均有一定准确性, 基因AGT对结直肠癌诊断具有较高准确性。Kaplan-Meier生存分析发现,PDGFRA、ACTG2和MYL9低表 达均显示患者预后较好,差异均有统计学意义(P <0.05)。结论 该研究通过生物信息学分析筛选并鉴定出4 个基因是结直肠癌中的枢纽基因,这些基因包括PDGFRA、ACTG2、MYL9和AGT,这将为结直肠癌研究提供 一些新方向。