关于数据挖掘:6的hub联合预后

20次阅读

共计 1249 个字符,预计需要花费 4 分钟才能阅读完成。

** 原文公众号:一起试验网
对下述分析方法感兴趣或者没有钻研思路的小伙伴,欢送踊跃探讨!**

明天小编分享一篇 2022 年 9 月发表在 Front Endocrinol (Lausanne)的文章(IF :6.055),题目为“Identification of hub genes for early detection of bone metastasis in breast cancer”。

一、背景 & 办法
背景:
在寰球范畴内,在所有妇女中,最常被发现和诊断的、最致命的癌症类型是乳腺癌(BC)。特地是,骨是乳腺癌患者中最常见的远处转移之一,大概 80% 的早期患者会产生骨转移。因而,咱们须要辨认和验证可能辨别转移性乳腺癌和非转移性乳腺癌的晚期检测标志物。

办法:
1、GSE55715、GSE103357 和 GSE146661 基因表白谱数据从 GEO 数据库下载
2、GEO2R 用于筛选差别表白基因(DEGs)。
3、火山图、维恩图和热图是通过应用 ggplot2 包生成的。
4、利用 R 包 clusterProfiler 对 DEGs 进行 KEGG 和 GO 富集剖析。
5、利用 STRING 数据库构建 PPI 网络,利用 cytoHubba 软件辨认 hub 基因。
生成 K - M 生存曲线和 ROC 曲线,验证 hub 基因的表白。

二、后果
1、BC 中 DEGs 的鉴定

GSE103357、GSE146661 和 GSE55715 中 DEGs 的鉴定 (图 1)。(A) 显示 GSE103357 中所有表白基因的火山图。(B) GSE103357 中前 10 个上调或下调的 DEG 的相关性剖析热图。(C)显示 GSE146661 中所有表白基因的火山图。(D) GSE146661 中前 10 个上调或下调的 DEG 之间的相关性剖析热图。(E)显示 GSE55715 中所有表白基因的火山图。(F) GSE55715 中前 10 个上调或下调的 DEG 的相关性剖析热图。(G, H)上调和下调的 DEG 的维恩图。(I) 143 个重叠 DEG 的环形热图。

2、DEGs 的 KEGG 和 GO 富集剖析

DEGs 的 KEGG 和 GO 富集剖析 (图 2)。(A) 前 12 个 GO 术语的 z 得分后果,包含前 4 个 bp、cc 和 mf。(B) DEGs 和前 15 个 GO 富集后果。(C, D) KEGG 富集剖析。
**
3、PPI 网络构建及 hub 基因剖析 **

PPI 网络构建及 hub 基因剖析 (图 3)。(A) 从 56 个节点和 178 条边的 PPI 网络中取得最显著的模块。(B)模块 1 蕴含 7 个上调基因节点和 16 个边,MCODE 评分 =5.33。(C)模块 2 蕴含 9 个基因节点和 28 个边,MCODE 评分 =7。(D)利用 cytoHubba 插件从 PPI 网络中抉择 hub 基因。

4、BC 患者的 Hub 基因表白

失常样品和肿瘤样品中各种基因的表白(图 4)。

5、hub 基因的生存剖析

10 个 hub 基因的无停顿距离 (PFI) 曲线。BC 患者各基因高、低表白的无停顿距离 (PFI) 曲线(图 5)。

10 个 hub 基因的 ROC 曲线(图 6)。

代表性组织学图像来自人类蛋白质图谱数据库(THPA, https://www.proteinatlas.org/)(图 7)。

正文完
 0