关于后端:文献解读丨利用群体转录组方法和eQTLs寻找水稻抗病转录因子

30次阅读

共计 2646 个字符,预计需要花费 7 分钟才能阅读完成。

最近在学习一篇 群体转录组 和 eQTLs 相干的文献,做一个简略的笔记。该论文剖析了 287 份资料的转录组数据,并在一个远端 eQTL 调控热点中鉴定到一个要害转录因子,它可能激活上游抗毒素合成相干基因的表白,从而影响水稻抗毒素的代谢程度和抗病性。文章篇幅比拟长,可能会分成好几期。

eQTLs play critical roles in regulating gene expression and identifying key regulators in rice

中文题目 :eQTLs 在水稻基因表白调控和要害调控因子的鉴定中具备关键作用
关键词:群体转录组,表白数量性状位点,要害调控因子,全转录组关联钻研
DOI:10.1111/pbi.13912

次要内容摘要

  • 基因表白调控 对动物的表型起着重要作用,转录组测序能够同时辨认 外显子变异 定量基因表白
  • 本文对 287 份水稻资料的叶片转录组进行测序,取得 177853 个高质量的 SNP 位点。
  • GWAS 剖析出 44354 个 eQTLs,调控 13201 基因的表白,以及 17 个部分 eQTL 和 96 个远缘 eQTL。
  • 全转录组关联钻研 (TWAS)筛选了 21 个与抽穗期淀粉含量无关的 候选基因
  • HS002 是一个显著的远端 EQTL 热点,具备 5 个丰盛的上游基因用于二萜抗毒素合成。共表达剖析、eQTL 剖析和连锁定位表明 BHLH026 是激活上游基因表白的要害调控因子。BHLH026是水稻合成二萜类抗毒素的重要调控因子,具备 加强水稻抗病性 的作用。

以上钻研后果进步了对 水稻基因组基因表白、变异和简单调控网络调控机制 的意识,并促成栽培水稻种类的 遗传改进

基因表白 是分割基因(内)和表型(外)的桥梁,在调控动物发育过程中有十分重要的作用。辨认影响基因表白程度的 eQTLs,对了解基因组变异调控基因表白程度以及基因组信息如何通过遗传核心教条传递到状态表型至关重要。
GWAS通过检测基因型和表型的变异来辨认关联状况,但因为连锁不均衡的衰减和基因正文的局限性,该法不能精确辨认候选基因和基因的性能。

transcriptome-wide association study
(TWAS) 全转录组关联剖析

TWAS能更精确地预测表型变异的候选基因,eQTL 联合 GWAS 的数据能更加准确的定位基因位点。

钻研后果

转录组测序及外显子 SNP 鉴定

作者从 533 份微外围种质资源中选出 287 份代表性种类,抽穗期取样进行转录组测序,失去 110 亿个双末端 reads,质控后比对到参考基因组量化表白程度,其中特异性 reads 占 70% 左右。

而后,作者从数据中筛选出了 177853 个高质量 SNP,用贝叶斯 聚类 办法对 287 份资料的 群体构造 进行剖析。

  • k= 9 处,cv 误差值最小
  • k= 3 处,三个水稻亚群最显著
  • k= 6 处,进一步将粳稻划分为两个亚群

依据最大似然法建设 系统发育树,结果表明籼稻、粳稻和 Aus 亚群体位于不同的分支。

PCA 主成分剖析的后果也显示籼、粳和 Aus 亚群体的聚类关系,这些后果证实了作者的资料群体可能捕捉到 丰盛的遗传变异,可能撑持后续的钻研工作。

eQTLs 的全基因组定位

作者通过对转录组数据进行定量分析,确定了 23325 个在叶片中表白的基因,占到基因组正文基因总数的 41% 左右。
应用 Fast-LMM 软件,对 287 份资料的基因表白与基因组 SNP 数据进行关联剖析,后果得出:14562 个基因的表白与 SNP 具备显著相关性,作者通过聚类法将同一基因相干的多个 SNP 确定为 eQTL 区,总共从 13201 个基因中确定了 44354 个 eQTLs,依据基因和 SNP 的地位察看,发现呈对角线富集。

除此之外,依据 eQTL 和基因的绝对地位分为 近端 eQTL(local, 小于 100kb)和 远端 eQTL(distant,大于 100kb),74% 的基因具备近端 eQTL,近端 eQTL 对基因表白的影响 大于 远端 eQTL。

作者发现基因受 eQTL 调控方面,均匀单个基因对应 3.4 个 eQTL:

  • 9853 个基因受近端 eQTL 调控
  • 8427 个基因受远端 eQTL 调控
  • 5079 个基因受两者同时调控

TSS 示意转录起始位点,通过下图能够分明的发现,大多数 eQTLs 都在基因左近,随着间隔 TSS 越来越远,eQTL 的散布缩小,大概 60% 的 eQTLs 在 30kb 内。

近端 eQTLs 和共调控基因簇的鉴定

下面提到近端 eQTL 对基因表白调控具备更重要的作用。接下来作者进行基因富集剖析。

  • KEGG 富集显示这些基因在次生代谢产物合成过程中富集最为显著。
  • GO 富集显示这些具备 eQTL 的基因在蛋白润饰、细胞死亡、应激反应等方面富集。

这些结果表明,具备近端 eQTL 调控的基因可能在次生代谢产物和合成、加工等过程施展肯定作用。

以往的钻研表明,一个基因区域内可能含有大量的 eQTLs 并且影响着多个基因的表白。这个区域不均分散布,称其为“eQTL 调控热点”,作者通过 hot_scan 软件鉴定了 17 个近端 eQTL 热点。结果表明 大部分位于染色体的末端,而着丝粒左近很少(这可能与表白克制或着丝粒逃逸无关)

作者对 17 个近端 eQTL 热点进行富集剖析和与代谢基因簇的重叠剖析,表明 eQTL 热点与代谢路径无关。

调控热点区蕴含 26 个与合成 3 - 磷酸甘油相干的基因。作者发现 eQTL 和基因造成 共调控基因簇,并发现同一簇内的基因在玉米中具备类似的表白模式。

随后,作者检测了所有正文基因在 3 - 磷酸甘油合成中的 共表达,在热点区中显示了六种不同的表白模式和四个共调控基因簇。

同样,在另外一个样品中检测到 6 个油菜素类固醇合成相干基因,对 43 个油菜素类固醇合成相干基因的 共表达剖析 显示了三种不同的表白模式,发现了一个共调控基因簇。

这些结果表明,由同一中央 eQTL 独特调控的基因簇在水稻中也普遍存在。

依据基因组和转录组解释表型变异

作者对 287 份资料的淀粉含量也进行了测定,而后利用 GWAS 剖析出了 25 个与淀粉含量相干的要害基因座,而后用 TWAS 剖析,联合表白数据和表型数据,检测到 21 个候选基因。

【参考文献】Liu, C., Zhu, X., Zhang, J., Shen, M., Chen, K., Fu, X., Ma, L., Liu, X., Zhou, C., Zhou, D. and Wang, G. (2022) eQTLs play critical roles in regulating gene expression and identifying key regulators in rice. Plant Biotechnol J., https://doi.org/10.1111/pbi.1…

本文由 mdnice 多平台公布

正文完
 0