关于后端:文献解读丨利用群体转录组方法和eQTLs寻找水稻抗病转录因子

最近在学习一篇群体转录组和eQTLs相干的文献,做一个简略的笔记。该论文剖析了287份资料的转录组数据,并在一个远端eQTL调控热点中鉴定到一个要害转录因子,它可能激活上游抗毒素合成相干基因的表白,从而影响水稻抗毒素的代谢程度和抗病性。文章篇幅比拟长,可能会分成好几期。

eQTLs play critical roles in regulating gene expression and identifying key regulators in rice

中文题目:eQTLs在水稻基因表白调控和要害调控因子的鉴定中具备关键作用
关键词:群体转录组,表白数量性状位点,要害调控因子,全转录组关联钻研
DOI:10.1111/pbi.13912

次要内容摘要

  • 基因表白调控对动物的表型起着重要作用,转录组测序能够同时辨认外显子变异定量基因表白
  • 本文对287份水稻资料的叶片转录组进行测序,取得177853个高质量的SNP位点。
  • GWAS剖析出44354个eQTLs,调控13201基因的表白,以及17个部分eQTL和96个远缘eQTL。
  • 全转录组关联钻研(TWAS)筛选了21个与抽穗期淀粉含量无关的候选基因
  • HS002是一个显著的远端EQTL热点,具备5个丰盛的上游基因用于二萜抗毒素合成。 共表达剖析、eQTL剖析和连锁定位表明BHLH026是激活上游基因表白的要害调控因子。BHLH026是水稻合成二萜类抗毒素的重要调控因子,具备加强水稻抗病性的作用。

以上钻研后果进步了对水稻基因组基因表白、变异和简单调控网络调控机制的意识,并促成栽培水稻种类的遗传改进

基因表白是分割基因(内)和表型(外)的桥梁,在调控动物发育过程中有十分重要的作用。辨认影响基因表白程度的eQTLs,对了解基因组变异调控基因表白程度以及基因组信息如何通过遗传核心教条传递到状态表型至关重要。
GWAS通过检测基因型和表型的变异来辨认关联状况,但因为连锁不均衡的衰减和基因正文的局限性,该法不能精确辨认候选基因和基因的性能。

transcriptome-wide association study
(TWAS) 全转录组关联剖析

TWAS能更精确地预测表型变异的候选基因,eQTL联合GWAS的数据能更加准确的定位基因位点。

钻研后果

转录组测序及外显子SNP鉴定

作者从533份微外围种质资源中选出287份代表性种类,抽穗期取样进行转录组测序,失去110亿个双末端reads,质控后比对到参考基因组量化表白程度,其中特异性reads占70%左右。

而后,作者从数据中筛选出了177853个高质量SNP,用贝叶斯聚类办法对287份资料的群体构造进行剖析。

  • k=9处,cv误差值最小
  • k=3处,三个水稻亚群最显著
  • k=6处,进一步将粳稻划分为两个亚群

依据最大似然法建设系统发育树,结果表明籼稻、粳稻和Aus亚群体位于不同的分支。

PCA主成分剖析的后果也显示籼、粳和Aus亚群体的聚类关系,这些后果证实了作者的资料群体可能捕捉到丰盛的遗传变异,可能撑持后续的钻研工作。

eQTLs的全基因组定位

作者通过对转录组数据进行定量分析,确定了23325个在叶片中表白的基因,占到基因组正文基因总数的41%左右。
应用Fast-LMM软件,对287份资料的基因表白与基因组SNP数据进行关联剖析,后果得出:14562个基因的表白与SNP具备显著相关性,作者通过聚类法将同一基因相干的多个SNP确定为eQTL区,总共从13201个基因中确定了44354个eQTLs,依据基因和SNP的地位察看,发现呈对角线富集。

除此之外,依据eQTL和基因的绝对地位分为近端eQTL(local,小于100kb)和远端eQTL(distant,大于100kb),74%的基因具备近端eQTL,近端eQTL对基因表白的影响大于远端eQTL。

作者发现基因受eQTL调控方面,均匀单个基因对应3.4个eQTL:

  • 9853个基因受近端eQTL调控
  • 8427个基因受远端eQTL调控
  • 5079个基因受两者同时调控

TSS示意转录起始位点,通过下图能够分明的发现,大多数eQTLs都在基因左近,随着间隔TSS越来越远,eQTL的散布缩小,大概60%的eQTLs在30kb内。

近端eQTLs和共调控基因簇的鉴定

下面提到近端eQTL对基因表白调控具备更重要的作用。接下来作者进行基因富集剖析。

  • KEGG富集显示这些基因在次生代谢产物合成过程中富集最为显著。
  • GO富集显示这些具备eQTL的基因在蛋白润饰、细胞死亡、应激反应等方面富集。

这些结果表明,具备近端eQTL调控的基因可能在次生代谢产物和合成、加工等过程施展肯定作用。

以往的钻研表明,一个基因区域内可能含有大量的eQTLs并且影响着多个基因的表白。这个区域不均分散布,称其为“eQTL调控热点”,作者通过hot_scan软件鉴定了17个近端eQTL热点。结果表明大部分位于染色体的末端,而着丝粒左近很少(这可能与表白克制或着丝粒逃逸无关)

作者对17个近端eQTL热点进行富集剖析和与代谢基因簇的重叠剖析,表明eQTL热点与代谢路径无关。

调控热点区蕴含26个与合成3-磷酸甘油相干的基因。 作者发现eQTL和基因造成共调控基因簇,并发现同一簇内的基因在玉米中具备类似的表白模式。

随后,作者检测了所有正文基因在3-磷酸甘油合成中的共表达,在热点区中显示了六种不同的表白模式和四个共调控基因簇。

同样,在另外一个样品中检测到6个油菜素类固醇合成相干基因,对43个油菜素类固醇合成相干基因的共表达剖析显示了三种不同的表白模式,发现了一个共调控基因簇。

这些结果表明,由同一中央eQTL独特调控的基因簇在水稻中也普遍存在。

依据基因组和转录组解释表型变异

作者对287份资料的淀粉含量也进行了测定,而后利用GWAS剖析出了25个与淀粉含量相干的要害基因座,而后用TWAS剖析,联合表白数据和表型数据,检测到21个候选基因。

【参考文献】Liu, C., Zhu, X., Zhang, J., Shen, M., Chen, K., Fu, X., Ma, L., Liu, X., Zhou, C., Zhou, D. and Wang, G. (2022) eQTLs play critical roles in regulating gene expression and identifying key regulators in rice. Plant Biotechnol J., https://doi.org/10.1111/pbi.1…

本文由mdnice多平台公布

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理