简介:云上高性能计算 EHPC 助力圣庭医疗晋升基因检测效率,为患者提供更多精准化医疗计划。
头图.png
为什么他人胡吃海塞都仍然瘦成竹竿,我喝水都会胖?
为什么我这么可怜,疾病会找上我?早晓得就不乱喝酒。
为什么是同一种病,他人吃这个药有用,我吃却没用?
从日常的衰弱治理、疾病预防,甚到罹患重症时的最无效的医疗计划,都跟基因无关。在新冠疫情的溯源与药物研发中,病毒全基因组的测序,同样施展着重要作用。
然而,人类对基因的摸索是一个漫长而艰苦的征程。号称生命科学畛域“登月打算”的“人类基因组打算”于 1990 年启动,打算测定组成人类染色体的 30 亿组碱基对。通过六国 2000 多名科学家致力,耗资 30 亿美元,终于在 2003 绘制实现人类基因组图谱。
随着技术的倒退,基因测序的费用正在急速变低。随着二代、三代高通量测序技术的呈现,人全基因组测序的老本在过来十多年间从一千万美元逐步升高到一千美元。
图 1 - 老本升高.png
这让很多生命科学畛域的学者看到基因测序技术利用到临床的可能,并心愿以一己所学,为饱受疾病折磨的人带来新心愿。
谷红仓博士也是怀揣着如斯愿景的学者。
01 从入世到入世,以基因测序抗衡癌症
回到 2013 年,谷红仓博士正在哈佛大学 - 麻省理工博德研究院 (The Broad Institute of Harvard and MIT) 供职。博德研究院是寰球生物遗传学最顶尖团队,由基因组学泰斗 Eric S. Lander 创建。Lander 博士是前文提及“登月打算”的发起人之一和次要执行人。
身处如此团队,每年不乏在《Nature》和《Cell》等顶级期刊发表论文的机会,已是有数学者梦寐以求。惟一美中不足的是,基础科学次要专一实践摸索,鲜少临床论证,谷博士也心愿能为人类衰弱事业倒退做点什么,思忖着转向临床钻研。
谷博士.jpg
谷红仓博士
恰逢次年,国内浙江天宇药业股份有限公司(股票代码:300702. SZ.)的董事长屠勇军,辗转找到谷红仓博士,邀请谷博士退出并领导其新投资成立的基因测序试验公司 – 浙江圣庭生物科技有限公司。彼时,中国国内基因测序行业也是风起云涌,格局初成。华大基因(BGI)、贝瑞和康(BERRYGENOMICS)、安诺优达(ANNOROAD)等企业在无创产前基因检测畛域跑马圈地。
面对这个抉择,谷红仓许可在圣庭负责两年参谋,最终在屠勇军董事长的“三顾茅庐”之后,决定回国,以圣庭创始人兼首席科学家的身份,领导这家实验室。同时,他为本人,也为圣庭做了一个重大的决定:转型。
成立之初的圣庭生物次要服务于根底科研,为科研院所提供测序服务和技术领导。转型之后,圣庭将会面向肿瘤的病人,为其进行精准的基因测序和业余的后果解读,为癌症患者提供个性化的医治。改善患者的生存品质和缩短他们的生命周期,这更合乎谷博士的初心,也更合乎他对行业的判断。
你兴许会纳闷,基因测序对病人的意义到底有多重要?
即使是罹患同一种癌症,不同患者可能存在着不同的驱动基因突变,渐变状况不同,会导致有的药对某位患者无效,对其余患者却毫无作用。电影《我是药神》中的靶向药便是典型例子。怎么找到属于本人的特效药?不通过基因测序,须要化疗的病人只能一直地尝试不同的药物。苹果创始人乔布斯破费 10 万美元进行基因测序,领导个性化医治,换来 10 年寿命。
圣庭想要把这种技术普惠到更多的患者。
02 转型后高速倒退,面临成长的压力
2017 年,圣庭生物改成“圣庭医疗”,开始转型。
图 3 - 公司.jpg
圣庭医疗杭州实验室
针对临床的基因测序,美国医学遗传专家委员会 (American Board of Medical Genetics and Genomics, ABMGG) 开设了实验室遗传学和基因组学(Laboratory Genetics and Genomics)我的项目,标准了基因测序从样本的获取、解决、检测、剖析到报告出具等全流程,以造就合格的临床医学遗传实验室主任。该学科全美每年仅录取约 50 人。“国内的遗传学还是空白,直到 2021 年才开始设立相似学科”。
为了让圣庭的基因测序做到国内领先水平,谷博士在美国破费两年的工夫,全脱产加入了这个我的项目学习,同时边学边培训圣庭的共事,最终领导圣庭取得了美国病理学家学会(College of American Pathologists,CAP)资格认证,意味着出具的测验报告将具备寰球可比性和互认性,标记着实验室能力达到国际标准。
尔后的圣庭医疗也迎来了疾速倒退期间。业务由晚期的肿瘤基因检测,倒退到基于纳米孔测序技术的病原检测和精力类疾病及慢性病基因查看。团队从原来的 20 多人倒退到了 200 多人,逐步在北京、杭州、台州、长沙、广州开设了医学测验核心和实验室;接触到的样本量和接管的业务量也在快速增长。
大量患者深受病魔折磨已久,终于通过基因测序技术,查明了致病的基因突变或病原,找到了对症的药物,病情大大失去了缓解。比方,圣庭癌友李明 (化名) 是一位肺癌早期患者,并发骨转移、淋巴转移,医生曾预估生存期不到半年。从吃上第一粒靶向药开始,现在曾经走过了四个年头,正在冲破五年。而这期间,李明在圣庭历经了四次基因检测,一次又一次地找到了医治的办法,取得了新生。
图 4 - 用户问诊.png
在正确的策略与倒退策略下,圣庭也帮忙到了越来越多的病人。然而,飞速发展的圣庭也遇到了成长的懊恼:基础设施的倒退跟不上业务的倒退了。
高通量基因测序经验样本制备、上机测序后,将产生宏大的基因序列数据,并波及海量的数据存储、计算与传输,这对底层基础设施有着极高的要求。原来的 IDC 机房,曾经跟不上疾速倒退的圣庭。
圣庭须要再次求变。
高通量基因测序环节.jpeg
(点击图片可放大查看)
03 云上高性能计算 EHPC 晋升测序效率
基因测序所产生的海量数据,根本是不来到云的。从前,谷红仓所在的博德研究院,早在 10 年前每天所产生的数据就有 20T,在全美机构中排名第二,很早就抉择了云计算。而圣庭最早因为数据较少,高校对时效性的要求不强,也按行业惯性抉择了自建互联网数据中心(Internet Data Center,IDC)机房。
自建 IDC 机房对生信科学家们来说天然并非易事,只能硬着头皮“自学成才”。
圣庭 IT 负责人黄云的经验好像是行业缩影,为了建设公司的 IDC 机房,“找哪家装修公司,电力系统要多少能源,多少瓦、电线的粗细、UPS 要配多少,隔音怎么弄,集群架构、存储技术用什么存储技术,集群调度软件用什么……从装修、部署、施行到运维、应用,都是自学的。行业都是这样经验过去的,岗位没有那么细分”。
黄云走漏,生命科学行业近几年倒退较快,研究员都是身兼多职,没有专门的运维人员。这种形式不仅有着潜在的数据安全隐患,一旦机房产生火灾、旱灾或磁盘损坏等即意味着数据的失落,随着业务倒退,运维老本的减少也难以为继。
图 7.png
圣庭近几年的业务量增长很快,随着数据量的减少,所需的服务器日益增长,运维老本也在回升。谷红仓回顾:“负责 IT 团队的同学,每周都要过来台州进行保护。每个月的电费高达上万,2021 年还呈现了电荒。”这些他都看在眼里。
更重要的是,计算效率会影响患者的体验。实验室给癌症患者提供的检测报告,个别承诺 7 天出报告,样本的运输用去不少工夫,本就工夫紧迫。随着业务量减少,IDC 机房的算力难以满足要求,大量的测序文件须要排队,工夫给测序人员带来大量的压力,也会影响患者的体验。
圣庭的肿瘤检测业务,实验室在台州,样本须要台州检测,剖析人员则在杭州。基因数据数据计算结束后,须要从台州传到杭州剖析,起初随着北京、广州等多地实验室呈现,数据传输效率和平安危险就愈发攀升。
圣庭开创团队的一位亲友,刚好是云计算从业者,据说了圣庭所面临的运维、计算、存储、传输等一系列的懊恼之后,发现云计算能够完满解决,便举荐他们应用阿里云。单方可说相逢恨晚,圣庭上云已是势在必行。
2021 年,圣庭医疗决定将业务全面将业务迁上阿里云。
上云后,圣庭通过阿里云弹性高性能计算 EHPC 进行基因比对,计算的效率失去了大幅晋升。黄云还记得,最近最多一天送过来 5 批数据,如果没有上阿里云,利用自建机房可能就须要剖析好几天,最初一批数据光是排队就要三天。
但上云了之后,就不须要放心这个问题了,云的弹性让圣庭能够间接依据数据量随时“弹出”算力,并且随时可基于 HPC 调度零碎创立出不同队列的规格算力,并作资源隔离,以灵便应答不同业务场景的资源需要及并发。原来剖析一个批次的样本须要 10 小时,上云之后只须要 3 小时,计算效率晋升 70%,可能疾速给患者出具报告。
云免运维的个性更是大大降低了圣庭的运维压力,专一外围业务。阿里云的高性能数据中心有业余人员运维,打消了圣庭运维老本高企的苦恼;同时,阿里云上的数据始终采纳多正本灾备的机制,可靠性高达 10 个 9,数据安全得以保障;阿里云遍布全国各地的数据中心也能保证数据的传输效率,不便圣庭外部的高效合作。
现在,轻装上阵的圣庭医疗也在摸索更多的畛域,为患者提供更多精准化医疗的解决方案。
圣庭基于专利技术的三类 IVD 产品 ” 人基因组甲基化检测试剂盒 ” 曾经进入临床试验阶段。在感化畛域,基于二代测序和三代纳米孔测序双平台开发了“思可愈”系列感化精准诊断产品,并胜利推出了国内首个基于高通量测序技术的专门针对分枝杆菌鉴定和耐药基因检测的产品。
展望未来,心愿在云计算与生命科学产业的独特倒退下,人类能一直“解密”基因,预防、医治甚至毁灭疾病。
点击这里,查看更多生命科学畛域的行业实际。
原文链接:http://click.aliyun.com/m/100…
本文为阿里云原创内容,未经容许不得转载。