今年7月,优迅医学cso关永涛团队关于nipt新算法的最新成果《inferring fetal fractions from read heterozygosity empowers the noninvasive prenatal screen》发表于美国acmg会刊《genetics in medicine》,这是关教授团队继2017年后,就nipt算法创新所发表的第二篇重磅学术文章。该方法解决了当前行业领域中不能准确推断胎儿浓度的重大技术难题,这一成果结合优迅医学独家的贝叶斯算法,为无创微缺失微重复综合征的检测提供了更为可靠的技术保证。自2019年9月份起,优迅医学成为国内首家在nipt plus报告中明确给出胎儿浓度信息的检测机构,完成了优迅志在打造业内最强nipt plus的最后一块拼图。
优迅医学进入nipt市场以来,依靠极强的渠道优势在快速占领市场份额方面进展显著,但优迅的技术团队显然有着更大的野心和前瞻的眼光。几年来,从nipt到nipt plus再到无创单病,从贝叶斯理论、隐马尔科夫模型到常染色体胎儿浓度定量方法,从北京市自然科学基金到科技部十三五重大专项再到trimax全国多中心临床试验,优迅医学完成了从nipt技术并驱者、市场跟随者,到nipt plus技术领先者、市场开拓者的重大角色转换,而美国杜克大学关永涛教授的加入,更是在生信算法领域行业高地插上了优迅医学的一面大旗。
nipt能成为基因行业第一个产业化落地的产品,并于近几年在全球范围迅速普及,有机缘,有巧合;有需求,有成果;有调整,有突破。今天,就让我们以此为引,翻看nipt从业者们之前走过的路,跌过的坑,直到最强plus的诞生。
一直苦苦寻找的,就这样不经意的出现
别看现在基因检测看似临床普及,大众熟悉,但如果拿通信行业进行类比,现在顶多算2g时代,基因检测还有很大的空间,很长的路要走。nipt上市以前,基因行业所处的就是1g时代,其作为绝对的高冷技术主要还是为国内各大高校和科研院所提供测序及分析服务,特别是随着ngs成本的快速下降,使得基因测序越来越触手可及,以基因测序为亮点的高质量文章大量涌现,当时华大发过cns的员工据粗略统计就有数十人之多,基因测序一时风头无两。但作为一个产业来讲,科技服务有它的发展瓶颈,就是市场容量和服务对象相对固定。
正因如此,实际上那时的基因er就已经开始在寻找更大的市场,并很快把目光放到了临床领域,毕竟基因行业发展追踪溯源,就是源自为解决大众健康问题的,与曼哈顿原子弹计划和阿波罗登月计划并称为20世纪人类自然科学三大工程的人类基因组计划。
nipt就等在那里,而且一切都是对的
nipt就这样进入了视野。另一方面,我国出生缺陷发生率5.6%,每年由于出生缺陷造成的社会经济负担超百亿元。临床上也一直在寻找一种既安全又准确的方法,帮助孕妇在产前判断胎儿是否携带染色体疾病。自1997年开始dennis lo等研究者陆续发表的文章提供了无创产前胎儿染色体异常检测的科学依据,但使用什么手段呢,研究者们最初尝试用数字pcr方法检测,可惜准确性不行,而当那些做ngs的家伙们关注到这里后,直接大喊一声:我行!
究竟是什么能让素来见多识广沉稳有度的科学家前辈能如此脱口而出?因为他站在前面研究者的肩膀上一看,心中顿时喷薄出两个字:完美。原来在仔细研究了母体外周血后发现其有如下特性:
1)孕妇外周血中存在胎儿的游离dna,含量是胎儿细胞dna含量的近千倍;
2)这些游离dna在孕5周即可检出,并随孕周的增加而增加;
3)胎儿游离dna片段长度与母亲dna片段长度有差异;
4)胎儿游离dna片段平均大小约为160bp;
5)胎儿游离dna在分娩后迅速消失,2个小时后无法检出。
这些特性保证了使用ngs测序平台,在孕12周起(基于孕妇个体差异的保守考量),仅通过对孕妇外周血测序,得到胎儿染色体的信息数据,就能够判断是否为唐氏儿。特别是测序数据的分析方法z-score简单易行,并不要复杂的统计模型。
正是有了卢教授等前辈的突破性发现、胎儿游离dna特性、临床痛点以及入门级的统计算法加持,才有了nipt第一个基因组科技临床产品的快速落地及普及。当然,前面的因素形成了一个行业风口,而从业者的努力更是nipt产业快速发展的基石。近几年肉眼可见的变化是,医生从排斥到接受再到力荐,孕妇从谨遵医嘱到主动咨询,临床上基于国人数据的大规模临床试验从无到有,国家政策从不禁不荐到叫停整顿再到试点运营直至全面放开,nipt产品从擦边球式操作发展到已有部分地区政府定价、纳入医保甚至政府采购全民免费。
那新的问题来了,对于这样一个爆款,从业者的下一步该往哪走?如何修建自己的技术护城河?如何站在卢教授等巨人的肩膀上再求更高突破?这就是优迅人近年来日以继夜要探寻的答案。
激烈竞争之下看优迅的选择
对于优迅来说,在前期借渠道之力迅速占领市场后,面临一个重要选择,是创新开发下一个爆款?还是研发爆款的延伸性产品?
优迅说:小孩子才做选择,我两个都要。
优迅从成立第一天起,就确定了出生缺陷和肿瘤精准医疗双产业主线并行推进的发展方针。肿瘤方向要搞,必争之地,前期重积累储备,单拉队伍潜心做产品做项目,ctdna&ctc液态活检、泛肿瘤早筛和国人乳腺癌复发风险评估的临床多中心项目三箭齐发;生育方向要搞,规模化是关键,重技术创新突破,做优迅特色的nipt,是优迅技术团队的使命。接下来的问题,如何有特色,如何突破,很简单,传统nipt的局限性在哪里,就往哪里发力攻关。
对于nipt的创新,优迅主要瞄准两个方面:核心算法的突破与检测范围的扩展。
nipt-zscore方法的灰区尴尬
nipt够准了吗,相比唐筛,已经有了革命性的进步,但这还不够。
这里再次提到z-score的算法,本身存在一个明显的bug——灰区尴尬。z检验让每个人套进一个模型中,算法和依据算法设定的阈值都是死死的,比如这个阈值是3,如果结果小于3,就是低危,出低风险报告;结果大于3,就是高危,出高风险报告并建议去做羊穿。但如果是2.9或者3.1呢,数据一旦落在阈值附近这一灰区时,实际判读一直让人很头疼:2.9与3.1真的是有着天壤之别么?阈值3是一个统计结果,这是一个概率问题,也是各家的经验值,并不足以判定胎儿染色体情况。
这里另说一句,当数据结果落入灰区,当下为了解决这个问题,大多数检测机构的做法是,重新单独分析这个样本,如果还是落入灰区,就只能采用间接的方法——拿不准了就报阳性。这种规避假阴性样本产生的做法导致了假阳性率的上升。必须说明的是,这并非是不负责任的鲁莽行为,因为相较生下唐氏儿而言,报阳性而建议孕妇做产前诊断挨一针,是当时技术条件下最好的方式,当然,某种程度也是无奈之举,并且羊穿的费用也由检测公司支付。退一步说,算上由于灰区问题导致的假阳性情况,nipt的准确率还是远远高于普通唐筛的。
现在,摆在从业者面前的技术难题已很清楚,如何避免灰区尴尬?这已经不是方法优化的问题,而必须从底层算法上引入新的思路、设计新的统计模型来解决。就这样,优迅开始了连续奋战;就这样,优迅找到了贝叶斯因子。
贝叶斯因子,告别头疼的灰区,特别的结果给特别的你
优迅2017年发表的文章《informative prior on fetal fraction increases power of noninvasive prenatal screen》显示,优迅自主研发了基于贝叶斯统计学原理的nipt算法。此模型引入胎儿浓度和疾病发病率等先验知识,通过贝叶斯理论计算后验概率,从而构建出贝叶斯因子(贝叶斯因子是用来描述一个分布优于另一个分布的相对确证性)。
将贝叶斯因子引入到nipt模型,实在是关永涛教授匠心独运的绝妙一笔,再加上同步引入的隐马尔科夫模型,能够有效剔除母体cnv(copy number variance)的背景干扰,以及通过行之有效的smooth gc矫正方法来降低干扰误差,使优迅的nipt检测效力大增,ppv\npv数据均处于行业领先水平(下图显示贝叶斯理论在ppv/npv性能上远优于z检验,详细报导见之前。)。
女胎胎儿浓度定量的困扰
在算法上取得创新性突破之后,优迅紧接着开始了nipt plus的产品研发,旨在拓展nipt的临床适用范围,以进一步满足正在快速增长的无创出生缺陷检测服务升级需求。nipt产品虽然已经得到了临床和客户的认可,奈何检测范围极其有限,仅针对三大染色体非整倍性异常进行检测。实际上,其他染色体以及其他变异类型导致的疾病同样或许更值得我们关注。针对这一需求,从技术上讲,优迅已经将现有贝叶斯分析方法检测的效力显著提升,但是对于nipt plus而言,还需要一个十分重要的数据参数——胎儿浓度。
胎儿浓度是十分重要的信息。美国医学遗传学与基因组学学会(acmg)在2016年更新的nipt声明中,对胎儿浓度与nipt检测效力进行了专门阐述,建议nipt检测报告应包含明确的胎儿浓度信息。但是,对于胎儿浓度的准确定量一直是行业技术难题。这其中,男胎的胎儿浓度可以利用y染色体进行分析得到,但是女胎的胎儿浓度定量却没有行之有效的办法。
基于低深度测序的snp杂合性分析推断胎儿浓度模型
要想突破女胎难题,就必须告别性染色体的思路,通过常染色体信息进行分析,才有突破的希望。优迅医学正是基于这一技术决心,把关注重点放在了snp遗传特点的分析上。此前业内的研究成果中,有的需要进行额外的靶向富集,有的需要较高深度的测序,对于临床上作为筛查手段的nipt plus而言,仅理论可行,成本增加问题突出,是实现临床产业转化的重大阻碍。
所以,结论就是,在保持较低测序深度的同时,仍然可以准确分析胎儿浓度的方法,才是nipt plus真正需要的好方法、产业转化可行的方法。可是低深度测序,真的能测到足够位点吗?优迅给出了肯定答案(预知详情,可以移步)。就这样,优迅构建出了一个根据snp的杂合性推断胎儿浓度的分析模型。
检验性能的时刻到了!
如前所述,对于男胎,通过y染色体定量相对准确,因此最好的检验方式就是用男胎性染色体定量方法做比较。
图中是我们回顾了69个真实的男胎临床样本得到的数据,两个数据结果一致性非常棒,r2 = 0.971。偏离的两个小星星可不是我们的结果不好,反而是结果不要太好,发现了两个龙凤胎!(胎儿浓度是男胎的两倍)。
就这样,优迅解决了胎儿浓度定量这一难题。该成果已经申报了多项国内国际专利。有了核心算法的加持,优迅迅速推出了业内最强的nipt plus,能够检测16个染色体非整倍性异常、115种染色体微缺失微重复综合征以及295个智力障碍相关区域,并国内独家在报告中加入胎儿浓度信息。
激烈拼杀中的市场策略——左手成本、右手转化
nipt发展到现阶段,成本已经是最大的行业壁垒,谁能将成本压低,谁就有竞争优势,而nipt成本的控制与优化,不仅体现在科技研发水平上,更需要一定时间的基础性积累。
今年年初,华大基因与优迅医学达成深度合作并完成战略入资。二季度,优迅完成了所有产线华大测序平台的转产工作,成为全球除华大之外,唯一全产线使用华大测序平台的基因公司,测序仪器及试剂的国产化再加上创新算法所带来的低深度高质量数据成本,确保了优迅在市场渠道拓展上始终具有自身独特优势,尤其是中美战略博弈大背景下,相较众多依赖于美国测序仪和试剂的其他公司,具有更大的底层成本优势与从根本上讲无忧无隐患、自主可控的可持续发展基础。
在市场布局上,优迅在巩固原有优势区域的基础上用nipt主打二三级市场,寻觅机会做渠道下沉;而对于竞品激烈同时升级需求强劲的重点目标医院,则以nipt plus做业务切割,依靠产品力进行强势渗透,实现业务转化。目前优迅医学整体业务nipt plus转化率已经超过30%,独占行业鳌头,相信随着临床的逐步布局推进和延展,以及需求的逐步启发、引导和扩大,优迅基于全新算法的nipt plus一定会引领行业的新一轮变革。
后记
本文结束前,特别想补充的一点是,看似泾渭分明的肿瘤和生育在临床上却有着神奇的共通之处,因为对于人体来说,不管是母体的胎儿和人体的肿瘤,都可看做是人体外来的“异物”,而临床上大都是针对“异物”的游离dna进行检测,在检测方法和后续信息分析方面,很多技术是相通的,这也为两条线研发上未来的互通互助互用带来了可能。纵观科技发展史,很多时候,科学上的闪光点恰恰来自此类“跨界”创新思维。
与早期单纯nipt业务渠道型公司不同,优迅有着全面的中长期发展战略规划,包括肿瘤线的发展和布局在公司成立之初已经开始,从平台搭建、产品研发、生产转产到市场推广,从团队组建到社会资源横纵联合,都在计划周期内,都在自己的节奏中。
优迅通过短短几年的发展,在两条线都已经形成了自己的差异化发展方向和产品优势,nipt的贝叶斯统计模型和女胎定量方法,更是为优迅贴上了算法领先的标签,得到了专家的高度认可和同行的纷纷效仿;而肿瘤的国人乳腺癌复发风险评估和泛肿瘤早筛的临床项目,则为肿瘤线明确了未来着力的方向,展现出广阔的发展前景。相信优迅作为成立伊始就秉持“更贴近临床”理念的从业者,最终会跨越巨人的肩膀,继续砥砺前行。