十几年前,生命科学研究中的数字孪生还更像是科幻小说中的概念,距离具备可行性的研发模型还有十万八千里。但随着COVID-19疫情的突然爆发与数字技术的加速普及,生命科学行业正对数字辅助生物学概念产生浓厚兴趣。
作为最新一代技术变革中的排头兵,数字孪生已经成为当下最炙手可热的概念之一,也在制造业运营方面取得了可圈可点的改善成绩。
那么,我们该如何理解数字孪生?根据IBM的解释,这项技术允许用户为物理实体或流程开发出精确的虚拟副本。联网传感器负责将物理资产中的数据一刻不停地馈送至数字模型。结合具体行业,研究人员可以借此建立起一套复杂的电网或航天器数字模型,并使用数据支持测试场景、进而识别出潜在问题。
而在生命科学领域,数字孪生的应用尚处于起步阶段。不过随着数字化的中心效应愈发明显,众多企业也开始纷纷投身于这个极具前景的创新概念。
Synthace首席科学家兼联合创始人Markus Gershater点评道,“我认为人们已经意识到数字孪生的潜力。其中蕴藏的可能性将帮助我们完成更好、更丰富的实验内容,并将相关成果在不同实验、乃至实验到临床间灵活转移。”
在Gershater看来,数字孪生在生命科学研究中的具体应用可以分为两类:生物应用与实验应用。虽然为细胞乃至人体构建完整的生物学模型还有很长的路要走,但实验应用层面的数字孪生已经在彻底重塑临床研究的基本面貌。
实验室环境数字化
生命科学正经历一场由数字技术推动的变革。多年以来,研究人员一直努力在有限的时间与资源之下适应整个行业愈发复杂的基本现实,但基因组学与个性化医疗等新兴领域的出现正逐渐让生命科学行业“不堪重负”。
Gershater解释道,“我们的现有可用工具,已经无法支撑起生命科学行业中愈发复杂的研究目标。从传统上看,我们的工作方式大多依赖于手动,而且主要集中在非常简单的实验设计与分析层面。事实上,整个生物学中的常见分析任务大多可以在Excel中直接完成。”
在Gershater看来,既然人们一直致力于在制造与建模领域应用数字孪生技术,为什么不把它引入生命科学的实验当中?
临床医生只能利用有限的简陋工具完成工作,所以研究项目严重受到成本与资源的制约。也正因为如此,全球众多新药发现项目往往中道崩殂。根据统计来看,约90%的药物发现最终失败——再结合2020年全球制药行业投入的近2000亿美元研发成本,其中的浪费无疑相当可观。
Gershater解释道,“物理实验的成本非常高。如果我们能够减少实际实验的数量,同时让实验更有针对性、更高效、更可能成功,就一定能让新药发现迈上新的台阶。”
而数字孪生对于研发工作的积极意义也正在这里:以往,生命科学研究人员可能需要数月、甚至数年时间才能完成对数据的分类与分析,但计算技术的进步让数字孪生能够同时建模多种场景并展开测试。此外,自动化测试还将帮助临床医生快速重建并重现实验场景,同时为不同地点、不同团队提供统一且高度受控的研究环境。
Gershater还提到,“这也进一步开启了劳动分工的可能性。以此为基础,我们可以建立专门的实验设计与规划团队,再由其他团队开展实际运行,让每个人都能充分发挥自己的专业积累与实践经验。”
运用数据的力量
当然,支撑这类复杂的系统肯定需要大量数据。虽然人类生物学的复杂性仍然高企,但随着传感器技术、人工智能与机器学习的进步,我们已经逐渐掌握了理解这一切复杂元素的能力。于是,生物学家将拥有多种获取实验效能及新增信息的途径。
然而,获取高质量历史数据绝非易事。生命科学研究人员面临的一大难题,就是我们对人类生物学特征仍有众多未解谜团,因此并没有丰富的现有数据能为特定领域的数字孪生模型提供信息支持。再加上生命科学研究中的数据集往往又小又杂乱,这就让解决之道变得更加坎坷崎岖。
Gershater认为,“在对如此复杂的系统进行建模时,我们首先需要获取大量高质量且具备深度的数据,用以深入解析整个体系。而实现这项目标的一大重要步骤就是建立实验性数字孪生,借此生成完整且质量可靠的数据集。”
尽早在实验中引入数字孪生技术不仅有助于增加可用数据总量,同时也能借数字设计与运行场景帮助研究人员收集更多分子结构及元数据、详尽呈现实验目的与过程,最终形成一套连续且结构化的资源集合。
只有拥有充足的历史、实时与过程数据,研究人员就能利用机器学习功能理解目标的执行情况,以及现有方案在未来的可能表现。最终,分子及药物靶标在实践诊疗中的表现也将成为可预测指标,并引领全人类进入个性化医疗的新时代。
西门子Healthineers开发的心脏数字孪生与Dassault Systems的活体大脑项目就是数字器官模型的早期尝试,其中展示的概念也让我们看到这项技术将给医疗领域带来何等革命性的提升。假如未来临床医生都能为个体患者创建精确的数字副本,并利用实时数据跟踪施治效果、支撑诊疗决策,那么每一位病患都将获得最适合自己、治愈几率最高的妥当护理。
Gershater还提到,“而理想的医疗系统离不开极其复杂的结构化数据集。只要掌握了这些数据集,我们就能根据人类组织细胞的患病过程建立起可靠的数字孪生副本。”
进军元宇宙
为了加快临床研究与药物发现速度、提高成功率,生命科学企业正积极寻求技术以填补物理实验与复杂数据分析间的空白。
使用数字孪生创建虚拟副本,还只是当前整体数字化转型趋势中的一小部分。沉浸式计算体验的思路已经得到整个投资行业的高度关注,而伴随着数字化力量的逐步显现与业务流程改进的迫切需求,“元宇宙”概念也开始向着医疗保健领域快速渗透。
Gershater提到,“计算机辅助生物学的本质是一种愿景,认为如果能将前沿数字化与自动化技术引入生物学研发、取代以往高度依靠手动操作的简陋流程,就有望开启一个新的技术时代。届时,实验与流程设计规划将在云端实现,且研发全程都由数字工具提供支持。之后,研究人员可以在高度自动化的实验环境中开展实验,极大增强研究能力。”
尽管元宇宙概念还没有融入生物科学公司的主流认知,但根据Rock Health的分析,越来越多的证据表明投资者正在将注意力转向沉浸式数字技术。根据相关报告,“2021年,投资者在11笔交易中共为美国各尝试整合VR或AR技术的数字健康初创公司提供1.98亿美元资金,总额超过2020年8笔交易筹集到的9300万美元的两倍有余。”
从理论上讲,医疗保健虚拟世界将成为现代数字系统与传统物理交互之间的最佳中介元素。例如,医生可以通过虚拟现实头显在全息环境下练习手术技巧,既支持反复尝试又不会造成资源浪费。
Gershater认为,“数字孪生在元宇宙中的呈现还有望启发出更多行之有效的生物学方法。整个过程甚至不需要像AI那样大量占用超算资源——只需要能运行起复杂、精密的实验,就足以引导我们一探生物学的奥秘。这些技术与能力其实已经存在,只是还没有为生物学界所采用。”
个性化医疗的未来
虽然数据驱动型研究与医疗具有广泛的理论前景,但其本质上仍是一场成本不菲的冒险。要想成功为复杂的生物实体创建数字模拟副本,其难度将不亚于当初的人类基因组计划。
这可不是危言耸听,两个项目都承载着巨大的野心与抱负。而且正如人类基因组计划帮助我们理解了人类基因组中99.9%的序列表达一样,数字孪生也将极大改变我们在医学发现、研究及诊疗层面的实际能力。
单从原理上讲,数字孪生已经做好了充分准备。但很遗憾,现实永远比想象复杂得多。对Gershater来说,目标的实现必然分为一系列具体环节,每个环节也都建立在上一环节的顺利实施之上。而一旦跨过临界点,行业决策者们将接纳数字孪生与自动化技术做出的激进承诺、并愿意支付成本将其转化为现实。
他最后总结道,“数字孪生与自动化将成为实现个性化治疗的终极组合。实验性数字孪生代表着巨大的飞跃,重塑我们所熟知的基本现实,并推动全人类在生物学、人类生理学乃至对于疾病的本质理解方面再进一步。”