独家|医疗大数据革命背后的数学模型

独家|医疗大数据革命背后的数学模型

作者:赵小文

整理:黄菀

校正:谢俊卿,安柯

本文字数为6718字,建议阅读15分钟

本文从全新的视角,阐释了数学模型在医学大数据革命中的重要作用。

独家|医疗大数据革命背后的数学模型

导读

本文整理自 2017年4月20日晚深圳市艾科赛龙科技股份有限公司CEO赵小文先生,在清华大数据“技术·前沿”系列讲座上的讲义。本次活动于北京清华科技园阳光厅幸福实验室举行,讲座的题目为《医学大数据革命背后的无名英雄——数学模型》。大数据正在重塑医学和医疗领域,赵小文先生通过全新的视角,阐释了数学模型在医学大数据革命中的重要作用。

独家|医疗大数据革命背后的数学模型

谢谢大家热情参与,我是赵小文,来自深圳市艾科赛龙科技股份有限公司,我们是一家创业公司,正处在事业的爬坡期,今天晚上有机会与大家一起来做一个有关医学大数据方面的分享和交流。大数据已经席卷全球,在人类永远追求健康与长寿的主题当中,医学界也无法置身度外。基于解析疾病发生背后的机理、提升诊断的准确性、开发革命性的治疗手段以及提高临床的治疗质量等需求,医学大数据革命已经拉开帷幕。人们对高品质健康的需求,直接推动了数字医学、计算机科学、临床医学的交叉研究与应用,尤其是数据科学的发展。

在这场医学大数据革命的背后,数据价值不断地被挖掘、提升、放大。虽然在海量的数据中有一些已经形成孤岛,但仍有可被挖掘的价值。随着获取技术的提升和计算能力的突破,有关数据的这一场革命,尤其是医学大数据革命已经在酝酿。

在数据研究或者大数据面前,云、超算、智能、AI、大数据、基因组学、蛋白组学、微生物组学、肿瘤的解读、影像、自动化等流行词汇,使得数学模型这个无名英雄被淹没了。挖掘数据背后的真相、提升临床的治疗质量需要精准的解析计算,数学模型不可或缺。

数学模型有很大的作用,有些还没有被我们认知。没有被认知是因为我们对它还没有完全的解析。接下来我就为大家讲解一些数学模型的作用。

数学模型是一个接口,是多数据或多特征相互之间的一个连接关系。分子、细胞、组织、器官本身是生物医学领域的事物,但是它又有多维度的属性。比如说力学与分子的关系,力学与细胞的相互关系,组织与器官的关系,形态学、生理学的相互关系等等。把这些放在一个或多个数据库里面,就构成了一个不同属性的多维的数据库。数学模型则可以作为一个接口把多维数据库嫁接起来。

数学模型是诱导因子。数学模型的构建,促使了隐藏在背后的秘密被发觉,被引导、刺激,再加上一些条件,比如说阈值和参数等,最终体现本质的属性以及背后的逻辑关系。正是因为这种结果导向的出现,所以数学模型其实就是一个诱导因子,刺激了多维度数据的属性表现,最终挖掘出来以后呈现的就是数据价值的表现。

数学模型是一种基因表达。数学模型通过复杂的层层个性化解析、数据的分析,精准地表达出等号后的事物。比如说通过构建数学模型,就像基因组里面一样,把沉默、突变的遗传信息表现出来,再通过编辑把新的东西也精确的表达出来。这也是数学模型的特性、特征和作用。

独家|医疗大数据革命背后的数学模型

数学模型是细胞之间的相互作用。解决实际问题,要从多维度去构建数学模型。比如对于细胞分子学来说,一个细胞的结构有化学的性质,也有力学的性质,还有不同的逻辑关系。通过数学模型的解析,对于数据进行分析和挖掘以后,使潜藏在事物背后的相互作用最后集体表现出来一个属性、一个特征。

独家|医疗大数据革命背后的数学模型

数学模型是组织再生。组织再生在再生医学方面指对于病变或者缺失的组织,经过药物或蛋白,或者是改善免疫系统,让它自身扩增或进行再造修复,最终恢复以前的基本功能。数据和数学模型同样具有这个作用。通过数据的积累和机器的深度学习,数学模型建立以后,把积累的数据和经验再生,产生新的生物学的结构、新的化学键、新蛋白、新药等等。新事物就是数学模型解析以后最终表达的,也就相当于组织再生。

独家|医疗大数据革命背后的数学模型

修复与重建方面,前面讲了几个重要的作用跟它的特质。由于对数据做了比较与校准,数学模型建立以后对于特异性的东西我们有针对性地构建数学模型。利用数学模型进行解析,对数据进行比对跟校准之后,对原来错误的、不明确的信息和隐藏在背后的不是你想要的结果进行修复,最终达到重建的作用,使它完整表现出来。叠加、匹配这些都是数学模型常见的东西,只是用生物学的东西把它表现出来了。逻辑与判断是两个概念,逻辑是事物的先后关系。判断则是一个过程加结果。数据的更新,系统的升级、增量与迭代,还有遗传与进化,这些东西都表现了数学模型的修复与重建的作用。

独家|医疗大数据革命背后的数学模型

现在讲一讲医学实践中综合属性是如何表现的。将一个人体的骨组织的微结构样本,在高倍的显微镜或先进的电镜下进行观察,会在脑海里留下一个初步的印象,即它是什么结构,它正在发生什么。比如,CT可以观察动态的东西,但它到底是什么?有没有被量化?而只有量化才能提供对发病机理的解读,加强诊断的可靠性、改善治疗手段、提高治疗质量。

对骨组织建立数学模型之后,骨组织内部修复过程清晰可见。小山尖一样的东西是无数的干细胞,它不断地向组织进行迁移,通过化学作用在这里进行修复,这种微观的结构能指导你进行判断。构建这一模型通过了复杂的,而非单一的数据。如果说要解决实际的问题,需要构建很多数学模型。若构建的数学模型具有通用性,可以把它作为一个设备使用。比如说我们的影像设备,比如说、CT、核磁还有其他的一些电镜,通过电流、电压,甚至放射剂量的调节来对图形进行清晰的展现,都有通用性。但只有通过数学模型解析,对它赋予属性,才能对软组织、神经血管、骨骼等进行有效的区分。我们通过重建的三维结构,使这些事物得到科学的叠加,来指导我们进行发病机理的研究和临床治疗手段的创新,甚至可以对医生靠经验进行的判断提供可靠的依据。这张图其实是一个微观结构,它微观到了细胞的层面。

独家|医疗大数据革命背后的数学模型

这张图是一个骨小梁的结构。在通常的影像当中,凭感觉经验可以判断它的结构。如果通过数学模型进行构建,首先要对它的认知进行量化,再通过大量比较确认构建出来的是否是其本身。这一比较是有难度的。举例来说,我们常认为的某两人很像,是一种直觉,但其实在人的大脑里,有无数个神经元细胞进行了复杂的运算和多个维度的判断。

独家|医疗大数据革命背后的数学模型

建立数学模型后可以获得一个真实的结构。这张图是一个动物骨骼的修复。对骨结构先进行体外的构建,在植入时与周围相关组织的血管、神经发生相互作用的过程中,引起股骨端接口处骨的刺激,最后达到融合,还要考虑血管的网络化和营养输送[Jun1] 。所以数学模型越复杂,就越有针对性。通用的数学模型可以用来做机器,影像机器、NGS二代测序技术,包括英国剑桥的纳米孔技术,都是通用的算法。这种算法获得的数据是表面的。想要获得更多层面的信息,需要对数据进行深层次解读。而测序设备只能发现所有碱基对之间的关系。精准的数学模型用来解决实际问题,通用的则作为设备。

独家|医疗大数据革命背后的数学模型

这是另外一个动物实验。修复体有些需要受力,有些不需要受力,受力的怎么计算,不受力的怎么计算,这需要大量的计算。而大量的计算需要构建比较精准的数学模型才能理出各种需求之间的关系。

独家|医疗大数据革命背后的数学模型

下面为大家讲一个凤凰卫视和中央电视台报道过的“铁肩担道义”的例子。患者的肩膀是骨肿瘤,已经侵蚀75%的骨质,需要进行截骨手术。为了手术时精准判别组织结构边缘,使患者损失健康的骨质和肿瘤细胞仍然存活的情况都不发生,要通过数学模型来解析。这之后,对于个性化植入也有很多的数学模型需要做,通过大量的运算发现病灶。比如要知晓原本的形态、受力与否、与其他骨组织间的相互作用等,以构建一个科学完整的一个修复体。修复体植入后,又要使其有亲和性,避免引起激烈的炎症反应和排斥反应。通过对原来骨骼的骨质、修复体的弹性模量等进行解析。精准的计算会使愈合的速度变快,并发症、后遗症减少,手术时间减少,并且手术成功率提高。

独家|医疗大数据革命背后的数学模型

假如说我们需要仿生一个物体,就需要构建很多复杂的数学模型。对于整个形态的结构要完整匹配,要进行精准的解析和科学的构建,最后达到相应结构。随着生物3D打印技术、生物制造技术不断的发展,对细胞3D打印的组成部分有效的排列堆积或者是多细胞合理排列的技术也发展特别快。

计算是一种习惯,构建数学模型是一种精神。因为事实隐藏在众多的数据中,背后的真相需要挖掘,挖掘机就是数学模型。遇到问题,需要开拓、创造、不畏惧的精神,才能挖掘出背后的价值。不要把数学模型想得太复杂。如果我们计算一个面积,比如说是正方形,边长是X,X平方就是面积。如果是一个多面体的话,总面积就是正方体几个面的面积和。数学模型不复杂,它不是学习积累了,到时再翻笔记,而是一种精神。你想解读它,就要考虑最终的结果,中间的路径,然后再通过交叉研究或者交叉分析,借助已有的或者自己创造的模型来达到目的。

想要得到表面积就很简单。首先把整个整体看作N个不规则体堆积起来的,计算N个表面积的和。但是,由于很多信息被丢失,和小于真实面积。其实中间还需要大量的计算、模型的建立和解析。比如说组成整体的不规则体参考什么结构、N到底是几等等。我们先取一个具有代表性的体,再进行有效的拟合,对它进行计算、整合叠加、比较最终把一个形状对比变成一个数字对比。通过构建这种数学模型,发现规律,以后解析类似事物时就有参考价值。整个解析过程当中,数据大量的被产生、不断再生、被修复、被重建,最终表达出一个类似样本。结果很简单,但中间的计算过程相当复杂。

再举一个计算两点间直线距离的例子,方法很多:速度乘以时间,直接测量,比例尺测量放大都可以。但针对两个不规则体在空间当中的距离计算,需以数学模型进行构建。我们可以把不规则体拟合成能挖掘的一个体,两个体中心的距离就是空间距离。进行数据挖掘,找到运行规律。模型可以在教科书或参考文献中找到类似的,也受到前沿研究的刺激、引导、启发。但需要先理解原作者的思想,进行改进,当然建议大家自己构建,通过不断的修改、迭代得到最终的数学模型。

把不规则体拟合为能挖掘的个体,确认中心。还有很多例子,都要通过众多数学模型的建立,得到一个体,根据你需要的事物进行分析、对比。生物学上有很多关于相似性的数学模型,比如说进化树的应用,比如进化方面的数学模型的建立等等。概念对比相对逻辑对比更复杂,实物对比则更容易。距离概念放在非物理关系之间,是一个逻辑,某件事物能不能用得上要先搭建数学模型、再运算和修正,最后确定。这个就是欧氏距离,两者之间距离最短就说明它很相似。这种相似性的运算启发你,要如何借鉴、运算。最终发现我解析构建出的结果经过一系列的组合,跟样本的相似度到了一个值。为了使值达到100%,还要不断的学习、认知,不断的得结论,慢慢靠近最终目的。

大数据就是如此,样本数据有限,但经过大量计算的数据无穷 。如果你构建的模型偏离了最终要表达的结果,造成很大的运算量,浪费资源,需要及时修正以高效地达到目的。下面这个数学模型的构建也是我们的医学实践。

独家|医疗大数据革命背后的数学模型

左上是一个脊柱,红色的是脊髓。在脊柱外科手术中常常会有这样的问题,对于僵硬型的或是复杂的畸形脊柱需要矫正,但是长期的畸形导致脊髓已经发生了短缩、扭曲、叠加,过渡拉伤、拉长等各种其他形态的变化。因此对于手术医生来说,不光要考虑截骨和矫形,还要考虑神经的安全性。为此需要神经科与骨科医生共同参与。如果直接根据数据进行了三维结构的构建,并不能代表整个解剖结构,因为脊柱临床解剖结构具有力线穿引的固定位特性,但切片以后的组织却未必沿着力线科学的分布。为解决这一问题,需要进行数学模型构建,把骨的形状跟脊髓的形态准确的结合,经过大量的计算来实施手术的术前规划,跟术中精确、精准的治疗。

构建一个数学模型并不复杂。长度等于V除以S,这个模型很简单。它代表的意义却非常的准确,下面有一个m,说明它可能是m当中的某一层,它考虑到可能或已经发生的复杂的扭曲、断裂或病变的侵蚀。我们可以将每个体,进行一层层的构建,用微积分达到每个面的准确度,逼近它真实的形态和数据,最终使仿生运算达到一个均值。同时还要根据实际问题自己设定修正的参数,对每一层的面积都进行计算。

右图是关于各种脊髓变量的模型。脊髓的堆积形变的数学模型,扭转的数据模型,髓核压迫导致脊髓发生了病变,还有每个节段间的力学。如果没有建立这些数学模型,很可能会发生手术矫形后脊髓受到机械力的刺激或由于运动过程当中所发生的剪切力的影响,最终又导致形变等事故。脊髓有白质和灰质,虽然灰质跟白质的力学性能不同,但是二者的形变几乎同步,因此就要进行各种运算,确认脊柱在矫形过程当中发生形变,脊髓是否会同样发生形变,所以在考虑截骨矫形的过程,同样考虑到了脊髓的安全性,手术才有把握,手术才能节约时间,更有效的康复。说这些例子,就是说明针对不同的问题和事物,需要去建立个性化的数学模型。在基因组学和蛋白组学已经做到精准医学外科,比如个性化的手术方案和个性化的植入物。

从生物学方面来说,基于这种思路,最终想研究到分子的机理,精准级地配到靶向药。我相信,通过计算科学的发展,和计算能力提高,还有相应政策的支持,科学家不断地研究,必定有所突破。

独家|医疗大数据革命背后的数学模型

这是最近的一个例子。4月18日,哥伦比亚大学、摩根斯坦利儿童医院和深圳儿童医院临床专家组联合做了一个国际合作,严重腿部畸形外翻的儿童,通过手术治疗达到腿的矫正,病理模型和手术导航板技术支持就是深圳市艾科赛龙科技。这名儿童有其他并发症,并且两腿从髋关节到脚部之间的高度差为7厘米。在这一手术的实施过程中,数学模型又立了一大功。

临床权威是医生的经验和技术,无需挑战,也不容挑战,作为支持方,我们要从医学大数据的应用方面,通过数学模型合理科学的配合手术的实施,我们通过计算,把医学问题转化成数学问题。我们和医生做了充分的交流,得知了风险和某些参数,若撇开临床的、生理的、发育的一些复杂的东西不考虑,如何去构建模型解决这个问题呢?刚才前面咱们看到有一个L等于V除以S,受它的启发,我们来构建一个数学模型,目的是截一个复杂的结构,而不拿走骨质,只是在同一个面进行各种旋转匹配,最终达到矫形的角度。这是很困难的,有可能旋转后得不到正确角度造成后遗症和并发症。但在医生的临床经验和精确的计算的配合下,能够达到最好的效果。

这个难题在于一个具有复杂多角度的硬体的东西,要将它截成一个不规则体,它的原位还不要发生变化,只是经过各种旋转以后就要达到角度的恢复,其实这是数学计算。体绝对不规则,不是完整的线性,上下面不规则,这个跟刚才前面讲那个数学模型有异曲同工之妙。如果有一些经验被量化了,有些数学模型被确立了,就可以反复得到实验。它的数据量越多,结果越准确,可靠性越高。在这个过程当中,还有一个基于解剖结构的非常匹配的手术导航板工具,辅助完成这个精确的、非常不规则的截骨。实施手术的是哥伦比亚大学的教授,我们跟他是第一次合作,但他非常熟练的使用了这一工具。年轻医生也也可以做到。因为有科学的证据,科学的计算,科学的手段,它被认可的时候手术就变得相对简单,对于临床来说,这时就不需要一个特别高端、有经验的医生来实施。这一次哥伦比亚大学、摩根士丹利儿童医院与深圳儿童医院的专家联合手术,非常成功。深圳市卫计委第一时间在网站上做了报道,作为一个公益形象工程、国际合作及先进技术应用的成功案例对外进行宣传。

最终,临床专家告诉我们,这个小孩如果手术成功,我们必须将他的畸形校准到135度。在手术过程中,有一个基于解剖结构的匹配度高的手术导航板工具,辅助医生完成这次非常不规则的截骨。手术导航板并不简单。如果我们有精准的数学模型建立,在进行三维重建的时候,由于密度的影响,它的组织属性的影响所丢失的信息做一个准确的还原,先解析再还原,最终可以看到直接拿影像数据进行三维重建以后有组织形态的缺失,当然生理结构也一定缺失很多,如果做一个精准的解析和还原之后,手术中利用导航板精准匹配贴合骨面。

独家|医疗大数据革命背后的数学模型

我们说,由挖掘机—数学模型,这个无名英雄引进的这一场医学大数据的革命正在悄悄的酝酿,它积蓄能量准备跃迁,正在积极通往医学的价值链,重建生态系统。最终大数据一定会弯道超车到达整个医学领域的各个价值链。在这一场革命当中,我们希望医学大数据最终成为人体的一个生命系统。美国的一家公司正在做这件事,它到了分子,到了蛋白,到了细胞层面,它构建了人体的生命系统,用于微观的合成生物学研究。

我之前也说过了很多光鲜的词,把大家的眼球吸引过去了,而这一无名英雄一直默默无声不知疲劳的在计算、在构建。它诱导新逻辑,再生数据,重建价值,表达生命,它体现了多个组织,多个学科,甚至多个生命之间的价值结构。真相背后隐藏的秘密,被无名的英雄所诱导、刺激,最终表达出来的是生命的再生与重建的特性。正如一位伟大的科学家所说,好多东西我们还没有做到,还有很多的局限性,那是因为我们还没有认知它。

这个默默无闻背后的英雄就是我们的算法,就是数学模型,让我们记住它---数学模型,是这场医学大数据革命背后真正的英雄。