疫情结束之前_全球性疫情要被终结?AI在其爆发之前就能阻止它

去年冬天,随着流感季节的到来,世界各地的医疗机构都在加班。根据美国疾病控制和预防中心(CDC)发布的数据,最近几个月,超过180,000名美国人住院治疗,另有10,000人死亡,而新型冠状病毒(现正式命名为COVID-19)正以惊人的速度在世界各地传播。

疫情结束之前

对全球流感爆发的担忧甚至促使一些大型活动,如2020年移动世界大会(MWC 2020)在开幕前7天就被取消了。但是在不久的将来,人工智能增强的药物开发过程可以帮助以足够快的速度生产疫苗,并在致命病毒变异成全球流行病之前找到防止其传播的治疗方法。

传统药物和疫苗开发方法效率极低研究人员可以花费近10年的时间,通过密集的实验和纠错技术来详细检查每个候选人。根据塔夫茨药物开发研究中心2019年的一项研究,开发一种药物的平均成本为26亿美元,是2003年成本的两倍多。此外,只有大约12%进入临床开发阶段的药物得到了美国食品和药物管理局的批准

佐治亚大学药学和生物医学科学助理教授伊娃-玛丽亚·斯特鲁奇博士指出:“你不能绕过食品和药物管理局,它真的需要5到10年才能批准一种药物。”然而,在机器学习系统的帮助下,生物医学研究者基本上可以颠覆试错法。研究人员可以使用人工智能来对候选化合物的大型数据库进行分类,并推荐最有可能和最有效的治疗方法,而不是手动尝试每种可能的治疗方法。华盛顿大学的计算生物学家约书亚·斯瓦米·米达斯在2019年的一次采访中说:“药物开发团队面临的许多真正的问题不再是人们认为仅仅通过在头脑中整理数据就能解决的那种问题,而是必须有一些系统的方法来处理大量的数据、回答问题并深入了解如何做事。”“

例如,口服抗真菌药特比萘芬于1996年以拉米夫定的名称上市,用于治疗鹅口疮然而,三年来,许多人报告了服用该药物的不良反应。到2008年,已有3人死于肝脏中毒,另有70人患病。医生发现特比萘芬(TBF-A)的一种代谢物是肝脏损伤的原因,但尚不清楚当时它是如何在体内产生的。

是一种代谢途径,十年来一直是医学界的一个谜。直到2018年,华盛顿大学的研究生那乐当(Na Le Dang)对人工智能进行了代谢途径的培训,并要求机器找出肝脏将特比萘芬分解为TBF-阿的潜在途径事实证明,有毒代谢物的产生是一个两步过程,很难通过实验来识别,但利用人工智能强大的模式识别能力非常简单。

事实上,在过去的50年里,已有超过450种药物被从市场上撤下,其中许多会导致像拉米夫一样的肝脏中毒。这促使美国食品和药物管理局推出了Tox21.gov网站,这是一个关于分子及其对各种重要人类蛋白质的相对毒性的在线数据库通过在这个数据集上训练人工智能,研究人员希望更快地确定潜在的治疗是否会引起严重的副作用。美国高级翻译科学中心的首席信息官山姆·迈克尔帮助创建了这个数据库。他解释道:“我们在过去遇到了一个挑战,那就是‘你能提前预测这些化合物的毒性吗?“这与我们筛选小分子药物的做法完全相反。我们不想找到匹配的药物,我们只想说‘嘿,这(化合物)可能有毒“

当人工智能不忙于解决十年的医学谜团时,他们正在帮助设计一种更好的流感疫苗2019年,澳大利亚弗林德斯大学(flinders university)的研究人员利用人工智能为普通流感疫苗的研发提供了一种增强效果,这样当人体接触到它时,就会产生更高浓度的抗体。从技术上来说,研究人员没有“使用”人工智能,而是启动它,让它找到自己的用例路径,因为它完全是在自己设计疫苗。

由弗林德斯大学医学教授尼古拉·彼得罗夫斯基领导,该小组首先建立了人工智能山姆(配体搜索算法)人工智能山姆被训练来区分对流感有效和无效的分子。然后,研究小组训练了第二个程序来产生数万亿个潜在的复合结构,并将这些结构反馈给人工智能萨姆,人工智能萨姆开始决定它们是否有效。

之后,研究小组选择了最优秀的候选化合物并进行物理合成。随后的动物试验证实,增强疫苗比未经修饰的疫苗更有效。最初的人体试验于今年年初在美国开始,预计将持续12个月。如果批准过程进展顺利,强化疫苗可能会在几年内公开上市。对于仅在两年内开发的疫苗来说,这不是一件坏事(而不是通常的5-10年)

尽管机器学习系统能够比生物研究人员更快地筛选大数据集,并通过更脆弱的联系做出准确的知情估计,但在可预见的未来,人类仍将处于药物开发周期中。毕竟,人类需要生成、组织、索引、组织和标记所有的训练数据,并教会人工智能他们应该寻找什么。

即使机器学习系统变得更有能力,当使用有缺陷或有偏见的数据时,它们仍然很容易产生次优结果,就像所有其他人工智能一样“学会遗忘”人工智能的创始人兼首席执行官查尔斯·费舍尔博士去年11月写道:“医学中使用的许多数据集大多来自白人、北美和欧洲人群。”如果研究人员只在机器学习中使用这样的数据集,并找到一个生物标记来预测对治疗的反应,就不能保证生物标记会在更多样化的人群中发挥作用。为了对抗数据偏差的扭曲效应,费希尔提倡使用“更大的数据集、更复杂的软件和更强大的计算机”。"

的另一个重要组成部分是干净的数据,正如凯博泰克首席执行官吉尔·贝克尔博士所解释的那样。Kebotix是一家成立于2018年的初创公司。它将人工智能与机器人技术相结合,设计和开发奇异的材料和化学品。

贝克尔博士解释道:“我们有三个数据源,能够生成我们自己的数据。”我们也有自己的合成实验室来生成数据,然后使用外部数据。“这些外部数据可以来自开放期刊或订阅期刊,也可以来自专利和公司的研究合作伙伴但是贝克尔指出,不管来源如何,“我们花了很多时间来清理它。”

高级翻译科学中心的首席信息官山姆·迈克尔也说:“确保数据具有与这些模型相关的适当元数据是绝对重要的。”此外,这不能随便发生。你必须做出真正的努力。这很困难,因为这个过程既昂贵又耗时。“

大家都在看

相关专题