用AI来表达人类基因组

image.png

然第一个人类基因组花费了数十亿美元和许多的时刻,但现在越来越有可能将您的DNA序列化到约1000美元。虽然可用的数据量陡增,但咱们从中取得见地的才能却有所落后。这意味着当基因组初次测序时,咱们所期望的遗传革新未能完成。

Google正在经过一种称为DeepVariant的新东西来迎头赶上,这个东西运用AI来企图更好地了解咱们的基因组。该体系的方针是在测序数据中自主骤变,特别是将其与随机过错区别开来。这是一个绊倒科学家的使命,但机器学习是抱负的。

这是越来越多的东西的一部分,用于了解遗传数据,VarDict和GATK是该范畴的抢先东西。可是,说DeepVariant是最杂乱的,也许是公正的。

这个项目现已从Google Brain和Verily的方案中分离出来,而且都运用AI来了解快速扩展的医疗数据。它从基因组瓶(GIAB)项目中收成了基因组序列,并用它来练习他们的AI算法,直到它能够高度精确地解说数据停止。

大数据

这是Google本年的项目。本年早些时候,他们的Verily arm发起了一个新的合资企业,以史无前例的办法将大数据剖析应用于医疗保健范畴。

这项名为“基线项目”的项目旨在招募1万人参加一项多年的研讨,寻觅心脏病和癌症的猜测目标。参加者将经过学习手表进行广泛的监测和测验,以实时记载他们的活动水平。除了手表的读数之外,参加者还将承受X光和心脏扫描,并在4年内定时对其基因组进行测绘并进行血液测验。

这个团队说:“没有人对这么多的人做过这样的深度潜水,这个深度从未被测验过。“这是为了让子孙来发掘它,提出问题,而不预先假定问题是什么。”

我现已写了许多关于数据在医疗保健研讨中日益增长的效果,而Google正在开发根底设施来运用和支撑这一点。这项研讨将测验尽可能多地获取信息,参加者可能会花费1亿美元以上的项目自愿服用大便,唾液,乃至泪液样本。

基因组洞悉

但是,他们并不是仅有运用这种办法来企图让咱们更好地了解遗传数据的人。上一年,加州大学____分校发布了一个新的查找引擎,旨在使咱们更简单查找咱们的基因组数据记载。

查找引擎GeNemo现已在最近宣布的论文中被记载,意图是使查找功用基因组数据更简单。

功用基因组学数据是有价值的,由于它有助于记载每一片基因组的活动范围。新的查找引擎期望能够协助研讨人员揭开咱们以为对疾病担任的基因组某些部分的各种功用方面。

查找引擎答应用户查询一系列数据库,包含整个ENCODE数据集。查找算法运用形式匹配比传统的根据文本的查找供给更丰厚的成果。

瑞士创业公司Sophia Genetics能够说是这个范畴的商场领导者。他们宣称具有世界上最大的临床基因组学社区,具有一个以人工智能为动力的渠道,协助了解所搜集的基因数据。

该公司最近在Balderton Capital的领导下筹集了3000万美元的资金,在53个国家的334家医院中布置了他们的渠道。迄今停止,他们现已设法剖析来自世界各地的超越125,000名患者。

隐私问题

Sophia办法的一个吸引人的方面是他们只处理医院自己搜集的匿名数据。Verily并没有对他们的Baseline Project做些什么,数据的具有权直接与Google自己保持一致。

阿尔伯塔大学一对健康法令研讨人员最近在“ PLOS生物学”上宣布的一篇文章以为,整个职业现在缺少根本的法令和品德准则,现在只要在取得更多的基因组数据的情况下才会加重。

经过英国生物银行等项目,研讨人员能够展开与数十万参加者的项目。但是,环绕这些样本的所有权问题以及参加者对其运用的赞同依然存在。作者以为,咱们需求在这个范畴真实的方针运动来处理这些问题,特别是在这个职业越来越多的情况下。

“世界研讨界现已在一个有可能溃散的根底上建立了一个巨大而多样的研讨根底设施,这个根底可能会被更多的人清晰地认识到现在的实践与实际法令,研讨道德和大众认知。“他们说。

在Sally Davies教授最近宣布的关于英格兰NHS基因组效劳供给现状的文章中,这个论题引起了很大的重视。

该陈述检查了基因组学明显改进国家健康的潜力。它供给了在筛查,疾病诊断和个性化防止效劳等方面潜力的清晰依据。

本文持续着重根底设施,大众参加,研讨安排和供给效劳等范畴存在的严峻不足之处,然后就怎么处理这些距离以及怎么扩展基因组效劳供给清晰的主张。

很明显,这是一个正在阅历一些适当敏捷改变的范畴,因此在未来几年将是一个值得重视的范畴。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.terrorinorlando.com/jingyan/45.html