深度学习与微流体学:综述
微流体学深度学习技术简介
基于微流体的设备的独特功能在许多不同的应用领域带来了巨大的进步,包括实验生物学和生物医学研究。然而,这项技术的全部潜力还没有发挥出来据需要像生成过程一样高效地进行分析。
在这方面,机器学习是一类基于人工智能(AI)的方法,已被应用于生物技术应用中的数据处理,如液体活检中的疾病检测、单细胞脂肪筛查、癌症筛查、细胞计数和预测油包水乳状液大小。最近,深度学习显示了分析图像或序列等结构化数据的能力。第一个例子是无标签细胞分类,其中体系结构识别来自预定义特征的细胞或原始图像作为输入,利用深度网络的能力来提取相关特征以改进预测。在这篇综述中,我们将讨论更简单和更复杂的深度学习体系结构,以分析不同的数据集。
用于生物分析的深度学习体系结构
无标签细胞分类可以用最简单的架构实现:非结构化数据到非结构化数据。例如,非结构化输入可以是细胞特性的矢量(圆度、周长和长轴长度),并且轴可以是细胞类型/类别。一个例子是乔治亚理工学院Hang Lu团队在微流控芯片中对线虫的定位和定向,该芯片用于对生物体中的突触小点模式进行成像。在Vasilevich等人的优秀评论中描述了另一个有趣的应用。
图1:固定在微流控芯片中的线虫突触部位的荧光显微照片。
其他深度学习神经网络能够处理顺序数据,例如由微流控设备产生的数据。这些类型的网络称为递归神经网络(RNN),可以根据它们的输出进一步划分:从顺序到非结构化的数据体系结构在接收到顺序输入后产生单一输出。序列是其中元素的顺序很重要的矢量(例如,序列或图像),而对于非结构化数据,元素的顺序并不重要(例如,细胞特性的矢量-宽度、长度等)。在序列到非结构化架构的情况下,训练是通过一种称为时间反向传播的技术来实现的。例如,这可用于表征微流控软测量,以解决其局限性,如响应的非线性和滞后。Das等人在校准阶段应用深度学习来同时估计接触压力的大小和位置。他们制造了两个不同的传感器来获取数据,一个有一个单一的直线微通道,在三个部分中有三个不同的横截面面积,另一个有一个单一大小的微通道,但在不同的位置有三个图案。实验是通过在传感器的更多位置以不同的速度和压力压缩顶面来进行的。由模块化网络组成的RNN算法能够对压力响应具有滞后性的非线性特性进行建模,并能找到压力的位置。
图2:不同设计和截面的软压力传感器
另一方面,序列到序列神经网络提供序列数据作为输出。DNA碱基调用就是一个例子:Minion纳米孔测序平台,这是一种高通量DNA测序仪,可以在数据产生时进行实时分析。从这种类型的神经网络中受益的应用是那些可以通过考虑先前的测量来提高精度的应用,例如通过体积或质量的细胞生长。例如,每个脉冲幅度对应于细胞的通过,这意味着输入序列的每个元素都被注释。
图像可以使用深度学习网络进行分析,深度学习网络可以处理空间分布的数据。这带来了对细胞分类的进一步改进,并且可以直接完成,而不需要事先人工提取特征。用于处理图像的神经网络称为卷积神经网络(CNN)。用于分析图像的元素是卷积块,其可以被描述为沿图像滑动并且在处理的图像区域内输出该过滤器的像素值的加权和并应用非线性变换的过滤器。这些卷积层提取特征映射中最主要的值。一个例子是应用深度学习CNN来高通量地对淋巴细胞和红细胞的二元组进行分类。
图像到图像的神经网络被用于许多应用中,但由于从细胞轮廓开始生成完全分割的图像的可能性,图像分割是一个日益增长的感兴趣的领域。例如,在神经细胞分割应用中,目标是将输入图像中的每个像素映射到语料库中存在的许多类别中的一个。神经细胞图像被分割成标记轴突(蓝色)、髓鞘(红色)和背景(黑色)的区域
图3:图像和相应输出标签的示例:轴突(图中的蓝色)、髓鞘(红色)和背景(黑色)
视频处理和深度学习
这些不同的方法可以一起用于分析视频,例如Buggenhim和他的同事使用RNN和CNN的组合来识别造血系,实际上他们可以在细胞表达常规分子标记之前预测细胞的分化。第一步通过应用CNN从亮场图像中提取特征,然后利用RNN对这些数据进行处理,通过考虑之前的帧来及时跟踪信息。
具有深度学习网络的器官芯片(OOC)和人工智能自主生命系统
深度学习算法可能会对像芯片器官这样更复杂的系统产生巨大影响。OOC是一种3D微流体设备,它提供了复制组织或整个器官并研究它们的活动和环境的可能性。随着OOC设备的不断发展,大量数据将从组织和器官在其体外环境中发育的图像和视频馈送到深度学习网络;此外,可以通过类似于现代组织病理学分析的方式分析大部分组织和器官以检测空间异质性。CNN已经被用来组织和分类组织形态信息,因此也可以用来分析芯片上组织培养的荧光显微图像。
图4:使用经过训练的CNN对1024×1024像素图像块进行自动平铺和分类,可以用棕色观察到病变定位的全局概况
深度学习网络可以在新兴的多器官系统领域实施,以监测单个器官,评估它们的通信,提供对多个OOC系统的实时控制;非常有趣的是,这也可能导致一个可以自我调节的多器官系统。
用于实验设计和控制的深度学习
深度学习可能是研究需要并行化和控制多因素的复杂环境的一个很好的资源。Zymerg开发了一个网络,可以控制数千种平行的基于微孔的培养,其中的算法处理微流控决定,如注射什么和何时注射。使用深度学习网络进行实验计划和实验后分析的一个例子是Nguyen和他的同事的研究,在该研究中,不同的因素,如温度、光线、食物供应和各种污染物,可以评估它们对微藻生长的影响。
图5:微生理系统平台及其流程划分
基于云的深度学习
微流控医疗点诊断学、食品安全、抗体生产、疗法、疫苗和供应链是可以从深度学习网络的整合中受益的领域。通过向网络提供全球分布的数据,例如,通过基于纸张的分析生成的数据,深度学习算法可以跟踪、预测并最终控制疫情。
总结
在这篇简短的综述中,介绍了可以整合深度学习网络的不同生物技术应用。特别是,微流体学和深度学习算法的结合具有巨大的潜力,可以分析由高度并行化的系统产生的越来越多的数据,这可能会以强大的方式加速研究。最后,在实验室中集成这项技术带来了相对较低的挑战和成本
标签:   微流体