
基于微流体器件的独特特性在许多不同的应用中带来了巨大的进步,包括实验生物学和生物医学研究。然而,这项技术的全部潜力尚未得到充分发挥。高吞吐量系统生成的大量数据需要像生成数据一样高效地进行分析。
在此背景下,机器学习作为一类基于人工智能(AI)的方法,已经被应用于生物技术应用中的数据处理,如液体活检中的疾病检测[2]、单细胞脂质筛查[3]、癌症筛查[4,5]、细胞计数和油包水乳化液大小预测[6]。最近,深度学习显示了分析图像或序列等结构化数据的能力。第一个例子是无标签细胞分类,其中架构识别从预定义特征[7]开始的细胞,或者利用深度网络提取相关特征的能力来改进预测的原始图像作为输入[8-10]。在本文中,我们将讨论深度学习架构分析不同的数据集。
用于生物分析的深度学习架构
无标签的单元格分类可以用最简单的体系结构实现:非结构化数据到非结构化数据。例如,非结构化输入可以是细胞特征的向量(圆度、周长和长轴长度),轴是细胞类型/类别。一个例子是由乔治亚理工学院的陆航研究小组在微流控芯片上对秀丽隐杆线虫的定位和方向,该芯片用于对生物体中的突触点模式进行成像[12]。Vasilevich等人的优秀评论中描述了另一个有趣的应用[13]。

Fig. 1: Fluorescence micrographs of synaptic sites in C. elegans immobilized in microfluidic chip. Image source – [12].
其他深度学习神经网络能够处理序列数据,例如由微流体设备生成的数据。这些类型的网络被称为循环神经网络(rnn),可以根据它们的输出进一步划分:序列到非结构化数据架构在接收顺序输入后产生单个输出。序列是一个向量,其中元素的顺序很重要(例如,序列或图像),而对于非结构化数据,元素的顺序并不重要(例如,细胞特征的向量-宽度,长度等)。在序列到非结构化体系结构的情况下,训练是通过一种称为时间反向传播的技术来实现的。例如,这可以应用于表征微流体软传感器,以解决其局限性,如非线性和响应滞后[14]。Das等人在校准阶段应用深度学习来同时估计接触压力的大小和位置[14]。他们制造了两种不同的传感器来获取数据,其中一种有一个单一的直微通道,在三个部分中有三个不同的横截面积,另一种有一个单一尺寸的微通道,但在不同的位置有三个模式。在不同的速度和压力下,对传感器的多个位置进行了顶面压缩实验。由模块化网络组成的RNN算法能够对压力响应的非线性特征进行建模,并找到压力的位置。

Fig. 2: Different designs and cross-section of soft pressure sensors. Image source – [14].
另一方面,序列到序列的神经网络提供序列数据作为输出。DNA碱基调用就是一个例子:MinION纳米孔测序平台,一种高通量DNA测序仪,可以在数据产生时实时分析数据[15]。从这种类型的神经网络中受益的应用是那些可以通过考虑先前的测量来提高精度的应用,比如通过体积[1]或质量[16]来提高细胞的生长。例如,每个脉冲幅度对应于一个单元格的通过,这意味着输入序列的每个元素都被注释。
可以使用深度学习网络分析图像,该网络可以处理空间分布的数据。这给细胞分类带来了进一步的改进,并且可以直接完成,而不需要事先手动提取特征。用于处理图像的神经网络被称为卷积神经网络(cnn)。用于分析图像的元素是卷积块,它可以被描述为沿图像滑动的滤波器,并在处理的图像区域内输出该滤波器的像素值的加权和,并应用非线性变换。这些卷积层提取特征映射[19]中最主要的值。一个例子是应用深度学习CNN对淋巴细胞和红细胞的二进制群体进行高通量分类[8]。
图像到图像的神经网络在许多应用中使用,但分割图像是一个越来越受关注的领域,因为可以从细胞轮廓开始生成完全分割的图像。例如,在神经细胞分割应用中,目标是将输入图像中的每个像素映射到语料库[21]中存在的许多类中的一个。神经细胞图像被分割成轴突(蓝色)、髓鞘(红色)和背景(黑色)[20]的区域。

Fig. 3: Example of image and corresponding output labels: axon (in blue in the figure), myelin (red) and background (black). Image source – [20].
视频处理和深度学习
这些不同的方法可以一起用于分析视频,例如Buggenthin和同事使用RNN和CNN的组合来识别造血谱系,事实上,他们可以在细胞表达常规分子标记之前预测细胞的分化。第一步是通过应用CNN从亮场图像中提取特征,然后通过考虑之前的帧,将这些数据进行RNN处理以及时跟踪信息。
器官芯片(OOC)和具有深度学习网络的人工智能自主生命系统
深度学习算法可能会对更复杂的系统产生巨大影响,比如器官芯片。OOC是3D微流体设备,提供了复制组织或整个器官并研究其活动和环境的可能性。随着OOC设备的不断发展,大量数据将从组织和器官在体外环境中发育的图像和视频中输入到深度学习网络;此外,可以分析大部分组织和器官,以类似于现代组织病理学分析的方式检测空间异质性[26]。cnn已被用于组织和分类组织形态学信息[27],因此也可用于分析芯片上组织培养的荧光显微图像。

Fig. 4: Automated tiling and classification of 1024×1024-pixel image patches using a trained CNN, global overview of lesion localization can be observed in brown. Image source – [27].
深度学习网络可以应用于新兴的多器官系统领域,以监测单个器官,评估其通信,提供多个OOC系统的实时控制;非常有趣的是,这也可能导致一个多器官系统能够自我调节[28]。
实验设计和控制的深度学习
对于研究需要并行化和多因素控制的复杂环境,深度学习可能是一个很好的资源。Zymerg公司开发了一个网络,可以控制数千个并行的微孔微生物培养,其中算法处理微流体决策,例如注射什么和何时注射。Nguyen及其同事的研究是利用深度学习网络进行实验规划和实验后分析的一个例子,在该研究中,温度、光线、食物供应、各种污染物等不同因素可以对微藻生长进行评估[10]。

Fig. 5: Microphysiological systems platforms and their flow partitioning. Image source – [89].
基于云端的深度学习
微流控即时诊断、食品安全、抗体生产、疗法、疫苗和供应链等领域都可以从深度学习网络的整合中受益。通过向网络提供全球分布的数据,例如,通过基于纸张的分析,深度学习算法可以跟踪、预测并最终控制疫情[30]。
结论
本文介绍了可以集成深度学习网络的不同生物技术应用。特别是微流体和深度学习算法的结合,对于分析高度并行化系统产生的越来越多的数据的能力具有巨大的潜力,这可以以强有力的方式加速研究。最后,在实验室中集成该技术的挑战和成本相对较低。
参考文献
1, Riordon, J. et al. (2014) Quantifying the volume of single cells continuously using a microfluidic pressure-driven trap with media exchange. Biomicrofluidics 8, 011101
2, Ko, J. et al. (2018) Machine learning to detect signatures of disease in liquid biopsies – a user’s guide. Lab Chip 18, 395–405
3, Guo, B. et al. (2017) High-throughput, label-free, single-cell, microalgal lipid screening by machine-learning-equipped optofluidic time-stretch quantitative phase microscopy. Cytometry A 91, 494–502
4, Ko, J. et al. (2017) Combining machine learning and nanofluidic technology to diagnose pancreatic cancer using exosomes. ACS Nano 11, 11182–11193
5, Singh, D.K. et al. (2017) Label-free, high-throughput holographic screening and enumeration of tumor cells in blood. Lab Chip 17, 2920–2932
6, Mahdi, Y. and Daoud, K. (2017) Microdroplet size prediction in microfluidic systems via artificial neural network modeling for water-in-oil emulsion formulation. J. Dispers. Sci. Technol. 38, 1501–1508
7, Chen, C.L. et al. (2016) Deep learning in label-free cell classification. Sci. Rep. 6, 21471
8, Heo, Y.J. et al. (2017) Real-time image processing for microscopy-based label-free imaging flow cytometry in a microfluidic chip. Sci. Rep. 7, 21471
9, Van Valen, D.A. et al. (2016) Deep learning automates the quantitative analysis of individual cells in live-cell imaging experiments. PLoS Comput. Biol. 12, e1005177
10, Gopakumar, G. et al. (2017) Cytopathological image analysis using deep-learning networks in microfluidic microscopy. J. Opt. Soc. Am. A Opt. Image Sci. Vis. 34, 111
11, Das, D.K. et al. (2013) Machine learning approach for automated screening of malaria parasite using light microscopic images. Micron 45, 97–106
12, San-Miguel, A. et al. (2016) Deep phenotyping unveils hidden traits and genetic relations in subtle mutants. Nat. Commun. 7, 12990
13, Vasilevich, A.S. et al. (2017) How not to drown in data: a guide for biomaterial engineers. Trends Biotechnol. 35, 743–755
14, Han, S. et al. (2018) Use of deep learning for characterization of microfluidic soft sensors. IEEE Robot. Autom. Lett. 3, 873–880
15, Boža, V. et al. (2017) DeepNano: deep recurrent neural networks for base calling in MinION nanopore reads. PLoS One 12, e0178751
16, Godin, M. et al. (2010) Using buoyant mass to measure the growth of single cells. Nat. Methods 7, 387–390
17, Jozefowicz, R. et al. (2016) Exploring the limits of language modeling. arXiv
18, Qu, Y.-H. et al. (2017) On the prediction of DNA-binding proteins only from primary sequences: a deep learning approach. PLoS One 12, e0188129
19, LeCun, Y. and Bengio, Y. (1995) Convolutional networks for images, speech, and time series. Handb. Brain Theory Neural Netw. 3361, 1995
20, Zaimi, A. et al. (2018) AxonDeepSeg: automatic axon and myelin segmentation from microscopy data using convolutional neural networks. Sci. Rep. 8, 3816
21, Long, J. et al. (2015) Fully convolutional networks for semantic segmentation. In The IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3431–3440, IEEE
22, Lin, G. et al. (2016) Efficient piecewise training of deep structured models for semantic segmentation. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pp. 3194–3203, IEEE
23, Chen, L.-C. et al. (2016) DeepLab: semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs. arXiv
24, Buggenthin, F. et al. (2017) Prospective identification of hematopoietic lineage choice by deep learning. Nat. Methods 14, 403– 406
25, Yu, H. et al. (2018) Phenotypic antimicrobial susceptibility testing with deep learning video microscopy. Anal. Chem. 90, 6314– 6322
26, Lu, C. et al. (2017) An oral cavity squamous cell carcinoma quantitative histomorphometric-based image classifier of nuclear morphology can risk stratify patients for disease-specific survival. Mod. Pathol. 30, 1655–1665
27, Faust, K. et al. (2018) Visualizing histopathologic deep learning classification and anomaly detection using nonlinear feature space dimensionality reduction. BMC Bioinform. 19, 173
28, Edington, C.D. et al. (2018) Interconnected microphysiological systems for quantitative biology and pharmacology studies. Sci. Rep. 8, 4530
29, Nguyen, B. et al. (2018) A platform for high-throughput assessments of environmental multistressors. Adv. Sci. (Weinh.) 5, 1700677
30, Pandey, C.M. et al. (2017) Microfluidics based point-of-care diagnostics. J. 13, 1700047