单细胞捕获平台综述
对单个细胞的分离最基本要求就是:保证捕获的质量。如果用三个词语概况就是:fast、effective、gentle
传统的分离方法是:显微操作(micromanipulation)、激光显微切割(laser capture microdissection)、荧光激活细胞分选仪(fluorescence-activated cell sorting,FACS)。过去的十年许多高效的新方法开发出来,它们不仅仅是作为传统方法的备选,更有望取代传统方法。
新方法基于微流控芯片、液滴、微孔板,并且利用毛细管、磁吸、电场等实现了细胞自动化收集。
单细胞技术可以帮助检测细胞异质性、展示细胞对不同理化性质的复杂反应。另外还能鉴定罕见细胞群体,如:循环肿瘤细胞(circulating tumor cells, CTCs,它是存在于外周血中的各类肿瘤细胞的统称)、与治疗或疾病相关的残留细胞、干细胞等。生命系统的复杂性要求我们要在各个层次进行基因调控研究,包括DNA、mRNA的转录、不同的调控RNA(例如microRNA和一些non-coding RNA)、蛋白、细胞代谢、激素水平等,而且每个水平都有各自的分析手段,于是后来产生了针对单个细胞的多层面分析手段,最常用的就是针对核苷酸的qPCR、RNA/DNA-Seq,针对蛋白的免疫组化(immunohistochemistry,IHC)、定量质谱(quantitative mass spectroscopy, MS),其中RNA-seq就是目前曝光率最高的,因为它增加通量的同时降低了费用。
要做这些分析,首先关心的就是如何在保证最少干扰细胞原始表达量的同时,将细胞收集起来。这些年发展起来的方法、仪器都有各自的优缺点(考虑到时间、通量、价格、空间分辨率等),还有持续开发的(如:Stilla Technologies公司的ddPCR技术--digital droplet PCR-based)。
1.分离细胞的初衷—在混杂群体中找到自己想要的
选择特定类型的细胞经常是根据荧光标记,它包括两种方式:一种是直接使用荧光抗体;另一种是用转荧光基因的蛋白,会发出红、黄、绿颜色,而且只在目标细胞群体中表达。
第一种利用抗体的方法缺点就在于:抗体数量有限(尤其是对研究不多的物种)、在不同细胞群体中可能有交叉反应、背景标记模糊;
第二种方法虽然解决了第一种方法的一些问题,但是找这个合适的特异的marker基因比较困难,尤其是在一些病理条件下,细胞表达量骤增,可能这个marker也会在其他细胞类型中检测到。
这两种都不合适就要利用最粗暴的观察手段,依据大小、形状、在组织中的位置等特征。
2.收集细胞的传统手段
主要有三种:显微操作、荧光激活细胞分选(FACS)、激光纤维切割捕获(LCM),这三种方式都有成熟、标准化的流程。前两种可以在体外或脱离组织条件下分离细胞,LCM需要将细胞或组织固定(因此大多会导致细胞死亡,不过现在也有利用LCM分析活细胞的例子)。另外这三种方法的通量也是不同的,FACS分选细胞非常高效,短时间内就能分选上千细胞;显微操作和LCM方法就非常慢,通量也低。
因为前两种方法需要组织裂解,所以基因的表达可能会受到影响,影响因素也有很多,例如:裂解方法、组织类型、试剂浓度、孵育时间、温度等等,LCM方法因为是直接将RNA固定住,因此它会受这些外部因素影响小一些。不过LCM使用的固定试剂(例如福尔马林)会使RNA产生降解,虽然现在有了不含福尔马林的固定剂,但RNA的质量还是会受到影响。
LCM方法最大的一个优势就是它能记录空间信息,其他两种因为做了组织裂解,所以得到的细胞不知道原来在组织的什么位置;另外一个优点就是残余的组织可以保存留用。不过这个方法需要技术的辅助,既然是切割,那么就存在混进不相关细胞的可能。细胞污染这个问题在显微操作中也会存在,不过它混进来的可能是一点溶剂。既然可能存在“混杂”的问题,那么设置阴性对照就显得很有必要。
这三种方法的具体对比如下图:
分离得到细胞后,一般会收集到裂解缓冲液中,准备后续的scRNA的寡核苷酸barcode结合或质谱技术的镧系元素barcode结合。目前的趋势是将细胞收集和后续反应整合在一个设备中(就像10X的设备),实现end-to-end solution。
3.收集细胞的现代手段
高通量仪器
大多数仪器都配置了微流控的“lab-on-chip”技术,能产生数百万的定制的液滴,其中会包含单个细胞、寡核苷酸(例如用:anchored oligo-dT,目的是捕获mRNA)、反转录试剂(产生cDNA),然后整个文库制备一般会在gel beads中进行(例如10X);另外液滴也可以单纯作为捕获容器,后续的反应及文库制备会在magnetic beads中进行(例如BD)。这种建库测序的技术发展出了:Drop-seq、inDrop-Seq、SCRB-Seq或者公司自己设计的方案。以上的几种方法都是基于poly-A富集mRNA的,因此它们属于3'端建库。
为了将建库测序得到的reads成功回溯到某个细胞,就要在寡核苷酸上“做手脚”。每个细胞分配了一段特定的序列,叫做barcode。来自一个细胞的reads都共享同样的barcode。另外还有一种情况,就是Illumina短序列测序需要扩增,扩增后才能根据cluster(也就是簇,一簇的reads都相同)来增加测序的准确性。当然也就是在PCR这一步,可能会引入偏差(来源:不同的扩增模板的扩增效率不同,从而影响原始的数量比例)。对单细胞来讲,它和bulk 转录组不同,本来reads数量就不多,如果再加上PCR bias的影响,噪音就太大了。于是引入了UMI(unique molecular identifiers,这个molecular就是指cDNA),每个初始cDNA分配一个独特的UMI。如果扩增完发现,有两个reads都属于同一个cDNA molecule,它们的UMI就是一样的,最后定量只会被计数一次
个人思考:PCR也不是十全十美,复制的结果就百分百和初始一样,也会有错误率。同一批cDNA扩增的结果也有可能差几个碱基,那么来自同一个cDNA的两条reads的UMI可能就不一样,差一两个碱基是可能的,因此后续计算的时候,可能会设置一个容错值(可能需要结合UMItools说明书看一下),就是说如果来自同一个cDNA的两条reads结果UMI之差1个碱基其余都一样,那么可能也会判断它们是来自同一个cDNA的。
尽管基于液滴的技术很先进,但是也有局限。最主要的缺点就是RNA捕获效率低,反转录施展不开(因为反转录过程只是发生在非常小的液滴空间中)、液滴很脆弱(泄露有风险),另外当起始细胞数量有限时,细胞捕获效率低。但同时如果起始细胞数量太多,又容易导致douplets现象(一个液滴中包含两个细胞),而且容易堵塞微流控芯片。因此,其他厂商探索了一些方法,利用细胞板(其中包含了成千上万个微孔)捕获大量细胞,并且每个微孔中也是放入了一个连接寡核苷酸的bead。之后的下游操作和基于液滴的方法就相似了。
结论
细胞富集技术(如FACS)和高通量单细胞仪器整合起来是一个趋势,这样可以避免测一大批细胞,最后仅仅用了一小部分,造成各方面的浪费。这样整合起来可以有的放矢,我们可以仅仅选择感兴趣的细胞,然后高通量测序
一大挑战就是细胞质量的控制,目前没有评估单个细胞质量的工具。当然是可以根据bulk 转录组结果的表达量来定一个阈值,对每个细胞进行鉴定,比如看每个细胞中最少表达的基因数量。但不论怎样,这些方法都是后续的检验,我们的样本已经被处理完了,最优解还是测序之前就保证细胞的质量
多个组学联合分析是前景( DNA, mRNA, regulatory RNA, proteins, metabolites),像10X就抓住了这个机会,好像BD也推出了Rhapsody蛋白检测的功能
最后就是针对分析工具整合的期待,还没有一个公认的分析流程出来,只有推广度高低之分,比如Seurat、Scater、Monocle这几个R包就推得比较多,那么说不定未来的标准流程就是它们。
文章来自:2018 Platforms for Single-Cell Collection and Analysis
文章来源:生信星球(公众号),作者:豆豆花花。 内容有删减 转载仅供参考学习及传递有用信息,版权归原作者所有,如侵犯权益,请联系删除。