单细胞测序(SCS)技术介绍及应用
1.单细胞测序概论
过去二十几年里,随着基因测序技术水平的提高以及千人基因组计划、癌症基因组计划、Meta-Hit计划等重大国际合作项目的相继开展,基因组研究日渐被推向高潮。以“高通量”为特点的第二代测序( next generation sequencing,NGS) 技术和以“单分子测序”为标志的第三代测序( third generation sequencing,TGS)技术,引起组学研究领域的巨大变革。高通量测序仪能够对几十万到几百万条DNA分子同时测序,精确读出数以千亿计( 每1次run) 的碱基,实现了快速、高效、低成本的基因组尺度测序。一般地,高通量测序需要从大量细胞中获取足够的DNA样品,因此测序结果是这些细胞“整体”的一个表征。然而,由于细胞异质性,相同表型的细胞的遗传信息可能存在显著性差异,很多低丰度的信息会在整体表征中丢失。例如,实体瘤样本中提取的总DNA,50% 以上来源于非癌性成纤维细胞、内皮细胞、淋巴细胞或巨噬细胞,使得癌细胞的信号可能被隐藏。另外,自然界中存在大量的难以培养富集的微生物,例如在人体中,90% 以上的微生物都是不能进行体外培养的。由于细胞数目有限,这些微生物的序列信息则很难通过传统高通量测序获得。作为“在单个细胞水平上对基因组进行测序”的单细胞测序技术能够解决上述难题。与传统的全基因组测序相比,单细胞测序不仅测量基因表达水平更加精确,而且还能检测到微量的基因表达子或罕见非编码RNA,其优势是全方位和多层次的。2011年,《自然方法》杂志( Nature Methods )将单细胞测序列为年度值得期待的技术之一,2013年,《科学》杂志(Science)将单细胞测序列为年度最值得关注的六大领域榜首。目前,单细胞测序技术已经初步应用到了海洋微生物多样性以及癌症患者体细胞突变多样性的研究中。我国在单细胞测序领域处于国际领先水平,深圳华大基因率先建立了单细胞外显子组测序技术,应用于骨髓增殖性肿瘤和肾透明细胞癌的研究中,在单个细胞的水平上解析了瘤内细胞遗传异质性,为癌症的发生发展机制及诊断治疗开辟了新方向,并为其他类型肿瘤的研究提供了新思路。
2.单细胞测序技术的原理
单细胞测序主要包括单细胞基因组测序、转录组测序和表观遗传测序,这3种测序类型各具特点和优势,可以从不同角度揭示细胞各个阶段的功能和特性。全基因组测序是对目的细胞的全部基因组序列进行非选择性、均匀扩增,随后利用外显子捕获技术进而使用高通量测序的过程。转录组测序则是获取特定器官或组织在某一状态下的几乎所有转录本,尤其适用于具有高度异质性的干细胞及胚胎发育早期的细胞群体的研究。以NGS为基础的各种表观遗传学测序可揭示基因调控的不同方面,包括DNA甲基化、组蛋白修饰、染色质结合结构和调节蛋白、染色体的空间结构与空间相互作用形成转录复合物的组分。表观遗传改变是可逆的,并决定基因表达和负责细胞的异质性。
3.单细胞测序技术的流程
细胞测序主要涉及4大步骤,包括单细胞分离、核苷酸序列(DNA或RNA)扩增、基因测序和数据分析。
单细胞分离
要对单个细胞进行研究,首先要将目的细胞从生长环境中分离出来,并确保其生物完整性。目前常用的单细胞分离方法有连续稀释法、显微操作法、激光捕获显微切割术( laser capture microdissection,LCM)、拉曼镊子技术( Raman tweezers)、荧光激活细胞分选术( fluorescence activated cell sorting,FACS)和微流控技术( microfluidics)等。连续稀释法操作简单、成本低廉,主要通过连续稀释样品来获取单个细胞。其缺点在于,容易出现分离错误或细胞丢失,不能进行靶向分离。因此,该技术很少用于复杂微生物样品的单细胞分离。显微操作法是借助机械显微操纵仪或可视化镊子分离单个细胞。这种方法不仅操作简单、成本低廉,而且能够进行可视化操作,目前已经应用到许多难以培养微生物的单细胞分离中,例如从白蚁肠道中分离共生体,从水稻土壤中分离苍白杆菌( Ochrobactrum)等。显微操作法虽然实现了可视化分离,但是人力投入大和通量较低等不足限制了该技术的广泛应用;另外,该技术还会对细胞造成机械性损伤。激光捕获显微切割术( LCM)能够直接从组织块中分离单个细胞,广泛应用于临床研究中。该技术首先将组织进行切片、装片和染色处理,进而通过可视化操作分离单细胞。其优势在于,能够保持细胞的形态学结构,保留细胞在组织中的空间位置信息。但是其劣势在于,细胞核容易被刨切而导致染色体片段丢失;另外,该技术由于精确度有限,切割过程中会不可避免的掺入相邻细胞的原生质组分,因此不适用于转录组学分析。拉曼镊子技术结合了拉曼显微光谱学和光学捕获技术,前者能够通过轮廓区分细胞而无需染色,后者利用激光捕获细胞。但这种方法仅限于分析形态学差异较大的细胞群。
目前单个肿瘤细胞分离通常是通过磁珠激活细胞分选(magnetic-activated cell sorting,MACS)或荧光激活细胞分选(fluorescence-activated cell sorting,FACS)技术进行。这两种分离方法的成本较高,但是能满足高通量、自动化的要求。免疫磁珠分离法(immunomagnetic separation,IMS)属于MACS技术,即利用细胞表面抗原能与连接有磁珠的特异性单抗相结合。在外加磁场中,与磁珠相连的带有表面抗原的细胞被吸附而滞留在磁场中,不能与磁珠连接的细胞不在磁场中停留,从而使目的细胞得以快速分离,但操作方法相对复杂。
荧光激活细胞分选技术是目前应用最多的单细胞分离方法,可对单个细胞进行高效和快速分离。FACS平台通过依靠荧光标记信号结合光散射分析参数,对具有异质性的肿瘤组织的单个细胞进行挑选和分析。该法不仅具备高通量的优势,而且可对具有不同表征(如大小、粒度、特异性抗原标记、同位素标记等)的靶细胞进行识别和分离。其最大的缺陷是分选时需要大量的细胞,因此在制备大量细胞悬液的过程中可能降低低丰度细胞的获取率;同时FACS所检测的荧光信号相对较低,部分低表达的标记可能检测困难,存在特定细胞类型丢失的风险;此外,细胞的高速流动可能造成机械性损伤。
另一个新发展的微流控技术(microfluidics)则是通过人为控制流体流动来实现在微尺度上对目的细胞进行分离,主要利用流控通道具备的多种功能对细胞进行分选,如通道本身具有可调节的直径(10~100μm)和多种功能性修饰(如捕获分子、抗体、电极等)。同时微流控装置的细胞污染率低,对样本和试剂损耗少,并且在降低单细胞测序的噪声以及提高基因组扩增一致性方面具有优势,已有相应的商业化平台在推广应用。
细胞溶解与基因组DNA获取
分离得到单细胞后,需要将细胞进行溶解来获取基因组DNA( genome DNA,g DNA)。这一步骤非常关键,g DNA的质量直接影响后续基因组扩增的效果。目前细胞溶解的方法可以分为3大类:物理法( 如超声、冷冻、研磨、剪切、高压和热破坏法)、化学法( 如SDS、triton X-100和极端pH)和酶降解法( 如蛋白酶K和溶菌酶)。细胞溶解方法的选定,需要综合考虑多方面因素,如细胞的类型、下游用途、g DNA纯化难易程度等。
在传统高通量测序流程中,细胞溶解获得的g DNA需要通过进一步纯化后才能用于扩增。但是对于单细胞测序,为了避免g DNA在纯化过程中丢失,目前大部分流程已经省去了这一步骤。在某些基因组中,各位点仅存在1个拷贝,纯化过程中的样品丢失会直接导致扩增产物中的位点缺失,严重影响后续的基因组重建。g DNA纯化步骤的省略,对细胞溶解操作提出了更加苛刻的要求,那些可能与基因组扩增试剂相互作用的溶解试剂都应当避免使用。另外,DNA结合蛋白通常会阻碍模板扩增,需要事先将其切割或变性;蛋白酶(如蛋白酶K和胰蛋白酶)可以高效地溶解DNA结合蛋白,目前广泛用于待扩增模板的预处理中。
全基因组扩增(WGA)
高通量测序至少需要200 ng的DNA样品,而1个细胞中的总DNA一般仅有数匹克,即使使用第3代测序技术可能也无法满足样品量的需求,因此WGA对于单细胞测序是非常必要的。全基因组扩增技术主要分为两种类型:一是基于热循环以PCR为基础的扩增技术,如简并寡核苷酸引物PCR (DOP-PCR)、连接反应介导的PCR (LM-PCR)、扩增前引物延伸反应(PEP)等;一是基于等温反应不以PCR为基础的扩增技术,如多重置换扩增(MDA)和基于引物酶的全基因组扩增(pWGA)。
在这两种类型中,PCR扩增比较经典,但是,对不同的序列来说,PCR扩增的效率存在相当大的偏差,易产生扩增偏倚问题:如富含CG的DNA序列和相应基因座位的非随机丢失,等位基因的非随机丢失,以及与DNA片段大小相关的偏差(倾向于扩增更多短片段),尤其是在应用于单细胞时,大量短片段导致片段间序列丢失,从而使其应用受限。
MDA是目前公认的最好的单细胞基因组扩增技术,它能对全基因组进行高保真的均匀扩增,扩增出10~100kb大小的片段,能提供大量均一完整的全基因组序列。但是MDA也有一些缺点,特别是显著的非特异扩增。另外就是全基因组覆盖度不均匀;等位基因丢失率高(可高达65%);污染或干扰;随机引物与模板结合能力差异导致的扩增偏倚。针对MDA潜在的污染问题(包括外源性或交叉污染),目前主要采取的改进措施是将荧光标记(例如SYBR Green)掺入反应体系中,以便对扩增过程进行可视化的荧光监测。该技术已成功应用于肿瘤单细胞测序;另一项极具创新性的技术MALBAC是由哈佛大学谢晓亮团队研发。与以前的技术相比,MALBAC的最大优势是采用线性扩增方式。其核心技术在于通过五轮MDA预扩增得到完整扩增产物;增加退火步骤达到链内杂交自我锁定,形成闭合的环状分子,避免指数扩增;再通过常规PCR进行扩增。由于此时的模板更加均一,则可达到低偏倚的目的。
基因组测序数据及生物信息分析
对高通量数据的精准解读是基因测序和精准医疗的关键。单细胞数据分析的基本流程与传统序列分析相似,数据分析前首先要移除接头序列(adapter)、连接序列(linker)、标签序列(barcodes)、低质量碱基和污染DNA。然而两者间具有显著差异,传统拼接方法是建立在一定的假设之上,如嵌合序列比例较少,读取深度随基因组呈泊松分布等。而单细胞数据由于表现出不均匀的覆盖度和高比例的嵌合序列,则需要采用不同的分析方法进行数据预处理。一种方法是通过实验方法或计算机算法将核酸文库“标准化”,以降低扩增偏倚性;另外一种方法是将亲缘关系很近的单细胞测序数据进行混合分析。从偏倚性的角度来看,混合分析可以显著地提高样品的平均覆盖度。同时生物信息学分析软件也为数据分析提供了极大的便利,如Smash Cell、Velvet-SC和SPAdes软件等都能在一定程度上克服单细胞数据覆盖度不均的问题,高效地完成序列拼接与测序数据分析。
SCS技术在肿瘤检测中的应用
已有的研究表明,基因或基因组变异是肿瘤发生的根本原因,利用单细胞全基因组测序技术,可以对获取的肿瘤细胞进行更为精确和深入的分析,发现正常细胞与肿瘤细胞差异,了解癌细胞的基因如何突变,以及肿瘤的来源、肿瘤的生长规律、属于哪种基因型等,为早期检测和诊断肿瘤和肿瘤的个体化治疗提供指导。另外,肿瘤的异质性是导致肿瘤耐药性问题的原因。如果能从单个肿瘤细胞水平对肿瘤单细胞进行测序,并找出一个肿瘤在单个细胞上的共同结构,揭露出每个肿瘤细胞的突变规律,这将为药物研究、肿瘤的靶向治疗提供基础。
2008年,美国华盛顿医学院的Ley等完成了对一位50多岁死于急性骨髓性白血病(acute myeloid leukemia,AML)的患者的基因组测序工作。他们利用高级流式细胞术分离出细胞表面CD13、CD33和CD117阳性,但CD34阴性的肿瘤细胞,并检测它的遗传突变。最终在患者的肿瘤DNA中仅发现了10个可能与AML有关的遗传突变,其中8个很罕见,这也是首次发现的与AML有关的基因。通过单细胞分析技术,测得每个肿瘤样本细胞拥有9个突变。
2011年,Navin等利用DOP全基因组扩增及DNA测序对单个乳腺癌细胞进行了拷贝数变异的分析,进而推断出细胞的群体结构和肿瘤的进化过程。但是由于该方法的基因覆盖率较低,而且不能在单个核苷酸的分辨率上评价单个肿瘤细胞的遗传学特征,故并不能检测在肿瘤发展过程中发挥重要作用的单个核苷酸的改变。
2012年,华大基因首次利用以MDA为基础的单细胞测序技术对原发性血小板增多症(essential thrombocythemia, ET)病人的单个骨髓细胞进行了测序并分析,筛查出在ET发病和进展中的驱动基因, 从而证实ET为单克隆来源的疾病。同时,也将该方法与经典方法进行比较,从而建立了具有高敏感性、高特异性、假阳性率低等特点的单细胞测序方法,为分析疾病的遗传学结构特征及克 隆进化过程提供了新的思路。同样的方法也用于分析单个肾癌细胞的单核苷酸突变特征,从而在更高的分辨能力上为评价基因改变的复杂性提供了更为优化的方法。
参考文献:
[1]周莹,黄华艺. 单细胞测序技术及其在肿瘤研究和临床诊断中的应用[J]. 分子诊断与治疗杂志,2017,9(03):147-153+172.
[2]董燕,宋程程,黄鹤. 单细胞测序技术研究进展[J]. 化学工业与工程,2015,32(01):71-78.
[3]Zong C,Lu S,Chapman AR,et al.Genome-wide detection of single-nucleotide and copy-number variations of a single human cell[J].Science,2012,338(6114):1622-1626.
[4]Tang F,Barbacioru C,Wang Y,et al.m RNA-Seq whole-transcriptome analysis of a single cell[J].NatMethods,2009,6(5):377-382.
[5]Navin N,Kendall J,Troge J,et al.Tumour evolution inferred by single-cell sequencing[J].Nature,2011,472(7341):90-94.
[6]Hou Y,Song L,Zhu P,et al.Single-cell exome sequencing and monoclonal evolution of a JAK2-Negative myeloproliferative neoplasm[J].Cell,2012,148(5):873-885.
[7]Xu X,Hou Y,Yin X,et al.Single-cell exome sequencing reveals single-nucleotide mutation characteristics of a kidney tumor[J].Cell,2012,148(5):886-895.
[8]Yu C,Yu J,Yao X,et al.Discovery of biclonal origin and a novel oncogene SLC12A5 in colon cancer by single-cell sequencing[J].Cell Res,2014,24(6):701-712.
[9]Buenrostro JD,Wu B,Litzenburger UM,et al.Singlecell chromatin accessibility reveals principles of regulatory variation[J].Nature,2015,523(7561):486-490.
[10]Shapiro E,Biezuner T,Linnarsson S.Single-cell sequencing-based technologies will revolutionize wholeorganism science[J].Nat Rev Genet,2013,14(9):618-630.
(文章来源: 南开细胞工程 作者:李思宇 转载仅供参考学习及传递有用信息,版权归原作者所有,如侵犯权益,请联系删除)
标签:   单细胞测序
- 上一条液滴微流控技术在生物医学中的应用进展
- 下一条流动化学的优势介绍