关于CRC算法,高手赐教

关于CRC算法,高手赐教,第1张

文章发表于nature review genetics: Integrative single- cell analysis ,作者是Tim Stuart与 Rahul Satija 。做过单细胞分析的对他们应该不陌生。

scRNA-seq技术的发展契合了研究个体细胞表观遗传、空间研究、蛋白质组与谱系信息的方法需要,这为研究多类型数据的综合方法提出了独特的机遇与挑战。综合分析可以发现细胞之间的模式关系,获取细胞的整体状态信息,产生涵盖不同样本与不同研究手段的数据集。该文重点讨论了单细胞基因表达数据与其他类型的单细胞分析方法的整合。

多模态(Multimodal)数据 :多种类型数据的组合,如RNA与蛋白质数据组合,是一种多维度数据,类似多组学。

单模态 :单个类型数据

Pseudotime :拟时分析

联合聚类(Joint-clustering) :通过联合不同类型数据对细胞进行分组。

典型相关分析(CCA) : 利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。

动态时间规整(Dynamic time warping) :一种局部拉伸或压缩两个一维矢量以校正一个矢量相对于另一个矢量的滞后的方法。

MNNs :标准化基因表达空间中最临近的细胞。聚类用校正批次效应。

梯度推进(Gradient boosting) :一种预测模型算法。

随着分子生物学、微流控与纳米技术的发展,催生了许多类型的单细胞测序技术。过去的方法集中在单模态测量上,如DNA序列、RNA表达量和 染色质可及性 上。虽然这些技术促进了我们对细胞多样性与发育景观的理解,但是它们并不能很好地解析单细胞内分子间互作关系。而这些互作关系是深入探索细胞状态的关键。此外,随着可用数据集规模的快速增长,迫切需要用于标准化与联合分析且考量到批次效应与个体差异的计算方法。

scRNA-seq是应用最为广泛的单细胞测序技术之一。而后出现了一系列互补技术如单细胞基因组、表观基因组和蛋白质组分析技术,涵盖了单细胞基因组测序( Vitak, S A et al, 2017 ; Navin, N et al, 2011 )、染色质可及性( Pott, S, 2017 ; Corces, M R et al, 2016 ; Buenrostro, J D et al, 2015 ; Cusanovich, D A et al, 2015 ; Lake, B B et al, 2018 )、DNA甲基化( Luo, C et al, 2017 ; Smallwood, S A et al, 2014 ; Guo, H et al, 2013 ; Mulqueen, R M et al, 2018 )、膜蛋白( Stoeckius, M et al, 2017 ; Peterson, V M et al, 2017 )、小RNA( Faridani, O R et al, 2016 )、组蛋白修饰( Gomez, D te al, 2013 ; Rotem, A et al, 2015 )和染色体构象( Ramani, V et al, 2017 ; Nagano, T et al, 2013 )等技术。目前已开发出研究单细胞空间结构和谱系信息的方法( Frieda, K L et al, 2017 ; Shah, S et al, 2016 )。

单细胞多模态综合分析方法示意

单模态与多模态分析方法汇总

CEL-seq :线性扩增测序法

CITE- seq :膜蛋白丰度与基因表达水平测定

G&T-seq :基因组转录组测序

LINNAEUS :谱系追踪

MARS-seq :大规模平行单细胞RNA测序

MEMOIR :谱系与空间结构测定

MERFISH :主要是细胞间结构测定

osmFISH :环状单分子荧光原位杂交,空间结构测定

REAP- seq :膜蛋白丰度与基因表达水平测定

scATAC-seq :单细胞空间结构测定

scBS-seq :单细胞甲基化测序

scChIP-seq :单细胞ChIP-seq

scGESTALT :结合CRISPR-cas9的谱系追踪弄方法

scHi-C-seq :测定染色体组装

sciATAC-seq :结合index转座酶的scATAC-seq

sci-CAR :利用index联合分析mRNA和染色质可及性谱

sci-MET :利用index分析单细胞甲基化水平

sci-RNA-seq :结合index的scRNA-seq

SCI-seq :单细胞组合标记测序,检测CNV

scM&T-seq :单细胞甲基化组和转录组测序,可研究未知的DNA甲基化与基因表达之间的关系

scNOMe- seq :核小体占位与甲基化组测序

scRRBS :单细胞限制性代表区域甲基化测序

scTHS- seq :单细胞转座体超敏性位点测序

seqFISH :内含子序贯荧光原位杂交,扩展观测到基因数量

snmC-seq :单核甲基胞嘧啶测序

SNS :单核测序

SPLiT-seq :丐版scRNA-seq

STARmap :原位单细胞测序

理想的实验流程应当全面洞悉细胞的所有方面,包括分子状态、空间构象、胞外环境互作的全部过程。尽管当下技术手段无法做到,但多模态技术与综合计算方法可以是我们离该目标越来越近。文章希望提出整合单细胞转录组学、基因组学、表观组学与蛋白组学的数据统一分析方法,重点在结合其他数据类型分析scRNA-seq数据,尤其是整合来自于同一细胞的不同类型数据。

文章分为四大块,首先探讨了多模态单细胞分析方法,其次研究了不同实验不同数据整合分析,然后讨论了单细胞空间测序数据整合分析方法,最后给出了整合分析方法的前景与必要性。

最初的单细胞分析方法主要关注细胞某状态下的某类分子水平。而现在更引人瞩目的是同时分析单细胞内多种分子以建立更全面的单细胞分子视图。通常这些方法是将scRNA-seq数据与其它分析手段的结合,目前主要有四种策略从单细胞中得到多模态数据:

严格来说这种方法算单模态。

一些scRNA-seq workflow采用流式分选细胞,随后进行scRNA-seq(MARS-seq/Smart-seq/2),这样可以同时获得单细胞与对应的荧光信号,将荧光所表示的蛋白质水平与转录组在同一细胞中关联( Ramsköld, D et al, 2012 ; Jaitin, D A et al, 2014 ; Picelli, S et al, 2013 )。早期研究( Hayashi, T et al, 2010 )利用FACS结合半定量RT-PCR(作者称之为FBSC‐PCR),结合scRNA-seq,明确了细胞表面marker可以区分细胞类型与状态( Wilson, N K et al, 2015 ;该文结合了Smart-seq2),( Paul, F et al, 2015 ;该文结合了MARS-seq)和鉴定稀有细胞的思路。 Paul, F et al, 2015 与 Nestorowa, S et al, 2016 利用该workflow研究发现了小鼠造血祖细胞由转录组定义不同细胞簇的免疫表型, Wilson, N K et al, 2015 则分离了小鼠HSCs,鉴定细胞维持干性相关的表面marker。但是囿于荧光光谱的重叠现象,利用该法测到的每个细胞的参数范围有限。

针对荧光无法分选的部分,FACS显然是不合适的,尤其是需要同时测得单细胞基因组与胞内蛋白的scRNA-seq实验。此时需要物理分离或通过不同tag筛选出不同组分。

G&T-seq通过加入oligo(dT)特异性分离mRNA同时保留基因组DNA从而实现了基因组转录组平行测序( Macaulay, I C et al, 2015 )DR-seq通过则通过加入barcode特异扩增cDNA序列实现基因组转录组平行测序( Dey, S S et al, 2015 )。这使得单细胞基因表达水平与其对应基因型联系起来,深度揭示单细胞间DNA拷贝数变异与染色体重排对下游mRNA丰度的具体关联。这些方法适用于研究体细胞基因高度变异的肿瘤组织。

DNA甲基化与转录组水平结合研究是基于 Macaulay, I C et al, 2015 的G&T-seq和 Smallwood, S A et al, 2014 的scBS- seq技术发展的,同普通BSP一样,用亚硫酸氢钠处理DNA片段随后进行扩增,结合G&T-seq,可以分析同一细胞内的DNA甲基化模式和基因表达数据( Angermueller, C et al, 2016 )。由于DNA甲基化存在不稳定性和异质性,因此若要研究DNA甲基化与基因表达间的关系,则必须将表观基因组变异与细胞间的异质性区别开来。

通过DNA甲基化与转录组关联分析,为启动子甲基化与基因表达间的负相关性提供深层次的证据。此外,利用barcode系统选择性标记基因组DNA与cDNA,结合index系统,可以对数千个单细胞进行染色质可及性与基因表达水平间的关联分析,同时鉴定出影响基因表达的顺式调控元件( Cao, J et al, 2018 )。

关于胞内蛋白与mRNA关联研究,有两种思路可供借鉴。其一( Darmanis, S et al, 2016 )是将FACS sort到的细胞裂解后分离裂解液,分别进行蛋白质与RNA定量。作者采用 PEA (邻近探针延伸分析) 检测蛋白并用RT-qPCR定量,采用qRT-PCR定量mRNA。该法可以同时检测82个mRNA/75个蛋白;其二( Genshaft, A S et al )是将FACS sort到的细胞在微流控芯片中同时进行逆转录和PEA而不分离裂解液。该法可以同时检测96个mRNA/38个蛋白。这两种方法检测的蛋白与mRNA数量与质量均有限。

这些技术的出现表明若将可以细胞信息转化为有序的barcode,我们就可以在分析单细胞转录组时将这些信息同时获取。这种策略不仅适用于分析细胞的自然状态,也适用于大规模基因扰动研究。目前有Perturb-Seq( Dixit, A et al, 2016 )和CRISPR-Seq( Adamson, B et al, 2016 ; Datlinger, P et al, 2017 ; Jaitin, D A et al, 2016 ),他们将scRNA-seq与CRISPR-cas9结合进行遗传筛选,使得研究正向遗传学的大规模基因扰动试验成为可能。具体原理是给单个基因扰动和受到影响的细胞添加barcode,通过scRNA-seq能够鉴定出这两者,从而推断CRISPR靶向基因和由此产生的单个细胞的转录谱间的关系。目前应用在基因调控网络( Dixit, A et al, 2016 )、未折叠蛋白反应( Adamson, B et al, 2016 )、免疫细胞分化发育( Datlinger, P et al, 2017 )和T细胞受体激活( Jaitin, D A et al, 2016 ),非编码区调控元件( Klann, T S et al, 2017 )。此外,还可以结合CRISPR-dcas9系统,扩展到转录调控、表观遗传调控领域中( Thakore, P I et al, 2016 ; Liu, X S et al, 2016 ; Hilton, I B et al, 2015 ; Konermann, S et al, 2015 ; Gilbert, L A et al, 2017 ),18年发展了同时靶向和敲除基因的技术( Boettcher, M et al, 2018 )。

另一个应用是结合CRISPR-cas9的谱系追踪技术。单细胞谱系追踪是去年的大热方向之一,此处提到三种mRNA+lineage方法: scGESTALT 、 ScarTrace 、 LINNAEUS 。这三种方法各有不同,但大体是利用CRISPR-cas9连续切割结合到基因组上的barcode,细胞会用NHEJ来应对这种损伤。但NHEJ容易出错,从而在DNA序列中产生随机突变,这些突变通过细胞分裂进行遗传,结合scRNAseq利用这些突变作为复合barcode来构建组织或器官发育谱系。

另一种略有不同的方法是 MEMOIR ,它结合smFISH与CRISPR-cas9系统,可以同时检测细胞谱系与空间位置。

普通的scRNA-seq流程除了可以做转录本丰度外,还可以进行诸如体细胞突变、遗传变异、RNA isoform等分析。

关于体细胞突变目前已有研究( Lodato, M A et al, 2015 ),该文通过对人大脑的少量单细胞全基因组测序,分析了发生的细胞突变,构建了人大脑神经细胞谱系。作者发现突变大多发生在高转录活性相关位置,这表明可能可以通过scRNA-seq数据来分析神经细胞突变情况,根据转录状态重构神经细胞谱系。此外,分析scRNA-seq数据中的拷贝数变异,可以研究癌症非整倍体与异质性等情况( Tirosh, I et al, 2016 ; Fan, J et al, 2018 )。

单细胞分析也为理解DNA自然变异如何影响基因表达与细胞状态提供了新思路。有研究结合GWAS+scRNAseq,鉴定出了不同个体之间的eQTL( Kang, H M et al, 2018 )。

多模态测序策略正在催生与之相匹配的数据分析方法。多模数据集可以检测到细胞间的细微差异,而单模数据很可能无法做到这一点。由于scRNAseq数据存在dropout,故而它更容易忽略细胞间的细微差别;但与来自同一细胞的其他数据互补分析可以改善这一问题。例如,很难通过scRNA-seq数据区分不同的T细胞亚群,但联合膜蛋白分析则可以显著提高亚群分辨率( Stoeckius, M et al, 2017 ),同样,RNA+chromatin、RNA+methylation联合可能揭示单个细胞间的调控异质性,不再赘述。

单细胞多模态分析思路很可能受到bulk-seq多组学联合分析的启发( Meng, C et al, 2016 ), Argelaguet 开发了一种名为MOFA( multi- omics factor analysis)的方法,该方法在多组学bulk-seq数据中效果良好,同时测试了单细胞DNA甲基化数据与RNA数据联合处理情况,效果也可以。这暗示适用于bulk-seq的多组学数据处理方式可能也适用于单细胞多模态数据。鉴于单细胞数据规模远超bulk-seq,多视图机器学习不失为一种重要的补充手段( Colomé- Tatché, M & Theis, F J, 2018 )。

单细胞多模态研究策略为解析细胞内不同组分间的关系提供了新方法。如CITE-seq和REAP-seq可以轻易鉴别出相关度较低的RNA-protein模块,表明此处存在活跃的转录后调节。还有一个很有意思的是通过测量剪接过的成熟RNA与未剪接RNA的相对丰度,可以建立RNA与蛋白的关联动态模型( La Manno, G et al, 2018 )。

此外,还可以在不同类型数据间建立统计模型。前面提到的sci-CAR文章建立了染色质可及性与基因表达水平间的统计模型,通过染色质可及性数据估计细胞内基因表达水平( Cao, J et al, 2018 ),另一组研究人员建立了gRNA与基因表达水平间的线性回归模型,用以识别细胞应答的前后关系,重构转录网络(Perturb-Seq( Dixit, A et al, 2016 ))。通过这种手段可以研究目标物种复杂的调控网络。

前面主要讲了在同一测序实验同一批细胞进行的多模态数据整合,而不同测序实验数据整合分析才是亟需解决的关键问题。同bulk seq 数据一样,处理批次效应是综合分析不同实验室、不同workflow产出数据的首要问题(SVA包( Leek, J T 2014 ))。然而目前bulk seq水平的处理方法无法处理单细胞数据(( Haghverdi, L, et al, 2018 ,作者用MNN处理数据,该法在 mnnpy 中得到改进); Butler, A, et al, 2018 )。目前最新方法利用 CCA / MNN 可以识别出两个数据集间共有的部分,判定细胞间共有的生物学状态,然后以这些相同状态的细胞为基准消除批次效应。

此处作者介绍了他自己在Seurat V2中开发的方法( Satija, R, et al, 2015 ;),该法用 CCA 鉴别出不同数据集间相同的细胞类型且可以避免出现由批次效应或常规PCA造成的假阳性细胞类型;接下来采用动态时间规整算法校正数据集间细胞密度差异。这两步骤可以将细胞投影到一个低维空间,具有相同生物学状态的细胞相互接近且消除了不同数据集带来的影响。

另一种方法即mnnCorrect,最早用于计算机领域图形识别。该法寻找不同数据集间最接近的细胞,将之判定为潜在的状态相同细胞,随后利用成对MNNs距离计算一个批次参数(batch vector),用以校正原始表达矩阵( Haghverdi, L, 2018 )。

CCA/mnnCorrect在整合处理不同来源的scRNA-seq数据时表现良好。这将极大提升发现稀有细胞、微弱转录差异细胞及与之对应maker的能力( Haghverdi, L, et al,2018 ; Butler, A,et al, 2018 ) 。这为建立一个统一的单细胞参考数据集提供了依据。在此基础上,scRNA-seq数据整合分析得到了快速发展( Hie, B L, et al, 2018 ; Barkas, N et al, 2018 ; Park, J-E, 2018 ; Korsunsky, I et al, 2018 ; Stuart, T et al, 2018 ; Welch, J et al, 2018 )。这种多数据集整合分析的应用远不止用于校正批次效应这么单一。它可以在单细胞尺度上深入比较细胞间的状态,发现细胞对环境及基因扰动的特异性响应,对不同疾病及不同治疗下的患者的测序数据进行标准化。

scRNA-seq数据整合分析还可以扩展至跨物种分析。 Karaiskos,N 比较了两种果蝇早期胚胎的空间基因表达模式,通过构建空间基因表达图谱,该研究系统比较了两个果蝇的同源基因表达谱,鉴定出了彼此间的进化波动。 Tosches 比较了爬行动物与哺乳动物脑细胞间的相关性。 Baron 分析了人与小鼠胰岛细胞scRNA-seq数据,鉴定出了二者间的保守亚群。 Alpert 开发出了cellAlign,在一维水平上比对了人与小鼠的拟时轨迹,发现人胚胎合子激活要比小鼠晚,小鼠中比人活跃的基因皆与蛋白合成相关。跨物种分析未来是光明的,但对于多物种整合分析而言,精确鉴定物种间同源基因是多物种整合分析至关重要的一步。

以细胞分类信息的形式串联不同的scRNA-seq数据集,或者借鉴到自己实验中,是优于合并数据集然后de novo聚类这种方法的。且随着 有参细胞图谱 的开发,这种方式将更加寻常。目前已开发对应方法: scmap- cell & scmap- cluster ,其中scmap-cell 用乘积量化( product quantization )算法进行比对,而scmap-cluster则用于识别未知数据集中的cluster。

利用已有的注释数据集,目前开发的新方法采用 奇异值分解 、 线性判别分析 和 支持向量机 算法来对细胞进行分类。此外,随着引用数据集的大小、范围与深度越来越高,监督聚类在解析细胞类型方面要比无监督聚类强得多。通过以上这些方法,可以更精确地识别并解析细胞亚群。

satija已有相关文章研究: Comprehensive Integration of Single-Cell Data

这一部分讲的是将scRNA-seq数据与其它不同来源和类型数据诸如甲基化、染色质结构等整合分析的方法。

将scRNA-seq数据与其它类型、不同来源的单细胞数据整合分析是无法提取到数据间的共同特征的,因为它们不是一个类型的数据,需要不同的分析方法。这点在基于基因组的数据(如染色质可及性与甲基化数据)与基于基因的数据(如基因与蛋白表达数据)间整合分析尤为明显。但如果这些数据来自于同一类细胞群,由于存在着共同的生物学状态,此时可以联立分析以发现不同数据集类型间的对应关系。

MATCHER 是一种在一维水平上比较不同类型测序数据拟时轨迹的方法。简单来说就是比对不同类型测序数据的拟时轨迹,以确定这些数据集间的对应关系。这种方法可以识别不同数据集间的“等效细胞”而不需预先知道彼此间的对应关系。开发者用scM&T- seq( Angermueller, C et al, 2016 )和scRNA-seq数据做了验证,准确预测了DNA甲基化与基因表达之间的关系。

其他sc-seq数据不同于scRNA-seq数据一样可以借助Marker解析细胞类型,因此可以利用scRNA-seq解析出的细胞信息为其他sc-seq数据分析做参考。有研究( Lake, B B et al, 2018 )对不同脑组织切片进行了单核RNAseq(snRNA-seq)与单细胞转座子超敏性位点测序(scTHS-seq),通过梯度推进算法利用单细胞基因表达谱指导了染色质可及性测序数据集的细胞分类:作者首先鉴别出snRNA-seq数据集与scTHS-seq数据集共有的细胞亚群,训练一个可以将基因表达与染色质可及性数据关联的模型;然后利用该模型去分类scTHS-seq中剩余未被分类的细胞。这种方法可以更细致地对大脑组织中的细胞进行分类。同样,可以整合scATAC-seq数据集来分析单细胞DNA甲基化或转座酶染色质可及性间的细胞分类。

目前正在开发的新方法有利用假定等价特征、或识别在所有类型数据中的假定相关共享特征来进行数据交叉模态分类。 Welch 开发了一种集成非负矩阵分解(iNMF)的方法,名为LIGER,可以跨模态整合数据。他们对同一类型 皮质细胞 分别进行了亚硫酸盐测序(snmC- seq)与scRNA-seq并对其进行了分类。他们假设基因体甲基化与其表达水平负相关从而整合了不同模态测序数据进行细胞分类。在seurat v30中,作者也引入了假定等价特征或关联特征进行多模态整合数据细胞分类的方法。这些方法优点如上所述,即可以利用scRNA-seq的细胞分类信息来指导scATAC-seq数据细胞分类,鉴别出染色质可及性与DNA甲基化的细胞特异模块。

组织中细胞的空间结构常反映出细胞间的功能差异与细胞命运和谱系的差异。不同基因表达引导细胞向不同方向分化,不同细胞精确排列形成不同组织。关键是单细胞实验通常在分析前细胞已被解离,组织原位信息无法保留,scRNA-seq得到的表达谱不能完全反应细胞空间信息。具有相似基因表达谱的细胞可能存在于不同的空间位置中,故而细胞分离过程中空间信息的缺失是很多单细胞实验的主要缺点。结合高分辨率基因表达谱与空间表达图谱 (spatial expression maps) 将细胞空间坐标与基因表达谱联系起来,可以解决这一问题。有两类方法:计算模型或者RNA原位定量,可以同时收集到细胞空间坐标与基因表达值。

可行性分析

近年来,网络管理技术的不断丰富和发展,为本课题的研究奠定了坚实的理论背景和相关技术支持。比如,web service理论在网络管理中的应用,使网络管理中的一些功能的开发实现变得简单易行。同时XML在网络管理中也有很多应用,其中XML schema作为网络接口的大数据量的传输载体,就可以应用到本项目中来存储网络配置信息。

总的来说,在此基础上,根据上述实验方案进行设计研究,思路是清晰的,研究方法是可行的。

四、本研究课题可能的创新之处(不少于500字)

本课题研究主要是为了解决在虚拟化网络管理中网络拓扑的构建问题、网络配置信息的生成问题,以及对虚拟网络可能出现故障及其引起的告警信息效果的模拟。本课题为实现此目标,在策略思想和关键技术上的创新点主要有以下几点。

1、首先,对于网络拓扑结构的生成,这里要研究的是根据网路的一组简单信息,模拟生成出一个网络可能的拓扑结构,这是非常有创新意义的。这里需要提出一个能够根据这些简单信息生成网络拓扑结构的算法,这一算法与现有的网络拓扑生成算法是有很大不同的。

2、在网络配置信息的生成过程中,是根据基本的信息模型,自动生成一组符合信息模型的网络配置信息数据,并且这些数据的关键字段都具有关联关系上的真实性和有效性。这里自动生成一组网络配置信息,破除了网络配置信息生成的局限性,降低了生成的复杂性,是虚拟网络配置信息的生成变得简单,充实而且准确。

3、故障信息的模拟中,可以根据故障,设定了一套衍生规则逻辑,来影响网络的运行效果。这一套逻辑,需要将模拟故障转化成负面的效果,体现在网络中。这需要建立新的仿真模拟的逻辑,提出合理有效的参数比较判断方法。

4、使用面向接口的方法编程仿真,更具灵活性。

综上所述,本课题的研究内容在思想和关键技术上主要有这四点创新之处。

五、研究基础与工作条件(1与本项目相关的研究工作积累基础 2包括已具备的实验条件,尚缺少的实验条件和拟解决途径)(不少于500字)

1、研究工作积累基础

本人所在实验室研究组的主要研究内容为web service接口技术在网络管理中的应用,在学习过程中,我在充分了解、学习了WSDL接口的定义,XML scheme信息模型的定义,有充分的理论知识储备。

另外,本人在研究组的网络管理原型系统构建的项目中,承担过一些涉及网络拓扑构建,网络配置信息呈现,以及网络故障告警信息的模拟检测和呈现工作。具备进行课题研究仿真的实践经验。

对如何进行原型系统开发进行了深入的学习,学习了开发时所需要用到的编程语言,比如java、JSP、XML等语言,为将来的课题模拟的开发工作打下了一定的基础。

所以,对于本课题的提出研究内容和方向,本人具备研究和建立原型系统进行仿真验证的能力。

2、已具备的实验条件及缺少的实验条件和拟解决途径

本课题研究,需要查找网络拓扑生成和故障仿真的相关资料和论文,学校的图书馆和网络资料数据库为此提供强大的支持。另外,对于课题需要仿真的工作,本人可以利用所在实验室研究组的服务器资源,进行实验环境的仿真构建和仿真原型系统的开发,本人所在研究组具备相关研究所用的仿真硬件环境。同时,实验室研究组的老师和同学们,也可以为本课题研究的内容做一些支持和帮助。

但是由于之前缺乏一些对网络拓扑生成算法相关图论知识的深入学习,需要进一步的了解和学习。本人有决心和能力做好这方面的学习和研究。

工科开题报告范文篇3:

基于仿真理论及虚拟化技术的虚拟覆盖网络模型研究

一、立题依据(包括研究目的、意义、国内外研究现状和发展趋势,需结合科学研究发展趋势来论述科学意义;或结合国民经济和社会发展中迫切需要解决的关键科技问题来论述其应用前景。附主要参考文献目录)(不少于800字)

研究目的

现有 Internet 网络功能强大,服务类型多样,但是随着网络规模指数型的增大,以及应用需求的多样化,我们也逐渐开始意识到Internet 正逐渐步入僵化。本文正是在这样的背景下提出了一个基于仿真理论及虚拟化技术的虚拟覆盖网络模型。

研究意义

对虚拟化覆盖网络的研究意义主要在于 Internet 的僵化已经不能适应网络指数级的增长以及用户的多样化服务需求。与此相反,虚拟化覆盖网络却能建立起一个更独立、更安全、更灵活、并能支持地理位置与用户身份分离的网络体系模型。这样,网络能够为用户提供更多的私有网络服务,包括应用层和应用层以下的各种服务。

国内外研究现状和发展趋势

在网络规模日益膨胀的今天,Internet架构已经开始出现僵化,当网络规模增大时,对硬件资源的消耗越来越厉害,而且当用户的需求变得多样化时比如,用户可能需要提供自己的私有服务,或者用户想建立自己的测试环境等,Internet 已不能很好地满足用户的需求。

本文提出的基于仿真理论及虚拟化技术的虚拟覆盖网络模型仍处于研究阶段,只是一个研究的模型。虽然对该网络进行了初步的仿真及性能参数评估,并探讨了该网络模型的实际应用,但要将其真正应用实际生活和科研中,或让其能应用于更多的系统,支持更多的网络新技术,还需要在多方面对虚拟覆盖网络模型进行完善。

二、研究内容和目标(说明课题的具体研究内容,研究目标和效果,以及拟解决的关键科学问题。此部分为重点阐述内容)(不少于2500字)

论文拟研究的方向,主要是为了解决Internet架构逐渐僵化问题、满足用户更多的需求。以仿真理论与虚拟技术为基础,对上述问题进行研究和编程测试,以期构建虚拟覆盖网络模型,以用于信息安全公共服务平台建设。

研究内容

本文首先对现有 Internet 体系结构进行了深入研究,既看到了 Internet 存在的意义,同时也看到了它的局限性,在网络规模日益膨胀的今天,Internet架构已经开始出现僵化,当网络规模增大时,对硬件资源的消耗越来越厉害,而且当用户的需求变得多样化时比如,用户可能需要提供自己的私有服务,或者用户想建立自己的测试环境等,Internet 已不能很好地满足用户的需求。

其次,本文对仿真理论进行了研究,并讨论了现有的一些主流网络仿真工具。

这对本文所提出的网络模型的仿真提供了有力的理论基础和实践手段,也是验证该网络模型可行性的必要前提。

由于虚拟化技术是本文的核心技术,因此,在第三章中还对网络虚拟化技术进行了详细讨论。对该技术的研究,有助于充分利用各种虚拟化技术的优势,建立一个合理的虚拟化网络模型。

在以上的这些研究的基础上,本文在第四章中提出了一个基于仿真理论及虚拟化技术的虚拟覆盖网络模型并给出了详细设计方案。该网络模型旨在使用户能够尽可能多地拥有对自己私有网络的控制权,使他们成为自己的“服务提供商”

该网络模型能够为用户建立起一个具有更高独立性、安全性、灵活性,并具有物理位置与用户身份分离特性的网络,这使得用户能够在自己的私有网络中提供或享用更多种多样的个人网络服务,这些服务不但包括应用层各项服务,还包含了应用层以下的各种服务。该模型的核心主要是基于虚拟化技术建立起来的,其中用到的虚拟化技术包括虚拟路由器技术、虚拟网卡技术、虚拟拓扑技术等等。虚拟设备技术是一种对硬件设备功能的软件仿真技术,而虚拟拓扑技术是指现实网络拓扑在虚拟网络环境中的虚拟映射技术,它能够提供给用户控制自己网络拓扑的接口。

在第五章中本文还讨论了该网络模型的实际应用。它的应用范围十分广泛,既可以用于个人用途,也可以用于组织机构建设网络的情况,还可以用于给网络研究人员对前沿的 网络技术 进行方便而灵活的实验和仿真。特别地,本文在对现有信息安全公共服务平台体系结构进行研究的基础上,给出了该网络模型在该平台中的应用,提出了新一代信息安全公共服务平台体系框架,为进一步发挥信息安全公共服务平台的优越性奠定了基础。

最后,本文采用 ns2 仿真技术对该网络模型进行了仿真,得出了对该网络性能参数的评估。同时还结合利用了 Planetlab 测试床,对该网络模型的系统参数也进行了评估,验证了该网络模型的可行性。

研究目标和效果

本课题的研究目标对应研究内容分为四部分:

首先,讨论了网络仿真技术,包括其研究背景和现有的一些主流网络仿真技术。

然后,着重介绍了虚拟化技术,并对网络虚拟化技术的实际应用进行了深入阐述。

接着,提出了虚拟覆盖网络模型体系结构,详细描述了其中的关键技术、网络模型的建立与实现机制,并给出了具体的网络通信实例。

另外,对该网络模型进行了仿真,并对相关指标进行了性能测试。结合现有的信息安全公共服务平台,提出了新一代信息安全公共服务平台体系结构。

拟解决问题

Internet 的优势是明显的,就是它能够为用户提供大量的服务,但是我们也不得不承认, Internet 的体系结构正使得它变得开始僵化。

首先,随着网络规模不断地增大,对硬件资源的消耗也逐渐开始呈指数级递增,于是即使是对 Internet 架构的很小改动,都会使得部署相当困难。例如,IPv6 虽然已经进入人们的视野很久了,但是由于技术上的原因,IPv6 迟迟不能推广使用。因此,Internet 不利于新型网络架构的研究及部署,它不但对需要大量的硬件资源消耗,而且部署周期相当长。

另外,用户的需求已不仅限于现有的 Internet 服务,他们的服务需求已变得越来越多样化。例如,Internet 的尽力包传送服务并不能满足商业中的关键服务或一些实时应用程序的需求。因此,Internet 已远远不能满足用户多样化的个人网络服务需求。

此外,Internet 的服务由 ISP 服务提供商进行管理和维护,这将使得有时对它的使用变得很不灵活。用户往往希望能够根据自己的需求建立起自己的网络拓扑,提供自己的私有网络服务等等。因此,Internet 不能向用户提供开放式的管理和竞争平台 促使我们去寻求更好的网络架构解决方案,而虚拟覆盖网络模型能够很好的解决这些问题。

三、研究方案设计及可行性分析(包括:研究方法,技术路线,理论分析、计算、实验方法和步骤及其可行性等)(不少于800字)。

研究方案设计

1研究方法

针对本课题的研究内容和特性,达到研究目标和完成毕业论文,采用如下的研究方法:

(1)理论知识准备:采用文献调查法,利用学校图书馆、网上相关学术数据库等资源,来进一步了解具体的仿真理论和虚拟化技术主要内容;(2)改进技术和主要研究点确定:以生成虚拟覆盖网络模型为主要研究点,辅以该模型的模拟仿真研究;(3)技术调研:对课题中涉及的虚拟化技术相关基本原理,以及仿真理论进行学习,然后针对具体的技术方案进行技术调研,确定实现方式;(4)设计技术方案:在理论准备和技术调研的基础上,确定基于仿真理论及虚拟化技术确定技术实现方案;(5)实现并测试:理论与实践相结合,根据设计出的技术方案,对需要改进的关键部分进行仿真,验证方案的可行性;(6)完成论文:整理文献资料、代码和数据等,完成论文。

2、技术路线

首先介绍几种相关的虚拟技术,基于这些虚拟技术,将给出虚拟覆盖网络模型的架构。然后将会进一步讨论具体的设计和实现机制。另外,还给出了两个实例用于说明一个用户组内两个用户成员间的通信过程。

可行性分析

近年来,网络虚拟化技术的不断丰富和发展,为本课题的研究奠定了坚实的理论背景和相关技术支持。比如,虚拟设备技术的应用,这包括虚拟路由器技术(或虚拟交换机技术)和虚拟网卡技术。同时虚拟拓扑技术应用,实现了从现实世界向虚拟世界的映射。

总的来说,在此基础上,根据上述实验方案进行设计研究,思路是清晰的,研究方法是可行的。

四、本研究课题可能的创新之处(不少于500字)

本课题研究主要是为了解决在虚拟化技术下虚拟覆盖网络模型的构建问题,以及对虚拟覆盖网络模型的模拟仿真。本课题为实现此目标,在策略思想和关键技术上的创新点主要有以下几点。

(1)在深入分析现有Internet架构、和主流虚拟化技术的基础上,提出了具有更高独立性、安全性、灵活性,并具有物理位置与用户身份分离特性的虚拟覆盖网络模型,并给出了模型的框架和设计细节。该模型具有很广泛的应用前景。

(2)对现有信息安全公共服务平台体系结构的关键技术及其发展趋势和需求进行了深入分析,结合了本文中提出的虚拟覆盖网络模型,提出了新一代信息安全公共服务平台框架。

综上所述,本课题的研究内容在思想和关键技术上主要有这两点创新之处。

五、研究基础与工作条件(1与本项目相关的研究工作积累基础 2包括已具备的实验条件,尚缺少的实验条件和拟解决途径)(不少于500字)

1、研究工作积累基础

本人所在实验室研究组的主要研究内容为网络虚拟技术的应用开发,在学习过程中,我在充分了解、学习了虚拟化技术的定义,仿真理论的定义,有充分的理论知识储备。

另外,本人在研究组的网络原型系统构建的项目中,承担过一些涉及网络拓扑构建,网络配置信息呈现,以及网络信息的模拟检测和呈现工作。具备进行课题研究仿真的实践经验。

对如何进行原型系统开发进行了深入的学习,学习了开发时所需要用到的编程语言,比如java、JSP、XML等语言,为将来的课题模拟的开发工作打下了一定的基础。

所以,对于本课题的提出研究内容和方向,本人具备研究和建立原型系统进行仿真验证的能力。

2、已具备的实验条件及缺少的实验条件和拟解决途径

本课题研究,需要查找网络虚拟化技术和仿真的相关资料和论文,学校的图书馆和网络资料数据库为此提供强大的支持。另外,对于课题需要仿真的工作,本人可以利用所在实验室研究组的服务器资源,进行实验环境的仿真构建和仿真原型系统的开发,本人所在研究组具备相关研究所用的仿真硬件环境。同时,实验室研究组的老师和同学们,也可以为本课题研究的内容做一些支持和帮助。

但是由于之前缺乏一些对网络拓扑生成算法相关图论知识的深入学习,需要进一步的了解和学习。本人有决心和能力做好这方面的学习和研究。

主要参考文献

[1]喻健坤,杨树堂,陆松年,李铎峰,支持多用户并发访问控制的虚拟网络模型研究,信息技术,2007年第8期,1~2页。

[2] IEEE Std 8021Q-1998, Draft Standard for Virtual Bridge Local Area Networks,May 16, 1997

[3] IEEE Std 8021Q, 2003 Edition IEEE Standards for Local and metropolitanarea networks Virtual Bridged Local Area Networks, May 7, 2003

[4] Dr V Rajaravivarma, North Carolina A&T State University, Virtual Local AreaNetwork Technology and Applications, System Theory, 1997, Proceedings of theTwenty-Ninth Southeastern Symposium on 9-11 March 1997 Page(s):49 - 52

[5] P Ferguson, G Huston, What is a , Technical Report, Cisco Systems, March1998

[6] Stanford High-Performance Networking Group,Stanford Virtual NetworkSystem(VNS)。

[7] Martin Casado, Nick Mc Keown The Virtual Network System, ACM SIGCSEBulletin, 2005, Volume 37, Pages 76 - 80

[8]王涛,用Net Sim组建虚拟网络实验室,长沙通信职业技术学院学报,2005年4卷3期,46-48页。

[9] Galan F, Fernandez D, Ruiz J, Walid O, Use of virtualization tools in computernetwork laboratories, Information Technology Based Higher Education andTraining, 2004 ITHET 2004 Proceedings of the FIfth International Conferenceon 31 May-2 June 2004, Page(s):209 - 214

[10] L Peterson, T Roscoe, The design principles of Planetlab, ACM OperatingSystems Review, 40(1), Jan 2006

题型:选择题,填空题,简答题,名词解释题。

考试内容

一、嵌入式系统开发的基础知识

1、嵌入式系统的特点、分类、发展与应用。

2、嵌入式系统的组成与微电子技术(集成电路、SoC、IP 核等技术的作用和发展)。

3、数字媒体基础(文本、图像和音频/视频等数字媒体的表示与处理)。

4、 网络通信技术(数字通信与计算机网,TCP / IP 协议,互联网接入技术等)。

二、嵌入式处理器

1、嵌入式处理器的结构、特点与分类(不同类型的典型嵌入式处理器及其特点,嵌入式处理器分类等)。

2、ARM 处理器内核的体系结构(工作状态,工作模式,寄存器组织,异常,数据类型与存储格式等)。

3、典型 ARM 处理器内核(ARM9,Cortex-A,Cortex-M,Cortex-R 等的技术特点与应用领域)。

书都差不多~ 关键还在学!

《计算机网络—自顶向下方法与Internet特色 中文版 第三版》点评

解放军理工大学 陈鸣(博导)

当我在1986年第一次研读Andrew S Tanenbaum教授著的《计算机网络》时,计算机网络在我国尚未出现1988年,我国引进国外设备构建了第一个全国性的X25数据网络,使我第一次对网络和协议有了直观深入的认识由于应用不多,虽然该网的国家主干速率仅有48kb/s,但网络仍然很空闲;在随后的几年中,个人计算机的性价比大幅度提高,采用NetWare网络 *** 作系统的10Mb/s以太网迅速升温并普及,证券,金融等部门和国家大型企业率先推行计算机化,从而引发了学习,建设计算机网络的热潮,高校普遍感到有开设《计算机网络》课程的必要性了,尽管那时因特网好像离我国还非常遥远现在,因特网已经进入千家万户,计算机网络这门课程逐步走向研究生的课堂,走向计算机和通信大学生的课堂,直至走向许多专业大学生的课堂国内外网络教材的数量不断增加,但质量良莠不齐;讲解著名的ISO OSI的七层体系结构逐步被讲解因特网体系结构所替代;网络新技术不断出现,知识点不断增多,网络书不断加厚,随之而来出现了教学重点被冲淡的问题……无论如何,计算机网络是计算机和通信两个领域的交叉学科,内容极为复杂,涉及以错综复杂的方式彼此交织的许多概念,协议和技术,计算机网络原理是一门公认的较难教授和学好的课程因此,很多教授和学者都致力于改进计算机网络的教材和教学法

20年多来,我一直在计算机网络领域从事研究和教学工作,几乎每年都担任计算机网络课程的教学任务,包括了从短训班学员,本科生到硕士研究生,博士研究生的各个教学层次为此,我非常关心国内外计算机网络教材的最新发展,每当看到有价值的网络书,我都会毫不犹豫地买下阅读,每每都会有很大收获和体会如果你一定要我用一句话来评论给我留下深刻印象的网络教科书的话,我会说(这可能会导致片面):知识全面,学术严谨是Andrew S Tanenbaum教授的的风格(代表作《计算机网络》,第四版原版由机械工业出版社引进);Douglas E Comer教授对TCP/IP联网基本思想和实现技术有深刻的诠释;Larry L Peterson教授 (代表作《计算机网络:系统方法 第三版》中文版,影印版皆由机械工业出版社2005年出版)则强调网络整体的系统性和普遍原则,有大家风范;谢希仁教授撰写的网络教科书注重网络知识点之间的联系,并与中文读者有天然沟通;James F Kurose和Keith W Rose教授撰写的网络教科书(代表作计算机网络—自顶向下方法与Internet特色第三版即本书)最大亮点的则在于精心选择教学内容和独具匠心的教学法,是高质量的入门级经典之作正如许多专家所指出的那样,该书不仅用作大学本科生和短训班的教材极为适合,而且对网络专业人员也是有价值的参考资料

网络领域的革命性变化必然要导致网络教科书的变化:首先,因特网已经接掌了计算机网络,因此,今天有关计算机网络的问题都必然与因特网联系起来第二,网络中的"高增长领域"目前是网络服务和应用程序,因此必须强调网络应用程序开发Kurose和Ross博士长期参与并见证了这种变化,在教学实践中以独创的自顶向下教学法解决现有网络教科书中存在的问题自从该书的第1版于2001年问世以来,已经被数以百计的大学和学院采用,被译为10多种语言提供给世界上数以万计的学生和专业人士使用在国内,已有许多著名高校选其为计算机,通信等专业的本科生和研究生教材例如,解放军理工大学计算机与网络工程专业本科生自2002年起陆续使用该书第一版,第二版教材,2005年使用该书第三版前5章内容作为本科"计算机网络原理"课程的教材,而后4章内容及前5章要点则作为硕士研究生"计算机网络"课程的基本教材,配合相关实验均取得了良好的教学效果

James F Kurose和Keith W Rose教授的《计算机网络—自顶向下方法与Internet特色》一书的显著特点是:

1 独创的"自顶向下"教学法由于计算机网络的复杂性,长期以来按分层体系结构自下而上讲授网络课程内容似乎已成一种定式该书特别强调应用层,及早激发学生们的学习热情,及早强调DIY(Do-It-Youself) 开发网络应用程序

2 以因特网为研究对象由于因特网的成功,因特网已经成为计算机网络的代名词该书以因特网体系结构的5层模型来组织材料,为学生们的学习热情提供原动力

3 着眼原理计算机网络领域的许多基础性的重要问题已经研究得较为清楚,重点研究这些原则,将使学生获得长"保质期"的知识,在飞速发展的网络研究开发中保持判断力和启发创造力

4 注重教学法为帮助学生们理解关键的技术概念和激发学习积极性,本书包括了许多类比,幽默和实际的例子,引人入胜的历史事件和实践原则,对网络领域声名卓著的创新家们的专访,以及网站上翔实的教学资料和实验内容等

5 及时更新教学内容从2001年第一版到2003年的第二版,至2004年的第三版,本书及时引入重要的最新知识和放弃了许多过时的内容本书第三版反映了网络领域的最新进展,如增加了包括无线网络和移动网络一章,扩充了对等网络,BGP,MPLS,网络安全,广播选路和因特网编址及转发方面的新材料,并修订了习题

6 强调实验教学新版教材增加了一套实用的Ethereal实验,讲解学生们如何亲眼观察网络协议的运行过程和产生的结果的方法;对多个难以理解的网络问题给出了原理性示教;给出编制网络应用程序的具体建议和部分源程序,鼓励大家用多实践的观点来解决网络教学要求理论联系实践的问题

在本书的教学中,由于学时有限和专业词汇的艰涩,学生们普遍感到使用原版教材经过老师讲解,虽然能够理解课程内容但却难以在短期内记住其中的内容,从而导致学习效果不佳该书的中译本能够为缓解在有限时间内有效地学习计算机网络知识(而不是英文本身)的矛盾能起到重要作用

在该书第三版的翻译中,译者改正了书中存在的多处错误与排版错误并得到了原书作者的认可;译者和编辑们经常就某些网络术语的中文标准译法或更准确的译法展开讨论,力图使该教科书的网络专业词汇更加规范机械工业出版社还就与该书配套的实验问题与专家们进行了深入的探讨,在该书的教学资料,实验设计等方面有一系列考虑,这将有助于我国高校教师教好这门课程,也有助于学子们学好这门重要的课,为进一步深入学习计算机网络其他知识打下坚实的基础

特色以及评论:

“本书是书中珍品——Kurose和Ross采用一种新颖的自顶向下方法,使得复杂的网络问题变得井井有条!无论是对学生还是对专业人士该书的价值将是无法估量的。

——leonardKleinrock,加利福尼亚大学洛杉矶分校

“我认为Kurose和Ross与学生们沟通得很好,同时将重点放在基本概念和原则上,而基本概念和原则从长远来看才是真正要紧的。”

——ShivkumarKalyanaraman,Rensselaer理工学院

“对于希望理解因特网实际运行原理的网络专业人士而言,这本书是一个无价的资源。作者采用自顶向下的方法解释了当今通信服务的底层技术,既引人入胜,又易于理解。这是一本必备书籍。”

——JenniferRexford,AT

本书目录:

出版者的话

专家指导委员会

译者序

作者简介

前言

第1章计算机网络和因特网

11什么是因特网

12网络边缘

13网络核心

14接入网和物理媒体

15ISP和因特网主干

16分组交换网络中的时延和分组丢失

17协议层次和它们的服务模型

18计算机网络和因特网的历史

19小结

本书的路线图

课后习题和问题

复习题

习题

讨论题

Ethereal实验1

人物专访

第2章应用层

21应用层协议原理

22Web应用和>

以上就是关于关于CRC算法,高手赐教全部的内容,包括:关于CRC算法,高手赐教、Jordan Peterson 12条生命准则、单细胞综述之整合分析等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zz/9754104.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-01
下一篇2023-05-01

发表评论

登录后才能评论

评论列表(0条)

    保存