
关于gtex数据怎样筛选。
1、通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据,只有区区100个左右的正常对照。
2、这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。这里值得大力推荐的是GTEx数据库,Genotype-TissueExpression(GTEx)。
TCGA与ICGC。
TCGA, 全称为The Cancer Genome Atlas(癌症基因组图谱)。通过其名称我们就知道这个数据库主要做的就是肿瘤相关的数据库。
ICGC,全称International Cancer Genome Consortium(国际癌症基因组联盟)。这个数据库和TCGA的关系,就是ICGC数据库包括了TCGA的数据。另外呢,ICGC也纳入了其他别的地区所做的队列的测序数据。所以如果使用ICGC进行检索的话,我们可以得到更多的数据。
DataTable dt = new DataTable();
dtColumnsAdd(new DataColumn("PreRevDate0", typeof(decimal)));
DataColumn col = new DataColumn();
colColumnName = "PreRevDate1";
colExpression = "ABS(ConvertToInt32(PreRevDate0))";
colDataType = typeof(decimal);
dtColumnsAdd(col);
DataRow dr = dtNewRow();
dr["PreRevDate0"] = -1;
dtRowsAdd(dr);
一个良好的开端就是分析感兴趣基因的突变和其它异常,ICGC数据门户提供了几条研究路线。输入一个基因名称,NCBI登录号,或者Ensembl基因ID,点击基因报告(Gene Report),就能在突变摘要(Mutation Summary)中找到已发现的突变和拷贝数变化,以及迄今为止,这些突变在肿瘤中出现的频率。COSMICsection就在体细胞突变列表下方,包括了点突变,少量缺失,以及插入突变等方面的数据。
一个。
一个数据集就够了,多个数据集合需要合并为一个。一个基于TCGA数据库,不需要注册登录即可进行可视化分析的网页,不需要代码,里面内容十分丰富,提供了最详细的TCGA在线分析展示。
cBioPortal显着降低了复杂基因组数据与癌症研究人员之间的获取障碍,促进快速、直观、高质量地获取大规模癌症基因组学项目的分子谱和临床预后相关性。目前存储DNA拷贝数数据(每个基因的假定,离散值,例如“深度缺失”或“扩增”,以及log2水平),mRNA和microRNA表达数据,非同义突变,蛋白质水平和磷蛋白水平(RPPA)数据,DNA甲基化数据和有限的临床数据。
从数据库筛选和预后有关的突变方法如下:
1、进入官网首页>
以上就是关于gtex数据怎样筛选全部的内容,包括:gtex数据怎样筛选、TCGA和ICGC需要归一化吗、如何利用tcga数据库进行差异的lncrna分析等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)