摘 要: | 目的:通过对癌症基因表达数据的分析,预测多形性胶质母细胞瘤的驱动基因集。方法:基于主成分分析方法和神经网络,提出一种用于预测多形性胶质母细胞瘤驱动基因的系统生物学模型。首先对实验样本的原始表达谱数据进行预清洗,过滤掉无信息或表达不符合实验要求的表达数据,并对肿瘤表达谱数据进行标准化处理;然后对基因进行划分,相似突变率的基因将被划分到同一块中;最后通过学习神经网络,构建癌症相关基因的调控网络,得出驱动基因的预测集。结果:本研究应用上述模型,对多形性胶质母细胞瘤(glioblastoma multiforme,GBM)驱动基因进行预测。已发表的大量实验结果表明,我们预测出的大部分驱动基因在GBM中起重要作用。结论:我们提出一种对GBM表达谱数据分析的新方法,能够高精度地预测出该疾病的驱动基因,该模型同样能够较好地用于分析其它疾病的表达谱数据。
|