安徽财经大学:基于支持向量机对代谢综合征的研究
本文首先针对构建人体生命量化动态模型的问题,了解生物分子相互作用和基因的相关知识,分析生物分子相互作用与基因通路之间的联系,利用马尔可夫模型,借助SAS软件编程,构建人体生命量化的动态模型;然后以影响代谢综合征关键通路为目标,分析代谢综合征的诊断依据和病因,借助支持向量机方法、 MATLAB软件编程,建立分析预测模型,分析影响代谢综合征的相关因素,得到有关代谢综合征影响因素关键通路;最后针对代谢综合征风险预测及影响因素的问题,利用Logistic回归方程,借助SPSS软件,建立Logistic回归模型,预测个体患代谢综合征风险,得到影响代谢综合征的相关因素。
针对问题一,利用一类人群的临床检测、基因组、表观基因组、转录组、蛋白质、代谢组等数据,结合NCBI, EBI, DDBJ等公开数据库,分析生物分子的相互作用,基因通路的形成,以及生物分子相互作用和基因通路之间的联系,利用马尔可夫模型,使用SAS软件编程,建立人体生命量化的动态模型。
针对问题二,查阅相关资料了解影响代谢综合征的相关因素,如血压、血脂、血糖、总胆固醇、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇等影响因素,结合临床检测数据,利用支持向量机方法,借助 MATLAB软件编程,建立分析预测模型,预测一类人群患代谢综合征风险的高低,得到有关代谢综合征(一种临床诊断结论)影响因素的关键通路。
针对问题三,给定一个新的人类群体数据集(~10 人),包含了每个个体的基因组、表观基因组、转录组、蛋白质组和(或)代谢组的部分测量,分析个体的基因组,表观基因组,转录组,蛋白质组和代谢组的相关数据,查找和代谢综合征有关的数据和资料,利用logistic回归方程,借助SPSS软件编程,建立Logistic回归模型,预测一类人群患代谢综合症风险的高低,得到影响他们代谢综合征风险的主要因素。
最后,本文还对所建模型中的不确定参数进行了分析、对假设导致的可能误差进行了分析,还对所建模型进行了优点及缺点的评价,并在修正变量的基础上对模型进行了改进,同时在模型的纵向及横向分别进行了推广。本文的特色是利用支持向量机模型筛选出众多变量中对病症最有影响的因素,得到影响代谢综合征的关键通路,再建立Logistic回归模型,预测一类人群患代谢综合征风险的高低。
关 键 词 : 代谢综合征 马尔可夫模型 支持向量机 Logistic
回归模型 MATLAB SPSS