当前位置: 首页 > 期刊 > 《中外医学研究》 > 2012年第3期
编号:13183604
基于机器学习方法的MHC结合肽的预测分析研究(2)
http://www.100md.com 2012年1月25日 梅慧 赵文光 朱晓巍 等
第1页

    参见附件。

     图1预测平台功能流程图3.2训练模型的功能实现预测平台利用SVM算法进行模型的训练,并加入增量式训练的思想,使得训练的模型具有更高的准确度。根据L个独立同分布观测样本{(x1,y1),(x2,y2),……,(xL,yL)}求对输入输出之间依赖关系的估计,使它能够对未知样本做出尽可能准确的预测[10]。由SVM最优分类函数的求解过程中可知,从样本集中找出支持向量xi和对应的Lagrange乘子ai,便能构造出分类函数f(x),则关键的步骤在于寻找支持向量[11,12]。支持向量的训练方式就是不断寻找支持向量的过程。寻找支持向量的方法主要分为两个大步骤:(1)选出部分样本点作为工作集,在工作集上通过计算得到初步的支持向量和Lagrange乘子ai。(2)通过检验看剩余工作集中新的样本点是否违反KT条件作为迭代策略的准则修改这些新的节点和ai,把它们的状态改为支持向量或非支持向量,使得错误率在一定范围内,超过阈值便停止迭代[13]。算法的输入为一个dat文件,是用于训练的数据源,包括结合肽、非结合肽各100条,并将它们转换为固定格式,具体的转换方式参照数据预处理模块。通过训练,形成一个模型 ......

您现在查看是摘要介绍页,详见PDF附件