引言
蛋白质定义为由共价键实现若干种氨基酸相连的多肽链,是生命活动不可缺少的重要物质[1-2],因其高度参与,方使生命体具有活性[3]。分析蛋白质结构与功能对揭秘生物生命奥秘具有极其显著的研究意义[4-6]。
蛋白质分子具有较高的复杂度,直接通过能量函数确定蛋白质分子能量与结构的关系描述难以实现[7],因此,各种优化算法应运而生。谢腾宇等人[8]为了准确确定蛋白质折叠空间结构,设计了两步构象空间搜索框架,该方法虽具有较好的局部搜索性能,但数据处理量很高,难以取得突出的数据处理效率。包晨等人[9]构建的多尺度卷积和循环神经网络预测模型能够充分捕获氨基酸序列局部以及长程特征信息,将其作为多层双向长短期记忆网络的输入,实现蛋白质折叠空间结构的确定。徐胜超[10]提出基于云计算的蛋白质折叠模拟计算,研究了PERM算法的运行流程和面向MapReduce的子任务划分方式。上述方法在蛋白质折叠空间结构预测上是可行的,但受优化算法以及网络训练参数量的影响,使得蛋白质折叠空间结构预测计算量较高,面对庞大规模的数据处理量,如何提高算法执行效率成为当下急需解决的问题。
云计算技术采用虚拟化技术,能高效地聚集多个物理节点并行化方式实现大规模数据的高效处理,在高性能科学计算领域得到了广泛的认可[11-12]。因此,本文提出基于云计算的蛋白质折叠空间结构预测方法,本文云计算平台的软件在版本上比文献[10]已经提高了很多,在精准获取蛋白质构象的同时提高算法的运行效率。
本文详细内容请下载:
http://www.chinaaet.com/resource/share/2000006114
作者信息:
徐胜超,杨波,王宏杰,毛明扬,蒋金陵,蒋大锐
(广州华商学院 数据科学学院,广东 广州 511300)

凡《网络安全与数据治理》(原《信息技术与网络安全》)录用的文章,如作者没有关于汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权等版权的特殊声明,即视作该文章署名作者同意将该文章的汇编权、翻译权、印刷权及电子版的复制权、信息网络传播权与发行权授予本刊,本刊有权授权本刊合作数据库、合作媒体等合作伙伴使用。同时,本刊支付的稿酬已包含上述使用的费用,特此声明。