残基对的相互作用描述了蛋白质三维结构中一对残基的空间距离关系.一对残基是否相互作用不仅取决于这对残基的本身属性,还受到这对残基所在蛋白质的所有其它残基的影响.传统的残基相互作用预测方法往往选取要预测残基对本身以及它们各自邻居的残基属性作为特征,这些方法忽略了影响残基对相互作用的全局因素.本文使用双向LSTM(Long Short-term M emory)抽取蛋白质序列上每个残基的属性,通过这种方式得到的每个残基属性不仅包含了局部属性还包含了全局属性.实验结果表明我们的模型在多个基准测试集上的Acc(Accuracy)超过其它方法 10%以上.
RNA二级结构的打分函数在RNA二级结构预测中扮演着越来越重要的角色。目前对RNA二级结构的打分函数并没有很好地抓住RNA的折叠机制。我们认为递归神经网络层与层之间的信息传递方式和RNA的折叠方式有相似之处。提出使用双向LSTM(Long Short term Memory)神经网络对RNA二级结构进行打分。在数据集ASE(长度小于500),以及CRW(大部分长度大于1 000)上,进行了三项实验。通过拟合SEN(Sensitivity)与PPV(Specificity)打分函数确定了在目标函数为mean_squared_error时拟合效果最好;进而对比较复杂的打分函数MCC(Matthews correlation coefficient)进行拟合;最后实验得出双层双向LSTM模型的结果优于单层双向LSTM模型的结果。通过实验,得到的打分函数包含了碱基序列的全局属性。实验结果表明LSTM深度神经网络模型可以很好地拟合RNA二级结构的打分函数。
暂无评论