酶功能的识别对理解生命活动的机制、推进生命科学的发展有重要作用。然而现有的酶EC编号预测方法,并未充分利用蛋白质序列信息,在识别精度上仍有所不足。针对上述问题,本研究提出一种基于层级特征和全局特征的EC编号预测网络(EC number prediction network using hierarchical features and global features,ECPN-HFGF)。该方法首先通过残差网络提取蛋白质序列通用特征,并通过层级特征提取模块和全局特征提取模块进一步提取蛋白质序列的层级特征和全局特征,之后结合两种特征信息的预测结果,采用多任务学习框架,实现酶EC编号的精确预测。计算实验结果表明,ECPN-HFGF方法在蛋白质序列EC编号预测任务上性能最佳,宏观F1值和微观F1值分别达到95.5%和99.0%。ECPN-HFGF方法能有效结合蛋白质序列的层级特征和全局特征,快速准确预测蛋白质序列EC编号,比当前常用方法预测精确度更高,能够为酶学研究和酶工程应用的发展提供一种高效的思路和方法。
基于K-SVD字典学习算法(K-singular value decomposition,K-SVD)的压缩感知技术应用在林区微环境监测站中,可极大地减少数据传输数量,从而降低监测站的使用能耗,延长监测站的使用寿命。本文选用空气温度作为实验对象,验证算法的可行性,...
详细信息
基于K-SVD字典学习算法(K-singular value decomposition,K-SVD)的压缩感知技术应用在林区微环境监测站中,可极大地减少数据传输数量,从而降低监测站的使用能耗,延长监测站的使用寿命。本文选用空气温度作为实验对象,验证算法的可行性,并与前人提出的基于离散傅里叶变换基(Discrete fourier transform,DFT)的压缩感知方法进行对比实验。实验结果表明,当稀疏度k相同时,K-SVD算法的平均稀疏化误差始终小于DFT算法,且误差分布范围更加集中;当稀疏度和压缩率均相同时,K-SVD算法的平均重构误差也始终小于DFT算法,且误差分布范围更加集中。在林区微环境监测站中,K-SVD算法具有更好的稀疏表示性能以及重构性能,在降低相同系统能耗的同时,也降低了数据传输的误差。
暂无评论