摘要: 基于氨基酸的一种5\|字母分类模型,将蛋白质序列转化为5\|字母序列,再借助序列中1\|字和2\|字的频数,将序列转化为一个30维的向量。通过计算两两向量间的欧氏距离得到物种间的进化距离,进而对两组蛋白质序列进行系统发生分析,结果证实了该方法的有效性。
贾美多,杨闫,张盈盈,李春*. 蛋白质序列基于k\|字的数值刻画及应用
[J]. 浙江农业学报.
JIA Mei\|duo, YANG Yan, ZHANG Ying\|ying, LI Chun*. A numerical characterization of protein sequences based on k\|word and its application
[J]. .