Го-цзин Лян и Сяодун Ван
Предсказание вторичной структуры белка из его аминокислотной последовательности является важным шагом на пути к предсказанию его трехмерной структуры. В то время как многие из существующих алгоритмов используют сходство и гомологию с белками с известными вторичными структурами в Protein Data Bank, другие белки с низкими мерами сходства требуют подхода с одной последовательностью для обнаружения их вторичной структуры. В этой статье мы предлагаем алгоритм, основанный на детерминированном последовательном методе выборки и скрытой марковской модели для предсказания вторичной структуры белка с одной последовательностью. Предсказания делаются на основе оконных наблюдений и взвешенного среднего по возможным конформациям в пределах окна наблюдения. Показано, что предлагаемый алгоритм достигает лучшей производительности на реальном наборе данных по сравнению с существующим алгоритмом с одной последовательностью.