Кристель Рейнс, Лесли Регад, Робер Сабатье и Анн-Клод Кампру
Предсказание конкретных структурных мотивов, связанных с биологическими функциями или структурой, имеет первостепенное значение. Учитывая растущую доступность первичных последовательностей без какой-либо структурной информации, предсказания из последовательностей аминокислот (AA) имеют важное значение. Предлагаемый метод предсказания структурных мотивов представляет собой двухэтапный подход, основанный на структурном алфавите. Этот алфавит позволяет кодировать любую 3D-структуру в 1D-последовательность структурных букв (SL). Сначала основные правила соответствия между AA и SL изучаются посредством генетического программирования. Затем для каждого заранее идентифицированного интересующего мотива изучаются скрытые марковские модели. Наконец, предоставляется вероятность соответствия заданному 3D-мотиву для любой заданной аминокислотной последовательности. Метод применяется к сайтам связывания АТФ для сравнения эффективности нашего метода с другими для классической функции. Затем иллюстрируется способность метода изучать мотивы, соответствующие более редко предсказываемым функциям или другим типам мотивов.