Кертис Дэвис, Картик Кота, Венкат Бальдхандапани, Вэй Гонг, Сахар Абубакер, Эрик Беккер, Джон Мартин, Кристин М. Уайли, Радика Кетани, Мэтью Э. Хадсон, Джордж М. Вайнсток Вайнсток и Македонка Митрева
Недавние достижения в технологиях секвенирования нового поколения требуют алгоритмов выравнивания и программного обеспечения, которые могут идти в ногу с возросшим производством данных. Стандартные алгоритмы, особенно поиски по сходству белков, представляют собой существенные узкие места в аналитических конвейерах. В частности, для метагеномных подходов теперь часто необходимо искать сотни миллионов прочтений последовательностей в больших базах данных. Здесь мы описываем mBLAST, ускоренный алгоритм поиска для транслируемых и/или белковых выравниваний в больших наборах данных на основе базового инструмента поиска локальных выравниваний (BLAST) и сохраняющий высокую чувствительность BLAST. Алгоритмы mBLAST достигают существенного ускорения по сравнению с программами Национального центра биотехнологической информации (NCBI) BLASTX, TBLASTX и BLASTP для больших наборов данных, что позволяет проводить анализ в разумные сроки на стандартных компьютерных архитектурах. В этой статье демонстрируется влияние mBLAST на последовательностях, происходящих из микробиоты здоровых людей из проекта «Микробиом человека». mBLAST разработан как подключаемый модуль для замены BLAST для любого исследования, включающего короткие последовательности прочтений и высокопроизводительный анализ. Программное обеспечение mBLAST доступно бесплатно для академических пользователей на сайте www.multicorewareinc.com.