Илья Ю. Жбанников, Сэмюэл С. Хантер, Мэтью Л. Сеттлс и Джеймс А. Фостер
С появлением секвенирования следующего поколения (NG) стало возможным быстро и недорого секвенировать весь геном. Однако в некоторых экспериментах требуется извлечь и собрать только часть прочтений последовательности, например, при проведении транскриптомных исследований, секвенировании митохондриальных геномов или характеристике экзомов. При наличии необработанной библиотеки ДНК полного генома может показаться тривиальной проблемой идентификация интересующих прочтений. Но не всегда легко включить известные инструменты, такие как BLAST, BLAT, Bowtie и SOAP, непосредственно в биоинформатические конвейеры до стадии сборки, либо из-за несовместимости с входными файлами ассемблера, либо потому, что желательно включить информацию, которая должна быть извлечена отдельно. Например, для того, чтобы включить потокограммы из секвенатора Roche 454 в ассемблер Newbler, необходимо сначала извлечь их из исходных файлов SFF. Мы представляем SlopMap, утилиту биоинформатики, которая позволяет быстро идентифицировать, аналогично предоставленным целевым последовательностям из библиотеки ДНК Roche 454 или Illumnia. Благодаря простому и интуитивно понятному интерфейсу командной строки и форматам выходных файлов, совместимым с программами сборки, SlopMap может быть напрямую встроен в конвейер обработки биологических данных без какой-либо дополнительной работы по программированию. Кроме того, SlopMap сохраняет информацию о флоуграмме, необходимую для ассемблера Roche 454.