Жорж Нацулис, Нэнси Чжан, Катрина Уэлч, Джон Белл и Ханли П. Джи
Используя возможности глубокого целевого секвенирования секвенаторов следующего поколения, мы разработали новый двухэтапный алгоритм обнаружения инсерций-делеций (IDA), который может определять индели из последовательностей одиночных прочтений с высокой вычислительной эффективностью и чувствительностью, когда индели дробно меньше по сравнению с эталонной последовательностью дикого типа. Во-первых, он идентифицирует кандидатные позиции инделей, используя специфические артефакты выравнивания последовательностей, полученные с помощью программ быстрого выравнивания. Во-вторых, он подтверждает местоположение кандидатного инделя с помощью алгоритма Смита-Уотермана (SW) на ограниченном подмножестве прочтений последовательностей. Мы демонстрируем, что IDA применим к инделям различных размеров из данных глубокого целевого секвенирования в низких фракциях, где индель разбавлена последовательностью дикого типа. Наш алгоритм полезен для обнаружения вариантов инделей, присутствующих с различными аллельными частотами, такими как те, которые могут встречаться в гетерозиготах и смешанной нормальной-опухолевой ткани.