Джон П. Якупчак, Джеффри М. Уэллс, Джеффри С. Лин и Эндрю Б. Фельдман
Готовность к биологической защите начинается со способности обнаруживать и реагировать на биологические угрозы на основе точной интерпретации генетической информации с помощью сложных, но простых в использовании инструментов биоинформатики. Микробная криминалистика также позволяет атрибуции образцов микробных патогенов обратно к предполагаемому источнику. Характеристика образцов и прослеживаемость обратно к источнику зависят от идентификации генома конкретных целей в образцах, всестороннего анализа смесей присутствующих популяций и обнаружения основных/незначительных изменений в идентифицированных геномах и сравнения генетического профиля образца с другими образцами. Коммерческие платформы секвенирования следующего поколения (NGS) обещают значительно более высокую чувствительность обнаружения и разрешение образцов судебной ДНК, чем это возможно с помощью методов, используемых в настоящее время. Однако перед применением этих технологий для судебно-медицинского анализа бактериальных образцов крайне важно полностью выяснить преимущества, оговорки и подводные камни NGS для проверки гипотез в сравнительных анализах, поскольку в конечном итоге это потребуется для использования NGS как в качестве следственного инструмента, так и инструмента для атрибуции в судах. Методы: Мы разработали и оценили новые вероятностные алгоритмы для обработки данных метагеномной последовательности из прямого секвенирования образцов для идентификации геномов, присутствующих в смесях. Результаты: Мы представляем конвейер для сравнений образцов без ссылок для улучшения целевой характеристики за пределами одного микроорганизма для характеристики всеобъемлющего содержимого образца. Наши инструменты усиливают статистическую достоверность для отслеживания происхождения образцов и атрибутирования образцов к источнику с вероятностными определенностями для многих целей вместо одного генома. Заключение: В этом исследовании разработана новая стратегия биоинформатики без ссылок для учета и идентификации генетического разнообразия в образцах. Варианты последовательностей должны быть непроизвольно подтверждены как в прямом, так и в обратном чтении со скоростью выше уровня фонового шума машинной ошибки секвенатора. Метрика расстояния сходства сравнивает геномы в диапазоне близких родств. Используя данные о последовательностях от агентов биологической угрозы, мы успешно атрибутировали известные родственные штаммы вместе и исключили близкое родство известных неродственных штаммов. Основными преимуществами этого метода судебной экспертизы являются непроизвольные определения показателей валидности данных и родства, а также возможность сравнивать микробные геномы с референтной базой данных родственных геномов или без нее.