Сяоли Цзяо, Синь Чжэн, Лян Ма, Гита Катти, Эмиль Гогинени
PacBio RS, новая платформа секвенирования ДНК третьего поколения, основана на технологии секвенирования одной молекулы в режиме реального времени с использованием нано-нитч-технологии, которая может генерировать очень длинные считывания (до 20 кб) в отличие от более коротких считываний, производимых технологиями секвенирования первого и второго поколения. В качестве новой платформы важно оценить частоту ошибок секвенирования, а также параметры контроля качества (QC), связанные с данными последовательности PacBio. В этом исследовании смесь из 10 ранее известных, тесно связанных ампликонов ДНК была секвенирована с использованием платформы секвенирования PacBio RS. После выравнивания считываний кольцевой консенсусной последовательности (CCS), полученных из вышеуказанного эксперимента по секвенированию, с известными референтными последовательностями мы обнаружили, что медианная частота ошибок составила 2,5% без контроля качества считывания и улучшилась до 1,3% с помощью метода многопараметрического контроля качества на основе SVM. Кроме того, сборка De Novo использовалась в качестве нисходящего приложения для оценки эффектов различных подходов QC. Это сравнительное исследование показывает, что даже несмотря на то, что чтения CCS исправляются после ошибок, все равно необходимо выполнять соответствующий контроль качества для считываний CCS, чтобы получить успешные нисходящие результаты биоинформатического анализа.