Тенгфэй Инь, Махбубул Маджумдер, Ниладри Рой Чоудхури, Дайэнн Кук, Рэнди Шумейкер и Мишель Грэм
При анализе данных РНК-Seq соевых бобов первоначальное тестирование значимости с использованием одного программного пакета дало сильно отличающиеся списки генов от тех, которые были получены с помощью другого. Как это могло произойти? В этой статье показано, как были исследованы расхождения между результатами, и как это можно объяснить. Этот тип противоречия может возникнуть в более общем случае при высокопроизводительном анализе. Для изучения подгонки модели и проверки гипотез мы реализовали интерактивную графику, которая позволяет исследовать влияние оценки дисперсии на общую оценку дисперсии и дифференциальных тестов экспрессии. Кроме того, мы предлагаем новую процедуру для проверки наличия любой структуры в биологических данных.