Любке Г.Х., Лорин С., Уолтерс Р., Эрикссон Н., Хиси П., Спектор Т.Д., Монтгомери Г.В., Мартин Н.Г., Медланд С.Е. и Бумсма Д.И.
Обычно исследования ассоциаций по всему геному состоят из регрессии фенотипа по каждому SNP отдельно с использованием аддитивной генетической модели. Хотя существуют статистические модели для рецессивных, доминантных взаимодействий, взаимодействий SNP-SNP или SNP-окружение, бремя тестирования делает оценку всех возможных эффектов непрактичной для данных по всему геному. Мы выступаем за двухэтапный подход, где первый шаг состоит из фильтра, который чувствителен к различным типам основных эффектов и эффектов взаимодействий SNP. Цель состоит в том, чтобы существенно сократить количество SNP, чтобы более конкретное моделирование стало возможным на втором этапе. Мы предоставляем оценку статистического метода обучения, называемого «машина градиентного усиления» (GBM), который можно использовать в качестве фильтра. GBM не требует априорной спецификации генетической модели и позволяет включать большое количество ковариатов. Поэтому GBM можно использовать для изучения множественных взаимодействий GxE, что было бы невозможно в параметрической структуре, используемой в GWAS. Мы показываем в моделировании, что GBM хорошо работает даже в условиях, благоприятных для стандартной аддитивной регрессионной модели, обычно используемой в GWAS, и чувствительна к обнаружению эффектов взаимодействия, даже если одна из взаимодействующих переменных имеет нулевой основной эффект. Последний не будет обнаружен в GWAS. Наша оценка сопровождается анализом эмпирических данных, касающихся морфологии волос. Мы оцениваем фенотипическую дисперсию, объясняемую увеличением числа SNP с наивысшим рангом, и показываем, что достаточно выбрать 10K-20K SNP на первом этапе двухэтапного подхода.