Бернар Икар, Константина Шармпи, Софи Руссо и Жан-Жак Фурнье
Проблема, рассматриваемая здесь, заключается в одновременной обработке нескольких наборов данных по экспрессии генов, возможно, собранных в разных экспериментальных условиях и/или на разных платформах. Используя надежную статистику, был проведен крупномасштабный статистический анализ более 20 наборов данных, загруженных из репозитория Gene Expression Omnibus. Различия между наборами данных сравниваются с изменчивостью внутри данного набора данных. Приводятся доказательства того, что значимую биологическую информацию можно извлечь путем слияния разных источников.