Судешна Гуха Неоги, Мария Крестьянинова, Миша Капушеский, Ибрагим Эмам, Алвис Бразма, Угис Сарканс
Диапазон различных «омических» технологий для измерения свойств биомолекулярных объектов (например, транскриптов, белков, метаболитов) в биологических образцах с высокой пропускной способностью продолжает расти. Необходимы информационные системы, обеспечивающие комплексное исследование результатов таких экспериментов. Мы разработали систему MoDa (хранилище молекулярных данных), которая обеспечивает единую структуру для поиска и визуализации результатов различных экспериментальных методов молекулярной биологии. Архитектура хранилища оптимизирована для различных типов фильтрации и запросов аннотаций образцов, экспериментальных результатов и свойств генов и других молекулярных объектов. Реализация основана на технологии BioMart с улучшенными средствами для манипулирования многомерными данными. Пользовательский интерфейс представляет собой веб-приложение. Важным соображением для каждого проекта по хранению данных является сбор и очистка данных. Чтобы гарантировать, что данные, загруженные в хранилище, являются согласованными и достаточно хорошо аннотированными для дальнейшего статистического анализа, мы реализовали репозиторий для данных образцов и субъектов исследования, экспериментальных метаданных и экспериментальных результатов. Для предоставления единой системы ссылок для собранных данных по измерению биосущности («ген») использовался конвейер генной реаннотации. Мы ожидаем, что разработанная инфраструктура хранилища данных может быть полезна для совместных проектов, использующих высокопроизводительные технологии молекулярной биологии.