Джеффри Чжэн, Вэйцюн Чжан, Цзинь Луо3, Вэй Чжоу1 и Вероника Лиесапутра
Методы визуализации сыграли ключевую роль в проекте «Геном человека». После дальнейшего развития в других международных проектах, таких как ENCODE, было создано большее количество баз данных генома и разработаны массовые измерения экспрессии генов по всему геному. В текущей ситуации необходимо сместить цели в вычислительной клеточной биологии со сбора последовательных данных на создание более высокого уровня интерпретации и исследование эффективного механизма поиска на основе контента для геномов. Геномы млекопитающих кодируют тысячи больших некодирующих РНК (lncRNAs), многие из которых регулируют экспрессию генов, взаимодействуют с регуляторными комплексами хроматина и, как считается, играют роль в локализации этих комплексов в целевых локусах по всему геному. Используя инструменты визуализации более высокого измерения, их сложные интерактивные свойства можно организовать в виде различных визуальных карт. В этой статье систематически предлагается конструкция карты вариантов VMC как новая схема для применения нескольких карт, которая использует четыре метасимвола, как и представления ДНК или РНК. Описывается системная архитектура ключевых компонентов и основной механизм на VMC. Обсуждаются ключевые модули, соответствующие уравнения и их параметры ввода-вывода. Используя систему VMC, два набора данных ДНК из нескольких реальных последовательностей тестируются, чтобы показать их видимые свойства на более высоких уровнях внутренних взаимосвязей между соответствующими последовательностями ДНК на 2D-картах. Визуальные результаты кратко анализируются для изучения их внутренних свойств и симметричных характеристик на соответствующих последовательностях генома на 2D-картах конструкции Variant Map. Включен набор образцов 2D-карт, и их характеристики иллюстрируются в различных контролируемых условиях.