Шива Кумар, Виджайкумар Гадаге, Индуприя Субраманиан, Аарти Десаи, Вивек К. Сингх и Абхай Джере
Предыстория: Основная цель исследований в области естественных наук — понять сложные клеточные механизмы и взаимодействие различных генов/белков в многочисленных клеточных процессах. Для этого PubMed по-прежнему остается основным источником биомедицинской информации, хотя существуют и другие базы данных, такие как UniProt, Protein Data Bank (PDB) и Reactome.
Цель: С доступными большими объемами данных из высокопроизводительных технологий и нескольких баз данных поиск релевантной информации для ген-процесс-фенотипа теперь стал чрезвычайно сложным и утомительным. В настоящее время не существует инструмента для одновременного поиска в PubMed и нескольких других базах данных для получения целостной информации. Более того, типичный поиск в PubMed возвращает большое количество статей, которые необходимо вручную просмотреть для выявления релевантной литературы. Поэтому мы разработали BioGyan, инструмент для добычи литературы, чтобы упростить комбинаторный поиск генов, типов клеток и клеточных процессов в PubMed и других соответствующих базах данных.
Методы: BioGyan использует надежный метод оценки для ранжирования статей, соответствующих поисковым терминам пользователя. Метод оценки основан на взвешенной сумме совместного появления терминов гена, процесса и взаимодействия в аннотации.
Результаты: BioGyan извлекает статьи PubMed, поддерживающие связь между запрошенными генами и процессами, соответствующие пути из баз данных путей и трехмерные структуры из PDB. Для удобства просмотра вся информация для пользователя доступна в одном окне. BioGyan показал точность 85,46% при прогнозировании релевантности статей для ассоциации ген-процесс и показал лучшие результаты, чем PESCADOR.
Заключение: BioGyan имеет несколько ключевых функций, таких как пакетный запрос генов, а также процессов, автономное чтение статей, экспорт списка статей в виде библиографии и гибкость для пользователя, чтобы пересматривать релевантность статьи, что делает его жизненно важным инструментом для поиска литературы. Таким образом, BioGyan является уникальным инструментом, который предлагает целостный поиск по нескольким базам данных, при этом значительно автоматизируя весь процесс.