Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии


Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии

Начало проекта – 2013 год. Окончание проекта - 2013 год.

Создание инфраструктуры для обработки генетических данных является перспективным направлением для развития биоинформатики. В настоящее время для решения стандартной задачи исследователь-экспериментатор должен полностью пройти путь расчётов на том вычислительном оборудовании, которое есть у него в наличии; это может отнять у конкретного исследователя несколько недель ожидания подсчёта результатов. Кроме того, вычислительных мощностей может и вовсе не хватить - вычислительная сложность генетических задач может быть очень велика.

В рамках проекта разрабатывается виртуальная вычислительная лаборатория, которая предоставит исследователям средство получения результатов исследований по запросу в необходимом им представлении.

На данный момент не существует решений, которые бы предоставляли весь спектр инструментов для анализа данных секвенирования. Предлагаемая система задумана с учетом расширяемости возможностей и может стать уникальной в своем роде, так как каждая из известных существующих систем для удаленного анализа данных секвенирования представляет собой Веб-оболочку лишь для одного из инструментов анализа данных, в то время, как с одним и тем же набором данных зачастую необходимо производить множество действий, не укладывающихся в функциональность одного инструмента.

Кроме того, количество данных секвенирования растет все быстрее, и c ростом количества данных возрастает и сложность проведения исследований на индивидуальном вычислительном оборудовании. Предлагаемая система предполагает эффективную систему распределения заданий и нагрузки, что позволит работать со всем массивом накопленной информации.

Создание виртуальной лаборатории для обработки секвенированных данных позволит сообществу ученых-генетиков и молекулярных биологов работать более эффективно и выгодно отразится на авторитете Российской науки в целом.

Разрабатываемые инструменты доступны для бета-тестирования по адресу https://api.ispras.ru/demo/gen.

Технологии

API Gateway - платформа для эффективной балансировки нагрузки

Исполнитель

Информационные системы

Перейти к списку всех проектов