Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии
Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии
Создание инфраструктуры для обработки генетических данных является перспективным направлением для развития биоинформатики. В настоящее время для решения стандартной задачи исследователь-экспериментатор должен полностью пройти путь расчётов на том вычислительном оборудовании, которое есть у него в наличии; это может отнять у конкретного исследователя несколько недель ожидания подсчёта результатов. Кроме того, вычислительных мощностей может и вовсе не хватить - вычислительная сложность генетических задач может быть очень велика.
В рамках проекта разрабатывается виртуальная вычислительная лаборатория, которая предоставит исследователям средство получения результатов исследований по запросу в необходимом им представлении.
На данный момент не существует решений, которые бы предоставляли весь спектр инструментов для анализа данных секвенирования. Предлагаемая система задумана с учетом расширяемости возможностей и может стать уникальной в своем роде, так как каждая из известных существующих систем для удаленного анализа данных секвенирования представляет собой Веб-оболочку лишь для одного из инструментов анализа данных, в то время, как с одним и тем же набором данных зачастую необходимо производить множество действий, не укладывающихся в функциональность одного инструмента.
Кроме того, количество данных секвенирования растет все быстрее, и c ростом количества данных возрастает и сложность проведения исследований на индивидуальном вычислительном оборудовании. Предлагаемая система предполагает эффективную систему распределения заданий и нагрузки, что позволит работать со всем массивом накопленной информации.
Создание виртуальной лаборатории для обработки секвенированных данных позволит сообществу ученых-генетиков и молекулярных биологов работать более эффективно и выгодно отразится на авторитете Российской науки в целом.
Разрабатываемые инструменты доступны для бета-тестирования по адресу https://api.ispras.ru/demo/gen.
Технологии
API Gateway - платформа для эффективной балансировки нагрузки
Исполнитель
Перейти к списку всех проектов