Информационные системы


Собственные технологии

Asperitas и другие облачные решения

Asperitas – платформа, предназначенная для хранения данных и совершения сложных ресурсоёмких вычислений по запросу. Дистрибутив включает в себя одноимённую облачную среду (№5921 в Едином реестре российского ПО), а также PaaS- и IaaS- оркестраторы (Michman и Clouni). В число облачных решений ИСП РАН входит также Fanlight (№6066 в Едином реестре российского ПО) – платформа для организации web-лабораторий.

Dedoc: система извлечения структуры документов

Dedoc – универсальная открытая система для приведения документов к единому формату. Автоматически извлекает логическую структуру, таблицы и метаинформацию. Содержимое документов представляется в виде дерева, кодирующего заголовки и списки различного уровня вложенности. Dedoc может встраиваться как отдельный компонент в системы анализа структуры и содержимого документов.

Docmarking: система маркирования текстовых документов

Docmarking – уникальная система внедрения цифровых водяных знаков (меток) в текстовые документы. Позволяет создавать едва отличимые от оригинала цифровые и физические копии документов, однозначно идентифицирующие пользователей и их устройства.

Система исследовательского поиска SciNoon

SciNoon - система совместного исследовательского поиска научных статей. Позволяет группе исследователей быстро погружаться в новую предметную область и находить ответы на свои вопросы, а затем отслеживать новые публикации по изучаемой тематике.

Talisman: платформа для обработки данных

Talisman – это комплекс взаимосвязанных программных инструментов для автоматизации типовых задач обработки данных, включая их сбор, интеграцию, анализ, хранение и визуализацию. Обеспечивает быструю разработку специализированных многопользовательских аналитических систем, объединяющих информацию из внутренних баз данных и открытых источников сети Интернет (в том числе из социальных сетей).

Базовый семантический анализатор Texterra

Texterra — масштабируемая платформа для извлечения семантики из текста. Базовый комплекс технологий для создания многофункциональных прикладных приложений. Анализирует тексты с помощью выделения концептов. Включена в Единый реестр российского ПО (№4048).

Инструмент тестирования ИСП Фаззер

ИСП Фаззер – инструмент проведения фаззинг-тестирования. Позволяет осуществлять динамический анализ ПО. Обнаруживает ошибки или закладки как при наличии, так и при отсутствии исходного кода. Позволяет построить процесс разработки в соответствии с ГОСТ Р 56939-2016. Это инструмент динамического анализа, необходимый на всех этапах разработки, тестирования и эксплуатации ПО. Решает те же задачи, что и мировые аналоги (Synopsys Codenomicon, beSTORM, Peach Fuzzer), однако более удобен для российских компаний в условиях процесса импортозамещения.

Решения на базе свободного ПО и собственных разработок ИСП РАН для организации облачных сред, предоставляющих инфраструктурные ресурсы по запросу

Использование облачной инфраструктуры позволяет сэкономить машинное время и время разработчиков за счет оптимизации использования ресурсов и сокращения времени на создание и настройку систем. Например, для Веб-сервисов с большим числом пользователей, нагрузка может радикально меняться в зависимости от времени суток, времени года и событий. За счет эластичной балансировки ресурсов в облачных средах можно сэкономить огромное количество ресурсов. Облачная инфраструктура ИСП РАН состоит из нескольких частей, основанных на наиболее перспективных системах, предоставляющих функции виртуализации и надежного хранения.

API Gateway - платформа для эффективной балансировки нагрузки

API Gateway представляет платформу, предназначенную для эффективной балансировки нагрузки между вычислительными узлами и защиты от злоупотребления ресурсами.

Noon - инфраструктура для семантического поиска и исследования предметно-специфичной информации

Noon - набор инструментов для быстрой разработки предметно-ориентированных семантических поисковых и навигационных систем.

Sedna - прирожденная XML-СУБД

Полнофункциональная система управления базами данных, спроектированная специально для работы с XML-данными, с поддержкой языка W3C XQuery. XML — стандарт для хранения и обмена информацией в Вебе.

Технологии на основе свободного ПО

Apache Spark - платформа для обработки больших данных

Большинство организаций, сталкивающихся с необходимостью обработки больших объемов данных, используют для этих целей свободные проекты экосистемы Apache Hadoop. Основой для создания Apache Hadoop послужила разработанная компанией Google парадигма параллельного программирования MapReduce. Основные достоинства MapReduce - масштабируемость, простота использования, устойчивость к сбоям. Однако реализация MapReduce в Hadoop обладает рядом недостатков, основным из которых является низкая производительность при решении итеративных алгоритмов (например, машинного обучения). Для решения этой проблемы в университете Беркли была разработана модель для организации распределенных вычислений, основанная на понятии устойчивой к сбоям распределенной коллекции данных (RDD).