Институт системного программирования Роcсийской академии наук


Текущие проекты

Исследование и разработка методов поиска повторного использования фрагментов кода (клонов).

Начало проекта – 2015 год. Заказчик - РФФИ.

Повторное использование фрагментов кода часто встречается при разработке программного обеспечения. На уровне исходного кода, это могут быть части программы, выполняющие сходную роль, но перенесенные с небольшими изменениями. На уровне бинарного кода это объектные файлы библиотек, включаемые при компоновке в несколько исполняемых файлов программного комплекса.

Исследование и разработка программной инфраструктуры для глубокого анализа сетевого трафика.

Начало проекта – 2015 год.

Задача анализа сетевого трафика приобретает все большую актуальность в связи с развитием и внедрением новых сетевых технологий, увеличением объема данных (в том числе, конфиденциальных), передаваемых по сети (аудио-, видеосвязь, обмен сообщениями), а также выпуском большого количества приложений с собственными закрытыми протоколами передачи данных. Существующие инструменты, как правило, не позволяют проанализировать протоколы прикладного уровня (отсутствуют механизмы анализа восстановленных потоков данных) и предоставляют функциональность для анализа лишь наиболее распространенных протоколов. Для передачи конфиденциальной информации (сообщения, видеосвязь, персональные данные пользователей) по сети требуется высокий уровень безопасности.

Алгоритмические проблемы теоретической информатики.

Начало проекта – 2014 год. Заказчик - ФАНО.

Различные методы анализа случайных графов, построение новых математических моделей безмасштабных графов (подчиняющихся так называемому степенному закону) является актуальным направлением исследований, в связи с анализом сетей в интернете (в частности, социальных таких как Фейсбук, Твиттер и многих других). При этом их свойства и параметры таких сетей могут изменятся. Для предсказания таких изменений и служит изучение общих свойств математических моделей таких сетей, которые можно рассматривать как случайные графы.

Алгоритмы оптимизации размещения виртуальных машин в модели облачных вычислений SaaS.

Начало проекта – 2014 год.

Основной целью проекта является создание программных средств, позволяющих повысить эффективность использования вычислительных ресурсов в облачной инфраструктуре. Полученные результаты применяются в системе UniHUB для размещения приложений на виртуальных машинах под управлением OpenStack.

Инструмент изменения функциональности бинарного кода построенный на принципах аспекно-ориентированного программирования

Начало проекта – 2014 год. Заказчик - Samsung.

В рамках работ для компании Samsung в 2014 году группой анализа программ разработан инструмент, предоставляющий возможности изменения функциональности исполняемых программ и библиотек на уровне машинного кода для операционных систем Android и Tizen с применением техник аспектно-ориентированного программирования. Инструмент предоставляет возможности изменения функциональности программы или библиотеки скомпилированной для архитектуры ARM, путем статического изменения машинного кода с добавлением новой функциональности в определенных точках исходной программы.

Исследование и развитие методов декомпозиции для поиска и анализа больших пространственно-временных данных.

Начало проекта – 2014 год. Заказчик - ФАНО.

Целью проекта является исследование и развитие методов хранения, поиска и обработки информации, учитывающих как ее сложную организацию, так и согласованную пространственно-временную семантику. В рамках проекта предполагается разработать и исследовать метод декомпозиции, основанный на динамических октарных деревьях, получить теоретические и экспериментальные оценки его сложности и выработать рекомендации по его практическому использованию.

Исследование и разработка методов автоматизации масштабирования и разворачивания виртуальных кластеров для обработки сверхбольших объёмов данных в облачной среде Openstack.

Начало проекта – 2014 год.

Стремительный рост потребностей современного общества в решении задач обработки больших объёмов данных (Big Data) толкает сообщество учёных и разработчиков на поиски новых подходов обработки данных. В последние годы сформировался стек технологий, подходящий для эффективного решения многих задач Big Data, но эти технологии очень разнообразны по своим возможностям и назначениям. Кроме того, эффективность технологий распределённых вычислений напрямую зависит от эффективности механизмов масштабирования.

Исследование и разработка методов запутывания программного обеспечения.

Начало проекта – 2014 год. Заказчик - РФФИ.

Для защиты бинарного кода от анализа используется множество различных методов, один из них – запутывающие преобразования. Такие преобразования обычно вносятся при помощи автоматических обфускаторов, которые принимают на вход исходный код программы или бинарный файл, а на выходе предоставляют исполняемый файл с запутанной программой.

Обработка больших потоков данных.

Начало проекта – 2014 год. Заказчик - РФФИ.

Для обеспечения обработки возрастающих потоков данных было разработано большое количество технологий, обеспечивающих соответствующие возможности со стороны аппаратуры: высокоскоростные каналы связи, высокочастотные процессоры, скоростные шины памяти и винчестеры с высокой плотностью записи и низким временем доступа. Однако остаётся большое количество задач, которые необходимо решить со стороны программного обеспечения, которое должно обеспечивать непосредстевенную обработку, анализ и хранение высокоскоростных потоков данных, эффективно использую ресурсы аппаратуры. Соответствующее ПО должно удовлетворять ряду довольно жёстких требований: обеспечивать пакетную обработку больших объёмов данных с высокой пропускной способностью, устойчивую работу на ненадёжном оборудовании (реализуя репликацию данных и восстановление после сбоев), хорошую масштабируемость, эффективный произвольный доступ к данным. В рамках данного проекта предполагается создание системы, обеспечивающей сбор, фильтрацию, анализ и хранение данных, поступающих в реальном времени через высокоскоростные каналы связи. Данная система позволит автоматизировать решение широкого спектра задач, связанных с обработкой скоростных потоков данных: классификацию сетевого трафика, обеспечения сетевой безопасности, анализ социальных сетей, задачи прогнозирования по большим объёмам данных.

Разработка комплекса научно-технических решений предназначенных для хранения и обработки сверхбольших объемов данных в задачах механики сплошной среды.

Начало проекта – 2014 год. Заказчик - Министерство образования и науки.

Проект направлен на решение задачи обработки больших объемов данных, возникающих при численном решении задач механики сплошной среды.

Разработка масштабируемой программной инфраструктуры для хранения и обработки данных в задачах вычислительной биологии

Начало проекта – 2014 год.

Создание инфраструктуры для обработки генетических данных является перспективным направлением для развития биоинформатики. В настоящее время для решения стандартной задачи исследователь-экспериментатор должен полностью пройти путь расчётов на том вычислительном оборудовании, которое есть у него в наличии; это может отнять у конкретного исследователя несколько недель ожидания подсчёта результатов. Кроме того, вычислительных мощностей может и вовсе не хватить - вычислительная сложность генетических задач может быть очень велика.

Современные алгоритмические проблемы дискретной математики

Начало проекта – 2014 год.

Исследование возможности использования гомоморфных вычислений, для организации конфиденциальных вычислений, в том числе разработка модели конфиденциальных вычислений на облаке, использующие пороговые гомоморфные вычисления. Исследование алгоритмической сложности решения уравнений в полугруппе конечных подстановок первого порядка.

Статический анализ исходного кода программ для их понимания.

Начало проекта – 2014 год. Заказчик - РФФИ.

Проект направлен на создание методов и инструментов решения задач понимания программ на языках Си/Си++, возникающих при сопровождении программных продуктов – определение структуры программы, сущностей программы и отношений между ними. Выполненный задел будет задействован для разработки способов использования предложенных методов анализа для задачи автоматизации переноса выполненных изменений программных продуктов с открытым исходным кодом между версиями этих продуктов.

Эффективные алгоритмы для современных информационных систем.

Начало проекта – 2014 год.

Целью проекта является исследование различных обобщений задач унификации и антиунификации алгебраических термов, оценка сложности и разработка эффективных алгоритмов решения указанных задач, исследование формальных моделей программ, с целью выбора таких моделей, в которых задача обнаружения подобия программ сводится к задачам проверки эквивалентности и минимизации программ, а также к задачам унификации и антиунификации алгебраических термов.

Исследование и разработка методов построения и обогащения онтологии на основе коллекции текстовых документов

Начало проекта – 2013 год.

Проект посвящен разработке инструмента для построения онтологии, или базы знаний, системы Texterra на основе анализа текстовых документов определенных предметных областей. Необходимость подобного инструмента вызвана тем, что наиболее распространенным, а иногда и единственным, способом представления знаний во многих предметных областях являются обычные текстовые документы. В настоящее время поддерживается автоматизированное создание онтологии и ведутся разработки полностью автоматических методов.

Исследование и разработка методов распределенной обработки больших баз графовых данных

Начало проекта – 2013 год.

В настоящее время в области хранения и обработки данных наблюдается тенденция перехода от традиционной реляционной модели к использованию специализированных систем (NOSQL), позволяющих оптимизировать решение для заранее определенного класса приложений. В этой области ведутся активные разработки и уже существуют коммерческие системы разрабатываемые и используемые такими компаниями как Google, Microsoft, Facebook, HP и т.д.

Завершенные проекты

Visontia - сервис для визуализации базы знаний системы Texterra

Начало проекта – 2014 год. Окончание проекта - 2014 год.

Инструмент VizOntia предназначен для визуализации базы знаний системы Texterra.

Тестирование решений класса In-Memory Data Grid для задач Core banking.

Начало проекта – 2014 год. Окончание проекта - 2014 год.

Проект посвящен тестированию решений класса In-Memory Data Grid в применении к области базовых банковских операций. В качестве решений тестировались GridGain, RedHat Infinispan и Hazelcast.

Annotame - сервис для автоматизации процесса разметки текстовых документов

Начало проекта – 2013 год. Окончание проекта - 2014 год.

В рамках проекта разработан сервис для автоматизации процесса разметки текстовых документов различными аннотациями, такими как части речи, термины, соответствующие терминам понятия, ключевые понятия и т. п. Интеграция с системой Texterra и удобный Веб-интерфейс значительно упрощают работу пользователей, позволяя за короткое время получать достаточные объемы данных для обучения и тестирования разрабатываемых в отделе алгоритмов, в том числе алгоритмов определения терминов и разрешения лексической многозначности.

Инструмент профилирования используемой памяти в программах на языке Java для операционной системы Android

Начало проекта – 2013 год. Окончание проекта - 2013 год. Заказчик - Samsung.

В рамках работ для компании Samsung в 2013 году группой анализа программ разработан инструмент анализа используемой памяти программами, написанными на языке Java и исполняющимися в Java-машине Dalvik, являющейся составной частью операционной системы Android.


1 2 3 4