Сборники трудов ИСП РАН


MapReduce: внутри, снаружи или сбоку от параллельных СУБД?

С.Д. Кузнецов.

Аннотация

Обсуждаются подходы к использованию технологии MapReduce в аналитических СУБД. Рассмотриваются подходы, при которых MapReduce реализуется внутри ядра параллельной СУБД, используется в качестве коммуникационной инфраструктуры новой параллельной СУБД и применяется автономно в симбиотическом единстве с параллельной СУБД. В качестве примера применения первого подхода анализируются особенности организации массивно-параллельных СУБД Greenplum Database и nCluster компаний Greenplum и Aster Data Systems соответственно. Второй подход применяется в проекте HadoopDB университетов Yale и Brown. Наконец, третий подход развивается в компании Vertica.

Ключевые слова

массивно-параллельные аналитические СУБД, MapReduce, распараллеливание функций, определяемых пользователями, коммуникационная инфраструктура.

Издание

Труды Института системного программирования РАН, том 19, 2010, стр. 35-70.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

Полный текст статьи в формате pdf Вернуться к содержанию тома