Сборники трудов ИСП РАН


Сравнительный анализ параллельных алгоритмов соединения для среды MapReduce.

А.Ю. Пигуль.

Аннотация

Для анализа больших объемов данных используются такие методы как параллельные СУБД, парадигма MapReduce, колоночное хранение и различные комбинации этих подходов. В данной работе будут рассмотрены алгоритмы соединения в среде MapReduce. К сожалению, алгоритмы соединения не поддерживаются напрямую в MapReduce . Цель данной работы заключается в том, чтобы обобщить и сравнить существующие алгоритмы соединения по равенству с некоторыми методами оптимизации.

Ключевые слова

параллельные алгоритмы соединения, MapReduce, оптимизация

Издание

Труды Института системного программирования РАН, том 23, 2012, стр. 285-306.

ISSN 2220-6426 (Online), ISSN 2079-8156 (Print).

DOI: 10.15514/ISPRAS-2012-23-17

Полный текст статьи в формате pdf (на английском) Вернуться к содержанию тома