Решение Pentaho BI поддерживает концепцию Big Data («Больших данных»).

Этот подход позволяет:

  1. Организовывать  хранилища данных для существенного количества информации с использованием кластера Hadoop и NoSQL баз данных;
  2. Производить распределенные вычисления с помощью технологии MapReduce, например, агрегирование больших объемов данных. Дальнейшая запись преобразованных данных возможна в Hive-таблицы, NoSQL БД или RDBMS;
  3. Осуществлять быстрое построение аналитических отчетов на основе извлекаемых из хранилища данных (в том числе с помощью Mondrian для построения OLAP-отчетности).

BI_big_data_2

BI_big_data_1

 

Рис.1 — Поддержка концепции «Больших данных»