Решение Pentaho BI поддерживает концепцию Big Data («Больших данных»).
Этот подход позволяет:
- Организовывать хранилища данных для существенного количества информации с использованием кластера Hadoop и NoSQL баз данных;
- Производить распределенные вычисления с помощью технологии MapReduce, например, агрегирование больших объемов данных. Дальнейшая запись преобразованных данных возможна в Hive-таблицы, NoSQL БД или RDBMS;
- Осуществлять быстрое построение аналитических отчетов на основе извлекаемых из хранилища данных (в том числе с помощью Mondrian для построения OLAP-отчетности).
Рис.1 — Поддержка концепции «Больших данных»