Чтобы данные приносили компании пользу, их анализируют и используют в работе: формируют отчеты, строят прогнозы, учитывают при принятии решений. Для аналитической обработки данных используют аналитические информационные системы — это комплексы программного обеспечения, которые собирают и обрабатывают данные. Расскажем, как такие системы устроены изнутри и что они умеют.

Что такое аналитические информационные системы и зачем они нужны

Информационно-аналитическая система — это комплекс из нескольких программ и устройств, которые собирают, хранят и анализируют информацию, а потом представляют ее в удобном для пользователей виде.

Такие системы помогают:

  1. Трансформировать миссию и стратегию организации в конкретный набор показателей. Например, вы хотите увеличить прибыль компании на 10 млн рублей в год. Аналитическая система построит модель бизнеса с такой прибылью, чтобы вы увидели, какие показатели нужно изменить для достижения цели.
  2. Составлять точные и достоверные финансовые планы: на основе имеющихся данных предсказывать прибыль и расходы компании, корректировать финансовые планы в соответствии с новыми данными. Также аналитическая система может смоделировать несколько сценариев финансовой жизни компании, например, «оптимистичный» и «пессимистичный», и спрогнозировать, какие стратегии поведения выгоднее в каждой ситуации.
  3. Вести финансовую отчетность: собирать точную финансовую информацию от всех филиалов, подразделений и дочерних компаний, обрабатывать ее и автоматически формировать нужные отчеты.
  4. Прогнозировать изменения в работе компании в зависимости от полученных в реальном времени данных. Например, заранее предупредить, что ожидается падение продаж.

В основе информационно-аналитических систем лежит технология OLAP (Online Analytical Processing), а в основе технологии OLAP лежит обработка многомерных массивов данных. В отличие от обычных данных, многомерные содержат от трех и более параметров, позволяют оценить, как эти параметры влияют друг на друга и предсказать значение одной из переменных по значениям остальных.

Пример многомерной базы, которая учитывает дату покупки, покупателя и проданный товар. Измерений может быть больше трех, если к параметрам добавить, например, фамилию менеджера или номер филиала. База из трех измерений называется кубом, из четырех и больше — гиперкубом. Источник

Структуру информационно-аналитической OLAP-системы можно представить в виде трех компонентов: источников данных, OLAP-сервера и пользовательского приложения.

Структура OLAP-системы, которая собирает данные из разных источников

Данные из источников попадают на OLAP-сервер, где с ними проводится ряд операций по обработке, потом обработанные данные анализа попадают на те приложения, с которыми непосредственно взаимодействует пользователь.

Пользователи, например, аналитики компании или другие сотрудники, работают непосредственно с приложениями, которые умеют визуализировать результаты аналитической обработки данных. Через приложение они отправляют запросы, выводят информацию, производят нужные вычисления и получают результаты: прогнозы для бизнеса, графики и диаграммы, корреляцию показателей.

Откуда может брать данные информационно-аналитическая система

Для аналитической обработки информации OLAP-системе нужны данные. В качестве источников этих данных выступают:

  • Базы данных компании, ERP и CRM-системы, в которых ведется учет продаж, производственных процессов, клиентов, поставщиков и сотрудников.
  • Хранилища данных — системы данных, где собраны все данные компании. Сюда можно собирать данные из баз, CRM-систем или напрямую с устройств, например, с датчиков или касс.

В хранилищах могут быть выделены отдельные «зоны» — витрины данных. Это срез данных хранилища, где собрана тематическая информация, относящаяся к одному подразделению или направлению деятельности компании. Например, все данные по маркетингу, продажам или финансам. Данные из витрины удобнее и быстрее извлекать, к ним проще посылать запросы из конкретного отдела компании.

На облачной платформе Mail.ru Cloud Solutions можно в два клика развернуть аналитическую СУБД Arenadata DB на основе многомерной базы данных Greenplum. Это база для хранения и обработки больших данных, она быстро обрабатывает сложные аналитические запросы, работает с разными источниками данных и позволяет анализировать данные в режиме реального времени с последующим прогнозированием.