Сегодняшняя статья - ответ на письмо читателя, полученное по электронной почте.
С удовольствием читаю Ваш блог об инструментах Data Mining и business
intelligence. Но хочу все же до конца разобраться со всем этим. Есть
ли какие-то азы? С чего начать читать? С чего начать внедрять эти
инструменты в компании? Спасибо
Вопрос в письме затрагивает несколько разных тем и мне пришлось какое-то время подумать, чтобы составить относительно универсальный ответ, который надеюсь поможет компаниям, которые только планируют внедрять аналитические технологии. В проектной работе часто наблюдаю, что компаниям бывает непросто определиться с внедрением аналитики и выбором технологии.
Для того, чтобы ответить на вопрос "Как начать" предлагаю рассмотреть несколько отдельных вопросов:
- зачем нужна аналитика (какую пользу она может принести компании)
- как анализировать (отличия различных технологий и платформ - Business Intelligence, Data Mining, др.)
- кто будет анализировать/внедрять аналитическое решение (оценка достаточности собственного ресурса)
- что анализировать (какие данные будут использоваться в аналитике)
- кто будет анализировать/внедрять аналитическое решение (оценка достаточности собственного ресурса)
- что анализировать (какие данные будут использоваться в аналитике)
1. Зачем нужна аналитика. Или как перейти от данных к знаниям
Любые аналитические инструменты применяются для того, чтобы из необработанных сырых данных, которые накоплены в компании (или приобретены на рынке) получить полезные знания.
Чаще всего потребность в аналитике возникает в следствие таких ситуаций:
- подход от проблемы (снижение значения важных ключевых показателей)
- страх отстать от конкурентов (особенно при наличии информации о том, что у конкурентов уже используются аналитические технологии)
- решение учредителей/руководства
Как правило, чем более "насущной" или "острой" является проблема, которая заставила задуматься об аналитике, тем быстрее идея по использованию аналитики воплощается в жизнь.
Совет №1. Определите задачу, которая требует аналитической поддержки в ближайшем периоде или является приоритетной/стратегически важной.
2. Как анализировать
Любая аналитическая технология предназначена для того, чтобы превратить "сырые" данных в информацию и знания, которые могут быть использованы для принятия тактический и стратегический решений.
Двигаться вверх по информационной пирамиде можно при помощи различных аналитический технологий. Business Intelligence и Data Mining предназначены для извлечения знаний из накопленных в компании данных, хранящихся в базах данных (структурированные данные).
Data Mining vs. Business Intelligence. Цели и знания
Важно понимать, что Business Intelligence, Data Mining и др. технологии имеют существенные отличия как по функциональности, так и по целям использования.
Технология Business Intelligence в большей степени предназначена для постоянного мониторинга и отслеживания ситуации и, соответственно, поддержки принятия решений через доставку данных до пользователя и их анализ. Задача Data Mining несколько иная, эта технология предназначена для поиска скрытых, неочевидных закономерностей в данных, которые могут помочь решить определенную задачу компании (потребность в этой технологии возникает скорее по запросу, чем в "real time" или в постоянном режиме).
Знания через Business Intelligence (в соответствии с информационной пирамидой) - это возможность получать важную информацию для конкретного пользователя из сырых данных (различных источников), например, ежедневно видеть отклонения среднего чека или выручки от запланированных или прогнозных значений, с отсылкой уведомления на почту в случае критического отклонения. Пользователь в этом случае знает о проблеме и может определить причинно следственную связь при помощи "погружения" в отчетность или dashboard (по определенному разрезу).
Пример знаний через Data Mining - определение характеристик покупателей, которые с наибольшей вероятностью купят товар Х. Знания в данном случае помогают решить определенную задачу - максимизировать отклик на инициативу (уменьшив затраты) и соответственно - повысить прибыль (сформировав "правильный" список для инициативы).Таким образом, и Data Mining и Business Intelligence позволяют компании извлекать из сырых данных знания, но делают это по разному.
Совет №2. Исходя из задачи определите, какие именно результаты (в каком виде) должны быть получены с использованием аналитических технологий (включая частоту получения результатов - разовая или постоянная). На этом этапе может понадобиться помощь консультанта.
3. Кто будет анализировать/внедрять аналитическое решение
В зависимости от выбранной технологии далее нужно определиться с ресурсом. Здесь есть такие варианты:
- Business Intelligence - внедрение BI решения (обычно проводится силами стороннего разработчика/интегратора)
- Data Mining (если это не часть BI решения) - установка data mining инструмента (возможно собственными силами) или заказ аналитики на аутсорсинге (разово или с определенной периодичностью в зависимости от потребностей компании)
- OLAP (если это не часть BI решения) - установка OLAP инструмента (возможно собственными силами или через стороннего разработчика, если это не часть BI)
- Business Intelligence - внедрение BI решения (обычно проводится силами стороннего разработчика/интегратора)
- Data Mining (если это не часть BI решения) - установка data mining инструмента (возможно собственными силами) или заказ аналитики на аутсорсинге (разово или с определенной периодичностью в зависимости от потребностей компании)
- OLAP (если это не часть BI решения) - установка OLAP инструмента (возможно собственными силами или через стороннего разработчика, если это не часть BI)
- Dashboard (если это не часть BI решения) - внедрение/разработка Dashboard-инструмента (обычно проводится силами стороннего разработчика или своими силами при наличии ресурса)
- визуализация - внедрение/адаптация инструмента визуализации (обычно проводится силами стороннего разработчика или своими силами)Совет №3. Совместно с консультантом/разработчиком определите каким должен быть результат (установленное приложение, аналитический отчет "по запросу"/раз в период, разовый аналитический отчет, доступ к данным через web-интерфейс (SAAS).Важно помнить, что Business Intelligence решения ориентированы на бизнес-пользователей, в то время как Data Mining - на аналитиков с определенными знаниями и навыками.
4. Что будем анализировать
В компаниях, у которых накоплены собственные данные (ритейл, банки, страховые компании) вопрос данных сводится к выбору релевантного набора источников данных, которые будут служить фундаментом для аналитики (BI, data mining, др).Но как правило, собственные данные (в структурированном виде и достаточного качества) есть далеко не у каждой компании, и этот барьер становится камнем преткновения при внедрении аналитических технологий.
Совет №4. Не откладывайте надолго аналитический процесс. Для компаний, у которых собственные данные пока не накоплены есть несколько вариантов:
- наладить сбор собственных данных (в большинстве случаев решается силами собственного ИТ отдела),
- приобрести/периодически приобретать данные,
- использовать данные партнеров (пример проверенной схемы - производитель продукции получает от розницы (в которой представлен производитель) "сырые данные", анализирует их за "свой счет" и делится аналитическими отчетами с розницей)
После того, как описанные вопросы решены, в компании должно прийти понимание необходимости и особенностей "собственного аналитического процесса" и тех технологий, которые следует использовать. Обычно за этими шагами следует старт проекта собственными силами, работа с проверенным консультантом или тендер на внедрение.
Комментариев нет:
Отправить комментарий