вторник, 31 января 2012 г.

Кто и как использует аналитику/Data Mining. Результаты опросов 2011

В последнее время аналитика завоевывает новые сферы, индустрии и рынки. Все чаще на конференциях, в статьях и на бизнес встречах можно услышать про использование интеллектуальных методов анализа данных Data Mining в той или иной компании. Говорят и пишут о применимости в различных сферах, о сложностях и препятствиях, о результатах и повышении эффективности работы за счет применения аналитики.
Кратко напомню, что Data Mining переводится как добыча данных, извлечение информации, раскопка данных, интеллектуальный анализ данных, средства поиска закономерностей, извлечение знаний, анализ шаблонов, "извлечение зерен знаний из гор данных", раскопка знаний в базах данных, информационная проходка данных, "промывание" данных. Понятие "обнаружение знаний в базах данных" (Knowledge Discovery in Databases, KDD) можно считать синонимом Data Mining. 
Однако, ответить на вопросы где (в каких отраслях) и как (какие методы) используются аналитические технологии, в частности Data Mining, не так просто. Чаще всего информация ограничивается тем, что компания N купила инструмент от некоторого вендора. В лучшем случае на очередной конференции можно услышать как применялся программный продукт.

Для того, чтобы понять общую картину на помощь приходят опросы и исследования участников рынка - практиков, которые используют аналитику для решения своих задач. Сегодня публикую результаты двух опросов, которые отвечают на вопросы, поставленные в начале статьи.

Вопрос 1. В какой сфере Вы применяли аналитику/Data Mining в 2011 году?

TOP 5 сфер с использованием аналитических технологий/Data Mining в различных сферах (источник)
  • CRM/ consumer analytics, 25.0%
  • Banking, 18.9%
  • Health care/ HR, 16.7%
  • Education, 16.2%
  • Fraud Detection, 14.0%

В опросе приняло участие 228 специалистов.Региональное распределение выглядит так:

  • US/Canada, 40.4%
  • Europe, 33.8%
  • Asia, 14.0%
  • Africa/Middle East, 4.8%
  • Latim America, 4.8%
  • Australia/NZ, 2.2%


Детальный рисунок ниже (в сравнением с 2010 годом)


Industries where you applied Analytics /  in 2011 (Dec 2011)


Вопрос 2. Какие алгоритмы/методы Вы использовали для анализа данных в 2011 году?
(источник)



Наиболее популярные методы среди 311 опрошенных специалистов: деревья решений, регрессия и кластеризация.

Результаты опросов были взяты с ресурса KDnuggets, на котором собрана интересная информация о  Data Mining. В свое время именно оттуда я взяла много полезного для учебника Data Mining, в частности для описания существующих программных продуктов (классификация, кластеризация, визуализация).
Каждый интересующийся аналитическими технологиями (не важно в какой области) может найти здесь множество полезной, а главное актуальной информации. 
На ресурсе KDnuggets помимо опросов  можно найти : 
Также может быть интересно:

Для получения обновлений блога не забудьте подписаться на рассылку RSS.


Прочитать другие статьи из этой же рубрики можно прочитать здесь

Все статьи блога можно увидеть здесь


Комментариев нет:

Отправить комментарий

Related Posts Plugin for WordPress, Blogger...