четверг, 14 июня 2012 г.

Trends in Data Mining. Опрос на KDnuggets

Исследования показывают, что большинство средних и крупных компании из различных сфер все больше интересуются аналитическими технологиями с целью повышения прибыльности, конкурентоспособности и производительности. Видимо не зря аналитика уже не первый год попадает в десятку самых важных стратегических технологий согласно исследованиям Gartner.


И если про основные тренды в Business Intelligence можно узнать в отчетах как минимум трех серьезных исследовательских компаний (GartnerIDC и Forrester), то про тенденции на рынке software for Data Mining публикаций и отчетов намного меньше. 
Тем не менее, этот рынок активно развивается, что говорит о востребованности технологии Data Mining для решения самых разнообразных задач из различных сфер и областей


Один из самых полезных и познавательных ресурсов, который позволяет узнать о тенденциях развития рынка программного обеспечения Data Mining -  сайт KDnuggets. Здесь постоянно проводятся исследования на самые разнообразные темы. Сегодняшняя статья - по следам достаточно интересного опроса, в котором я также приняла участие, сейчас привожу обзор результатов.

Результаты ежегодного опроса "The 13th annual KDnuggets Software Poll" позволяют понять как развивается рынок программного обеспечения Data Mining.  В опросе "What Analytics, Data mining, Big Data software you used in the past 12 months for a real project" в мае 2012 года приняло участие 798 участников.

Основные выводы:

1) В первый раз число пользователей свободного (бесплатного, открытого) программного обеспечения для решения задач Data Mining превысило число пользователей коммерческого программного обеспечения .



2) Среди опрошенных 28% используют коммерческое программное обеспечение Data Mining, но не используют бесплатное. 30% используют бесплатное программное обеспечение Data Mining, но не используют коммерческое, а 42% используют оба вида.
В диаграмме Венна предпочтения пользователей выглядит так:



3) Использование "big data tools" выросло в пять раз: 15% использовали их в 2012 году по сравнению с 3% в 2011 году.


4) Инструменты Data Mining
  • R, Excel, и RapidMiner являются самыми популярными инструментами. Около 30% опрошенных указали эти инструменты.
  • Statistica, SAS, Matlab, IBM SPSS Statistics и  IBM SPSS Modeler - самые популярные коммерческие инструменты (их использует от 7 до 14% опрошенных). Statsoft Statistica становится самым популярным коммерческим инструментом, опередив SAS.
  • Самыми популярными низкоуровневыми языками для аналитики (lower-level languages) являются R, SQL, Java, Python.
Общие результаты (top 19) опроса выглядят так:




6) Среди инструментов (с как минимум 10 пользователями) наибольший рост популярности:
  • Oracle Data Miner  4,4% с 2012 года, по сравнению с 0,7% в 2011 году,  505%-ное увеличение
  • Orange 5,3% vs 1,3%, 315%-ное увеличение
  • TIBCO Spotfire / S + / Miner 4,6% vs 1,7%, 169%-ное увеличение
  • Stata 1,9% vs 0,8%, 130%-ное увеличение
  • Bayesia 1,8% vs 0,8%, 115%-ное увеличение

Что касается языков программирования, которые используются для Data Mining, интересны результаты опроса, проведенного в 2011 году. Тема опроса: "What programming languages you used for data mining / data analysis in the past 12 months"


В среднем один разработчик data mining использует 2 языка.

Продолжение статьи - Data Mining: Mind map по 4 ключевым трендам

Для получения обновлений блога не забудьте подписаться на рассылку RSS.

Прочитать другие статьи из этой же рубрики можно прочитать здесь

Все статьи блога  можно увидеть здесь


Также может быть интересно:

Комментариев нет:

Отправить комментарий

Related Posts Plugin for WordPress, Blogger...