понедельник, 25 июня 2012 г.

Data Mining: типы закономерностей в данных

За последний месяц мне удалось убедиться в том, что аналитика данных прочно завоевывает новые позиции. Встречи с представителями нескольких розничных сетей и одним банком, которые используют специальное аналитическое ПО, позволяют с уверенностью говорить о том, что поиск закономерностей в данных перешел от теоретических наработок к этапу активного использования.
Однако, подкованных компаний пока совсем немного и большинство находится только в начале этого интересного пути. 

Для того, чтобы преодолеть первый существующий барьер использования Data Mining нужно не так уж много - понять, какие закономерности могут быть получены из накопленных данных и решитькак они могут быть использованы. 
Ниже описаны примеры закономерностей для различных сфер деятельности.

Закономерность - это существенная, постоянно повторяющаяся взаимосвязь явлений.

Результат применения методов Data Mining по отношению к любой предметной области может быть представлен в виде одной из закономерностей:
- классификация
- кластеризация
- ассоциации

В процессе выбора типа закономерности необходимо ориентироваться на результат, который должен быть получен в результате использования методов Data Mining (результат должен иметь практическую ценность для компании).



Классификация - закономерность, позволяющая относить объект (клиента, наблюдение, событие) к одному из заранее известных классов.


Примеры. 
- в банковской сфере: Кредитный скоринг, определение клиентов банка, склонных к не возврату кредита. 

- в телекоммуникациях: определение покупателей, склонных к оттоку.
- в рознице: определение покупателей, склонных к покупке определенного товара/категории.
Результат решения задачи классификации (пример)
1. Описание характеристик и признаков группы покупателей, склонных к покупке продуктов из категории "Здоровое питание" 
2. Список покупателей, удовлетворяющих описанным характеристикам (номера карт), т.е. склонных к покупке товаров "Здоровое питание".

Кластеризация - закономерность, предназначенная для разбиения совокупности объектов на однородные группы (кластеры) или поиска существующих структур в данных.


Примеры
- в банковской сфере: определение клиентов с нетипичным поведением (возможное мошенничество).
- в рознице: сегментация покупателей на группы со схожим поведением и предпочтениями (например, для формирования клубов или выборок для инициатив). Группы при этом заранее не определены.
Результат решения задачи кластеризации (пример)
1. Описание групп покупателей и их характеристик (включая отличия между группами)
2. Списки покупателей из каждой группы

Ассоциации - закономерность, позволяющая определять, как объект в данных связан с одним или несколькими объектами на основании правил (правила определяют эти отношения).


Пример. 
- в рознице: определение наборов товаров, которые наиболее часто приобретаются совместно.
Результат решения задачи ассоциации (пример)
Описание наборов связей между товарами, категориями товаров (включая показатели достоверности и поддержки правил). Правила позволяют правильно располагать товары и формировать инициативы по совместному продвижению.

Продолжение статьи - Software for Data Mining: IBM SPSS Modeler. Overview of Modeling Nodes.


Также может быть интересно:

    Прочитать другие статьи из этой же рубрики можно прочитать здесь

    Все статьи блога можно увидеть здесь

    Для получения обновлений блога не забудьте подписаться на рассылку RSS.


    Комментариев нет:

    Отправить комментарий

    Related Posts Plugin for WordPress, Blogger...