Блог Ирины Чубуковой: Data Mining: типы закономерностей в данных

За последний месяц мне удалось убедиться в том, что аналитика данных прочно завоевывает новые позиции. Встречи с представителями нескольких розничных сетей и одним банком, которые используют специальное аналитическое ПО, позволяют с уверенностью говорить о том, что поиск закономерностей в данных перешел от теоретических наработок к этапу активного использования.

Однако, подкованных компаний пока совсем немного и большинство находится только в начале этого интересного пути.

Для того, чтобы преодолеть первый существующий барьер использования Data Mining нужно не так уж много - понять, какие закономерности могут быть получены из накопленных данных и решить, как они могут быть использованы.

Ниже описаны примеры закономерностей для различных сфер деятельности.

Закономерность - это существенная, постоянно повторяющаяся взаимосвязь явлений.

Результат применения методов Data Mining по отношению к любой предметной области может быть представлен в виде одной из закономерностей:

- классификация

- кластеризация

- ассоциации

В процессе выбора типа закономерности необходимо ориентироваться на результат, который должен быть получен в результате использования методов Data Mining (результат должен иметь практическую ценность для компании).

Классификация - закономерность, позволяющая относить объект (клиента, наблюдение, событие) к одному из заранее известных классов.

Примеры.

- в банковской сфере: Кредитный скоринг, определение клиентов банка, склонных к не возврату кредита.

- в телекоммуникациях: определение покупателей, склонных к оттоку.
- в рознице: определение покупателей, склонных к покупке определенного товара/категории.

Результат решения задачи классификации (пример)
1. Описание характеристик и признаков группы покупателей, склонных к покупке продуктов из категории "Здоровое питание"
2. Список покупателей, удовлетворяющих описанным характеристикам (номера карт), т.е. склонных к покупке товаров "Здоровое питание".

Кластеризация - закономерность, предназначенная для разбиения совокупности объектов на однородные группы (кластеры) или поиска существующих структур в данных.

Примеры
- в банковской сфере: определение клиентов с нетипичным поведением (возможное мошенничество).
- в рознице: сегментация покупателей на группы со схожим поведением и предпочтениями (например, для формирования клубов или выборок для инициатив). Группы при этом заранее не определены.

Результат решения задачи кластеризации (пример)
1. Описание групп покупателей и их характеристик (включая отличия между группами)
2. Списки покупателей из каждой группы

Ассоциации - закономерность, позволяющая определять, как объект в данных связан с одним или несколькими объектами на основании правил (правила определяют эти отношения).

Пример.

- в рознице: определение наборов товаров, которые наиболее часто приобретаются совместно.

Результат решения задачи ассоциации (пример)

Описание наборов связей между товарами, категориями товаров (включая показатели достоверности и поддержки правил). Правила позволяют правильно располагать товары и формировать инициативы по совместному продвижению.

Продолжение статьи - Software for Data Mining: IBM SPSS Modeler. Overview of Modeling Nodes.

Также может быть интересно:

Страницы

понедельник, 25 июня 2012 г.

Data Mining: типы закономерностей в данных

Прочитать другие статьи из этой же рубрики можно прочитать здесь

Все статьи блога можно увидеть здесь

Для получения обновлений блога не забудьте подписаться на рассылку RSS.

Комментариев нет:

Отправить комментарий