Интеграция предиктивного анализа клиентских сегментов в бизнес-приложения

Методы использования в бизнесе

Сегментация клиентов — это отличный первый шаг в освоении техническими специалистами методов предиктивного анализа. Используя готовое программное обеспечение и существующие транзакционные базы данных, компании могут быстро создавать модели сегментирования, формирующие основу для оптимизации процессов маркетинга и продаж, а также для использования других методов предиктивного анализа. Однако интеграция статистических результатов в бизнес-процессы может быть непростой задачей. В этой статье предлагаются руководство и поэтапная процедура по развертыванию модели сегментации для бизнес-пользователей.

Дэвид Джиллман, директор по обслуживанию, Data Sooner

Photo of David GillmanДэвид Джиллман (David Gillman) имеет более чем 20-летний опыт работы в таких областях, как бизнес-аналитика, углубленный анализ данных и предиктивный анализ. Получив образование в прикладной математике, оптимизации и статистическом анализе, он специализируется на их применении в сфере коммерции. Он имеет практический опыт совершенствования бизнес-операций за счет использования аналитики в организациях различных размеров в таких отраслях, как дистрибуция, производство, розничная торговля и гостиничный бизнес. С Дэвидом можно связаться по электронной почте: gillman@datasooner.com.



18.04.2013

Предиктивный анализ и его статистические основы используются в научной сфере уже не одно десятилетие. Копните немного глубже — и вы обнаружите похожие аналитические процессы и в экономике. До недавнего времени коммерческое применение предиктивного анализа ограничивалось испытаниями лекарственных препаратов (научные исследования) и маркетинговыми проектами в крупных компаниях.

Однако с повышением производительности обработки данных и появлением на рынке простого в использовании программного обеспечения коммерческое применение предиктивного анализа значительно расширяется, выходя за пределы традиционных областей. Значительное увеличение объемов данных, включая структурированные данные в транзакционных системах и неструктурированные данные, приводит к существенному росту потребностей в их углубленном изучении и предиктивном анализе.

Сегментация клиентов — это область предиктивного анализа, полезная для любой организации. Безусловно, каждой компании важно знать своих клиентов. Системы управления взаимодействием с клиентами (Customer Relationship Management, CRM) выполняют задачи мониторинга действий, координирования ресурсов и общей поддержки процессов продаж. Выходя за пределы отслеживания и транзакций для получения ценных знаний, вы оказываетесь в царстве предиктивного анализа. По мере совершенствования обработки данных и программного обеспечения, предиктивный анализ все увереннее прокладывает свой путь в процессы, больше связанные с CRM. Вообще говоря, сегментация и группировка похожих клиентов предусматривается во многих других аналитических процессах. Многие продвинутые процессы будут работать эффективнее, если логически разделять клиентов на понятные группы. (В качестве примеров можно назвать прогнозирование повторных заказов, определение сезонных колебаний по типам клиентов, управление жизненным циклом клиентов, целевой маркетинг, а также продажи дополнительных или более прибыльных товаров.)

Всего несколько лет назад использование исторической информации о миллионах транзакций и десятков характеристик клиентов для формирования статистических прогнозов ограничивалось большими и очень большими компаниями. Сегодня технологические достижения переводят процессы предиктивного анализа в другую ценовую категорию, позволяя средним и небольшим компаниям анализировать свои данные и развертывать предиктивные модели. В будущем, по мере все большего включения в бизнес неструктурированных данных, эти средние и небольшие компании смогут использовать «большие данные» так же, как это делают сегодня крупные компании.

Предиктивный анализ — это ценная информация

Предиктивный анализ основывается на применении к данным методов статистического анализа. Результатом такого анализа является понимание набора данных, а также прогнозы или рекомендации в отношении будущих действий. В реальности это статистика за пределами той статистики, с которой знакомо большинство людей, — вычисления средних показателей. Практическая проблема заключается в том, как предоставлять полученные знания (описательная статистика) таким образом, чтобы они были понятны среднему бизнес-пользователю и могли использоваться в бизнес-процессах.


Предиктивный анализ — это не отчеты

Отчеты с историческими данными могут принимать множество форм и предоставлять основу для определения будущих действий. Но покажите этот же отчет другому человеку — и вы получите другую интерпретацию. Предиктивный анализ исключает влияние интуиции человека — или, по крайней мере, предоставляет надежную фактологическую основу, чтобы специалист по продажам или маркетингу мог принять более обоснованное решение о будущих событиях.

Его не могут заменить ни большая образованность, ни больший опыт. Очевидно, что объемы данных растут, и нет никаких признаков того, что в будущем они станут меньше. Аналитики будут сталкиваться со сложной проблемой изучения непрерывно растущих объемов все более разнородных данных. Отсюда потребность в автоматизации аналитических процессов.


Кластеризация клиентов: суть сегментирования

Как в любом процессе предиктивного анализа, для сегментирования клиентов существет несколько методик и алгоритмов. К числу наиболее употребительных относятся методы с использованием векторных машин, различных алгоритмов кластеризации и нейронных сетей. Есть множество источников, позволяющих узнать, какие методы являются наилучшими в разных ситуациях, и у многих практиков есть свои собственные предпочтения. Целью этой статьи является не оценка достоинств этих методов с математической точки зрения, а предоставление рекомендаций о том, как интегрировать результаты процессов сегментирования в приложения бизнес-подразделений.

Решение IBM® SPSS® предлагает несколько из упомянутых статистических методов. На рисунке 1 показаны некоторые из вариантов, которые доступны в меню SPSS Statistics.

Рисунок 1. Стандартное подменю классификации в SPSS Statistics
The standard classification submenu in SPSS Statistics

На рисунке 2 показано, что в SPSS Statistics некоторые процессы даже организованы в виде специального меню, обеспечивая сегментацию клиентов одним щелчком мыши.

Рисунок 2. Контекстное меню для пункта Direct Marketing (Прямой маркетинг)
The pop-up menu for the Direct Marketing option

Результаты этих аналитических процессов различны. Все они формируют таблицы, определяющие каждый кластер и представляющие средние значения с учетом всех значимых входных переменных. Эти таблицы включают спектр значений для каждой переменной в каждом кластере — информацию, которая чрезвычайно важна для программной интеграции моделей кластеризации в бизнес-приложения. Однако сами по себе эти таблицы и числа сложно интерпретировать техническим специалистам, а для среднего бизнес-пользователя они практически непостижимы.

К счастью, в большинстве случаев результаты моделирования также включают диаграммы, а некоторые показывают дерево решений. Я отмечаю оба этих типа графических результатов, поскольку они формируют первоначальную основу для понимания того, что говорит модель.

Диаграммы кластеризации показывают группировку клиентов. Безусловно, вы можете включать в одну диаграмму лишь ограниченное количество переменных. Зачастую нужно изучить несколько диаграмм с различными комбинациями переменных, чтобы хорошо понять, как разделяются клиенты.

Большинство алгоритмов нормализуют переменные в кластерах. Если вы не знакомы с понятием нормализации переменных, то можете получить дополнительную информацию в Википедии (см. Ресурсы). Советую учитывать эту информацию при интерпретации диаграмм, в особенности при объяснении моделей бизнес-пользователям.

Другой упомянутый мной графический результат, дерево решений, — это диаграмма логики, используемой для перехода от общего к частному с проверкой в каждой точке ветвления, пути, ведущего в конечном итоге к конечному узлу. В этом случае конечный узел является принадлежностью к конкретному сегменту.


Использование моделей сегментации в бизнесе

Возможно, у ваших бизнес-пользователей уже есть какая-либо модель сегментирования. Возможно, даже не одна. Людям свойственно пытаться все распределять по категориям, поскольку это упрощает последующую интерпретацию.

Проблема большинства компаний заключается в том, что в них используется несколько моделей сегментации. Подразделения и их сотрудники по-разному применяют разные модели. Это создает настоящую путаницу.

Проект по сегментационному моделированию позволит вам обеспечить согласованность в масштабе всей организации. Вы сможете исключить противоречия между подразделениями и разработать модель сегментации для всего, что имеет хорошее обоснование. По моему опыту, в большинстве коммерческих организаций сегментацию клиентов выполняют главным образом два подразделения — отделы маркетинга и продаж.

Маркетинг

Практически все маркетологи любят группировать клиентов. Само слово маркетинг подразумевает существование рынка, то есть группы потенциальных клиентов. Однако давно бытует поговорка: «Все знают, что половина денег на маркетинг тратится впустую. Но никто не знает, какая именно половина». Более эффективное определение целевых групп сокращает затраты на маркетинг, повышая его результативность. Развертывание согласованной модели сегментации является разумным шагом к сокращению напрасных расходов.

Модель сегментации клиентов поддерживает маркетинг по разным аспектам. Наиболее типичными являются нацеливание маркетинговой кампании на клиентов, которые вероятнее всего откликнутся, исключение случаев предоставления клиентам незначимых маркетинговых предложений, привязка продуктов к конкретным сегментам и выход на новые рынки. В результате сокращаются затраты, увеличивается количество заказов в расчете на каждый потраченный доллар и не расходуются деньги на догадки.

Продажи

Отделы продаж тоже используют модели сегментации. Их использование может быть более неформальным и распределенным среди конкретных специалистов по продажам, однако оно обеспечивает значительные результаты.

Хорошая модель сегментации помогает торговым представителям продавать дополнительные товары. История заказов клиентов из одного и того же сегмента может использоваться для продаж другим, сходным клиентам. В конце концов, похожие клиенты с большей вероятностью будут приобретать похожие товары.

Некоторые модели сегментации учитывают этапы жизненного цикла клиента. Специалисты по продажам получают возможность обнаруживать признаки того, что клиент склонен уйти, и совершенствовать процессы продаж для более успешного удержания клиентов и сохранения взаимоотношений с ними. Подобным же образом закономерности заказов новых клиентов можно использовать для более оперативной имитации долгосрочных клиентов.


Взаимодействия с моделью сегментации

Существует несколько уровней взаимодействий специалистов и бизнес-процессов с созданной моделью сегментации.

Уровень представлений

Даже при использовании самых лучших математических методов моделирования и исключительно хорошей подготовке данных ваших бизнес-пользователей нужно убедить в качестве модели. Для этого на встрече с ними вам необходимо представить процессы моделирования и окончательные результаты.

Как я уже отмечал ранее, SPSS Statistics предлагает диаграммы и графики моделей сегментации — вам это потребуется. На самом деле вам может потребоваться несколько диаграмм, и они должны быть простыми. Добавьте диаграмму дерева решений или как минимум пример одной ветви большого дерева. Эти диаграммы помогут объяснить модель.

Однако не забывайте о вспомогательной информации. Вы можете не знать кто именно, но некоторые из ваших бизнес-пользователей будут помнить свою статистику. И они захотят увидеть методологию, которую вы использовали для создания модели сегментации. Они могут совсем не понимать ее, но они захотят получить обоснование. (В реальности у вас будет консультационный совет, включающий ключевых бизнес-пользователей. И все же другим пользователям нужно будет проникнуться качеством модели, прежде чем адаптировать бизнес-процессы к ее результатам.)

На этом уровне будет очень полезна SPSS Statistics, имеющая множество возможностей для предоставления документальных обоснований, которые необходимы пользователям. Также полезно включить раздел по математическим методам, которые вы использовали. Пользователи могут и не спросить о них, но лучше предвосхитить возможные вопросы и подготовить информацию для ответов.

Уровень электронных таблиц

Продемонстрируйте в электронной таблице, как ваша модель работает. До того как ваши бизнес-пользователи научатся уверенно использовать разработанные для них модели сегментирования и прогнозирования, модели лучше представлять в виде электронных таблиц.

Иногда крупные компании могут обходить этот этап, поскольку от сотрудников бизнес-подразделений требуется по распоряжению следовать процедурам «сверху вниз». Такова природа бюрократии в больших компаниях. Однако я считаю полезным создавать для модели интерфейс в виде электронной таблицы, чтобы сделать ее комфортнее для себя и для руководителей. В средних компаниях вам потребуется представление модели в виде знакомых бизнес-пользователям электронных таблиц, чтобы обеспечить им такой же уровень комфорта, до того как вы сможете развернуть модель для ERP- и CRM-приложений.

Самый простой способ выполнения этого этапа — начать с электронной таблицы потенциальных или существующих клиентов. Каждый потенциальный или существующий клиент представляется строкой, а значения в столбцах являются характеристиками, которые модели необходимо классифицировать. SPSS Statistics оценивает каждого потенциального клиента в электронной таблице в соответствии с моделью, возвращая его принадлежность к сегменту.

Уровень интеграции с ERP- и CRM-приложениями

Конечной целью развертывания любой системы предиктивного анализа является ее интеграция в бизнес-процессы. Для большинства компаний это означает включение знаний и конкретных прогнозов в ERP- и CRM-приложения.

Модели сегментации клиентов, прошедшие через два предыдущих уровня оценки, готовы к интеграции. Они одобрены бизнес-пользователями и проверены на уровне электронных таблиц. Эти модели можно затем программно интегрировать в экраны информации о клиентах и экраны ввода заказов и CRM-системы, а также использовать для различных целей, например, для подготовки рекомендаций в отношении продаж дополнительных продуктов.

В зависимости от планируемых вами вариантов использования существует несколько способов взаимодействий приложений с моделью сегментации. Во-первых, можно выполнять запросы непосредственно к модели. Если вы подошли к модели с использованием понятия дерева решений, то вы можете быстро создавать сложные запросы, включающие критерии участия в сегментах. Представьте себе запрос, который берет несколько полей в базе данных для клиента или потенциального клиента, а затем по сути выполняет большой оператор IF для вывода информации о принадлежности клиента к сегменту или кластеру.

Еще одним способом может быть выполнение запросов к модели, как на обсуждавшемся ранее уровне электронной таблицы. IBM SPSS Modeler поддерживает запросы реального времени (live query) к существующей модели. Отправьте в систему SPSS Modeler значимые величины из базы данных для потенциального или существующего клиента, и она вернет классификацию.

Третьим способом может быть классификация всех потенциальных или существующих клиентов в пакетном режиме, а затем размещение результатов в столбце файла данных о клиенте в приложении ERP или CRM. Этот метод может выглядеть менее изящным — все же это не процесс в реальном времени, и в него не включаются запросы и программы для интеграции. На самом деле специалисты, не знакомые с выполнением запросов к предиктивным моделям, могут использовать полученный файл данных для других целей. Классы сегментации становятся еще одним полем в базе данных, которое можно оценивать и использовать в запросах для каких-то других целей; это способствует экспериментированию и дальнейшему использованию.

Недостатком такого подхода является задержка. Принадлежность к сегментам может измениться до того, как вы сможете обновить файл базы данных. Новые потенциальные клиенты должны оцениваться вами или кем-то еще с доступом к SPSS Statistics. Тем не менее, какой бы подход к интеграции модели сегментации вы ни выбрали, вы получаете органичную интеграцию предиктивной аналитики в структуру операций вашей компании.


Инструменты IBM обеспечивают результат

Я уже упоминал решение SPSS Statistics, которое является стартовой точкой для анализа. Чтобы использовать этот инструмент, вам придется вспомнить курс статистики. К счастью, статистические основы сегментации достаточно просты.

При вводе системы в эксплуатацию с использованием одного из рассмотренных ранее уровней интеграции вам нужно будет развернуть на сервере SPSS Modeler, чтобы выполнять запросы к вашей модели сегментации. SPSS Modeler является ключевым продуктом для классификации новых потенциальных и существующих клиентов в реальном времени. Это серверное приложение, которое получает входные переменные и возвращает классификацию в реальном времени. (См. Ресурсы.)


Будущее больших данных

В настоящее время большинство компаний (особенно средних и небольших) собирают мало информации, относящейся к категории больших данных, кроме отделов маркетинга, которые отслеживают навигацию по web-сайтам. Однако ситуация быстро меняется. Появляются новые элементы данных, которые определенно являются большими данными.

Возможно, в будущем розничные компании будут отслеживать конкретных клиентов в магазинах, а производители — использование изделий потребителями. Эти и другие типы данных поступают в центр обработки как неструктурированные или полуструктурированные, и их объемы слишком велики для анализа вручную. Такие характеристики определенно указывают на принадлежность к большим данным.

Я поднимаю тему больших данных не для того, чтобы кого-либо отпугнуть — сегодня вы можете экспериментировать с большими данными, используя платформу IBM InfoSphere® BigInsights™. ПО InfoSphere BigInsights Basic Edition, доступное для бесплатной загрузки или использования в облачной среде IBM SmartCloud™, предоставляет превосходную возможность для изучения уже имеющихся больших данных и интеграции дополнительных данных в будущем.

Считайте это предсказанием — навыки и методы, изучаемые вами сегодня в предиктивном анализе, пригодятся вам в будущей работе с большими данными.


Заключение

Большинству компаний необходимо сегментировать своих клиентов для достижения единого для различных подразделений понимания клиентской базы. В этой области есть множество историй успеха — в розничной торговле, дистрибуции, здравоохранении, государственном секторе и в разнообразных компаниях, осуществляющих операции через Интернет. Чтобы оказывать влияние на бизнес-процессы, сегментация должна встраиваться в них, предоставляя бизнес-пользователям возможность действовать на основе этой информации.

Анализ клиентских сегментов основывается на понятных статистических методах и легко обсуждается со специалистами по бизнесу. Это отличный первый шаг в царство предиктивного анализа.

Ресурсы

Комментарии

developerWorks: Войти

Обязательные поля отмечены звездочкой (*).


Нужен IBM ID?
Забыли Ваш IBM ID?


Забыли Ваш пароль?
Изменить пароль

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Профиль создается, когда вы первый раз заходите в developerWorks. Информация в вашем профиле (имя, страна / регион, название компании) отображается для всех пользователей и будет сопровождать любой опубликованный вами контент пока вы специально не укажите скрыть название вашей компании. Вы можете обновить ваш IBM аккаунт в любое время.

Вся введенная информация защищена.

Выберите имя, которое будет отображаться на экране



При первом входе в developerWorks для Вас будет создан профиль и Вам нужно будет выбрать Отображаемое имя. Оно будет выводиться рядом с контентом, опубликованным Вами в developerWorks.

Отображаемое имя должно иметь длину от 3 символов до 31 символа. Ваше Имя в системе должно быть уникальным. В качестве имени по соображениям приватности нельзя использовать контактный e-mail.

Обязательные поля отмечены звездочкой (*).

(Отображаемое имя должно иметь длину от 3 символов до 31 символа.)

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Вся введенная информация защищена.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=Information Management
ArticleID=871721
ArticleTitle=Интеграция предиктивного анализа клиентских сегментов в бизнес-приложения
publish-date=04182013