Loading...

Теперь комиссия ещё ниже: расходуйте меньше, а зарабатывайте больше, чем на других площадках.

0

Моя корзина

Ваша корзина пуста

Похоже, вы еще ничего не добавили в корзину

7 минут чтения

Как кластерный анализ работает в маркетинге?

Как кластерный анализ работает в маркетинге?

Сегментация клиентов — базовая задача маркетолога. Узнайте, как выполнять её быстрее с помощью кластерного анализа.

 

Кластерный анализ — это метод анализа, при котором объекты разделяют на группы по важным критериям. Простой пример: в супермаркете продукты расположены по рядам, и каждый подписан — «овощи», «мясо», «крупы». Говядина не попадёт к гречке, потому что это мясо, а не крупа. Деление объектов на группы называется кластеризацией.

 

Полученные после кластеризации группы (или сегменты) изучают. Допустим, алгоритм анализа выделил несколько групп клиентов. В одну из них попали люди, которые покупают продукт двадцать раз в год, в другую — те, кто покупает его раз в год. Маркетолог может изучить этот кластер и понять, как сделать, чтобы люди из него покупали чаще.

 

Кластерный анализ полезен везде, где нужно выделять группы клиентов и объектов. Например, банки используют анализ для определения кредитного рейтинга, а страховые компании — чтобы выявлять мошеннические операции.

 

Как кластерный анализ используют в маркетинге

 

Собирать и хранить много данных о своих клиентах полезно для бизнеса. Но когда вы решите проанализировать эти данные, то поймёте, что невозможно изучать информацию о каждом клиенте отдельно. Наш мозг не в состоянии обрабатывать такое большое количество информации, а ещё это непрактично.

 

Изучить всю информацию разом тоже нельзя, так как данные сильно различаются от клиента к клиенту. Нужно найти золотую середину между анализом всего и сразу и изучением каждого клиента по отдельности. Поэтому нужно разделить всех клиентов на несколько групп. Так можно будет понять, что нужно разным типам клиентов.

 

Для этого и нужен кластерный анализ — клиентов сегментируют по одному или нескольким критериям. Если данных о клиентах очень много, для кластерного анализа используют алгоритмы машинного обучения.

 

Вот несколько примеров того, как кластеризацию используют в маркетинге.

 

Описание поведения клиента. Пользователей можно кластеризовать, основываясь на разных данных:

 

  • как часто и как глубоко они просматривают сайт;
  • как часто покупают и на какую сумму;
  • какие товары покупают;
  • как ведут себя в офлайне.

 

Описание процесса покупки. Можно кластеризовать клиентов по разным критериям. Например:

 

  • когда купили товар или услугу;
  • кто купил продукт — клиент или кто-то для него;
  • в каком магазине купили товар.

 

SEO. Кластерный анализ можно использовать для анализа ключевых слов — разделять их на группы в зависимости от рейтинга, релевантности, сложности и других параметров.

 

В своей работе вы также можете использовать кластеры:

 

  • чтобы настраивать ретаргетинг и ремаркетинг;
  • корректировать рекламные и маркетинговые сообщения;
  • персонализировать пользовательский интерфейс;
  • персонализировать продукт под потребности клиентов.

 

Зачем использовать кластерный анализ, когда есть другие методы

 

Главная задача кластерного анализа — сегментация. Разделить объекты на группы можно и вручную, но кластерный анализ позволяет работать с большим объёмом данных.

В сервисах вроде «Яндекс Метрики» или Google Analytics есть функция ручной сегментации. Там можно выбрать интересующие сегменты трафика и пользователей и проанализировать их.

 

Но у этих инструментов есть ограничения. С ними удобно работать, если пользовательских данных мало. А когда их много, становится тяжело обработать всю информацию — например, удержать в голове данные одновременно о множестве сегментов, составленных по сотням параметров.

 

Тогда на помощь приходит кластерный анализ. Автоматизированные системы для работы с данными могут сами провести его, вам останется только оценить сегменты. Такие системы высвобождают ресурсы и могут использовать больше параметров для анализа, чем человек.

 

Как работает кластеризация

 

Кластеризация считается неконтролируемой методикой машинного обучения, потому что при ней мы не задаём, какой результат ожидаем получить. С помощью машинного обучения данные сами должны проявить естественные структуры внутри них. Звучит сложно, но станет понятно на простом примере.

 

Предположим, что вы управляете компанией по производству футболок. Вы планируете подгонять футболки по фигуре своих клиентов. У вас есть данные некоторых клиентов: их рост и вес. Вы можете построить график, где по одной оси будет рост, по другой — вес, и расположить клиентов на этом графике в виде точек.

 

Алгоритм кластеризации тоже «строит» график и помечает на нём точкой каждого клиента, о котором есть информация. Потом рассчитывает расстояние между каждой парой точек. В основе этого расчёта лежит теорема Пифагора: если у вас есть значения x и y двух точек, вы можете рассчитать расстояние между ними.

 

На основе этих расчётов алгоритм выявляет схожесть точек. Чем меньше расстояние между парой точек, тем больше они похожи. Чем больше расстояние, тем сильнее они различаются. В результате получаются группы, точки в которых находятся близко к друг другу. Группа — это кластер. В кластере находятся клиенты с похожим ростом и весом. Алгоритм окрашивает кластеры в разные цвета, чтобы было понятно, к какой группе относится покупатель.

 

Если вы используете всего две переменные — такие как рост и вес, то кластерный анализ кажется простым и интуитивно понятным. Если начать добавлять переменные, всё станет сложнее. Тогда можно использовать алгоритм k-средних.

 

Алгоритм k-средних — метод кластеризации, который позволяет разбивать данные на группы, похожие по пяти, десяти и более признакам. Его идея в том, что кластеризация выполняется не за один раз.

 

Если простыми словами, то алгоритм работает так. Ему задают, сколько нужно выделить кластеров, и он делает множество подходов (итераций), чтобы найти их. Во время первой итерации он находит две удалённые друг от друга точки и формирует кластеры вокруг них. Во время следующих берёт другие точки и строит новые кластеры. Так он ищет группы точек с наиболее близкими средними значениями. Алгоритм завершается, когда при очередной итерации кластеры не изменяются.

 

Какая роль у маркетолога в этом процессе? 

Маркетолог задаёт переменные — показатели, по которым формируют кластеры. Например, это могут быть не «рост» и «вес», а «доход клиента», «возраст», «стоимость покупки» и другие. Также маркетолог описывает кластеры, созданные алгоритмом, и определяет, можно ли использовать полученные результаты.

 

Маркетолог может экспериментировать: добавлять или удалять переменные и повторно запускать алгоритм. Это позволяет проверить, создаёт ли алгоритм более осмысленные кластеры.

 

Как использовать метод кластеризации: рассказываем пошагово

 

Вот что нужно сделать, чтобы провести кластерный анализ.

 

  • Подготовить данные. Вы должны убедиться, что у вас есть все необходимые сведения. Это должны быть детализированные данные по каждому клиенту или продукту. Агрегированные данные не подойдут.
  • Перевести данные в цифры. Это нужно, чтобы можно было посчитать расстояние между «точками» — объектами, которые нужно кластеризовать. Например, если один из параметров — город, можно присвоить Москве код 402, Санкт-Петербургу — 403 и так далее.
  • Объединить данные в хранилище. Это нужно скорее для удобства. Например, можно собрать данные в BigQuery от Google.

Возможно, вам также понадобится преобразовать данные, если они выражены в разных единицах измерения. Например, можно стандартизировать все значения так, чтобы они находились в диапазоне от 0 до 1.

 

Когда данные обработаны, можно использовать алгоритм. Есть несколько способов кластеризации:

 

  • использовать программный метод — например, если в команде есть специалисты по анализу данных, они могут применять для кластерного анализа языки R или Python;
  • обратиться к аналитическим сервисам вроде Tableau — в них есть встроенные инструменты для кластеризации;
  • работать с хранилищами данных — например, в BigQuery можно визуализировать результаты, если вы знаете синтаксис языка SQL;
  • использовать Excel и считать всё вручную, но это подходит только для небольшого числа объектов — например, если нужно разнести семь объектов с двумя параметрами на две группы.

 

Плюсы и минусы кластерного анализа

 

Кластерный анализ — не идеальное решение для всех. Вот плюсы и минусы, о которых стоит помнить.

 

Плюсы:

 

  • данные просто визуализировать и интерпретировать;
  • анализ легко масштабировать на миллионы записей;
  • система динамичная — если изменить данные, то кластеры тоже изменятся.

 

Минусы:

 

  • разные выполнения алгоритмов могут давать разные результаты;
  • при использовании алгоритма k-средних маркетолог должен заранее определить, сколько кластеров должно быть;
  • перед применением кластерного анализа нужно подготовить данные.
Поделиться