Как с помощью машинного обучения улучшить точность прогнозирования ТВ аффинити и показателей в digital

09.12.2019

Отдел Data Science Havas Media рассказывает, как улучшить точность прогноза ТВ аффинити в 2 раза и снизить погрешность планового CTR на 50%.

Как с помощью машинного обучения улучшить точность прогнозирования ТВ аффинити и показателей в digital
Главной целью применения машинного обучения в медиапланировании является получение как можно более точного прогноза. Havas Media делится опытом применения машинного обучения для прогнозирования ТВ аффинити и показателей кампаний в digital.

ТВ аффинити

Задача: прогнозирование ТВ аффинити на различные целевые аудитории, исходя из будущей сетки канала.

Этот показатель, по сути, отражает интерес некоторой социальной группы к телевизионным событиям. И зная, что какую-то программу будут лучше смотреть молодые девушки, есть возможность поставить в сетку релевантный рекламный ролик.

При этом существуют прогнозы рейтингов на разные целевые группы, которые предоставляет НРА. Однако набор этих целевых аудиторий в данных НРА, доступных для агентства, зачастую ограничен. А нам нужен инструмент, который позволит прогнозировать ТВ рейтинги на любую целевую группу «здесь и сейчас», независимо от ее размера и определения. В медийных агентствах решением задачи прогнозирования занимаются, как правило, ТВ баеры. По нашим оценкам, их погрешность на рекламную кампанию в среднем составляет 3-4%.

Команда Data Science Havas Media решила вопрос с погрешностью за счёт автоматизированного алгоритма. В его основе – метод опорных векторов для регрессии (SVR). На рисунке ниже показан пример – предсказательная способность модели для телесмотрения целевой аудитории на Первом канале.
Анализ показал, что в среднем погрешность прогноза данного алгоритма составляет 1-2% на ТВ кампанию. Таким образом, процесс работы был автоматизирован, а точность прогноза в 2 раза улучшена. Скорость обучения модели составляет в среднем около 4 минут на одну целевую группу для одного канал. На данный момент разработанный алгоритм интегрирован в платформу АДВ Aizek.Trade как один из критериев автоматической постановки ТВ роликов.

Кампании в digital

Задача: прогнозирование показателей кампаний в digital с минимальной погрешностью.

Часто при планировании programmatic кампаний с моделью покупки по показам менеджеры закладывают в планы «средние по больнице» показатели кликабельности (CTR). Фактические значения этих показателей, как правило, имеют сильные отличия от прогнозных. Алгоритм на основе CatBoost от Яндекс, который был реализован в Havas Media, позволил снизить погрешность прогноза CTR на 50%. Всего в модели используется 15 факторов, среди которых присутствуют категория клиента, размер ставки, продолжительность кампании, формат рекламного сообщения, платформа размещения и другие. Стоит отметить, что погрешность в прогнозных моделях таких показателей всё еще остается достаточно высокой, но это обусловлено тем, что на данный момент никак не учитывается качество креатива и его сообщение. Однако в будущем, когда будет накоплено достаточно данных, удастся снизить погрешность прогноза еще сильнее.

Клик на рекламное сообщение является далеко не самым важным действием потребителя для наших клиентов. Поэтому мы в агентстве Havas Media пошли еще дальше и разработали алгоритм прогнозирования ассоциированных и last click конверсий для рекламных digital кампаний. Эти показатели уже существенно ближе к бизнесу и поэтому представляют из себя больший интерес.

На схеме ниже показан пример алгоритма моделирования показателей конверсии для digital кампаний.



«Для применения методов машинного обучения не обязательно обладать высокими компетенциями в программировании. Существует много готовых решений. Например, TensorFlow от Google или CatBoost от Яндекс. С их помощью можно строить и тестировать модели даже без точного представления, как это все работает с точки зрения математики. Достаточно обладать базовыми навыками программирования на R или Phyton. Но для достижения результата знание основ статистики и методов машинного обучения – все же необходимо, ведь применяемый метод должен соответствовать задаче», – комментирует Дмитрий Рыжкин, Data Science Director Havas Media.


552
Дарья
Дарья
+16.5
ДОБАВИТЬ комментарий
Вы не авторизованы. При отправке сообщения, в качестве автора будет указан "Гость". Вход | Регистрация
Защита от спама * :