Всем привет! По связи рекламное агентство Зекслер . Вот уже более 10 лет мы занимаемся полным циклом маркетинга. Для понимания глубинных причин и процессов в интернет-сегменте решили запустить фундаментальные исследования рынка. На всех своих инсайтах по результатам исследования мы уже обращались к этой статье , а данные выгрузили на сайт нашего проекта — Zexlab.ru . Сегодня рассмотрим о том, как мы собирали данные.
А пока подписывайтесь на наш ТГ-канал , будем рады новым подписчикам:)
ВЫБОР ИСТОЧНИКОВ ДЛЯ ИССЛЕДОВАНИЯ Начали выбор источников. Собрали список самых, на наших, адекватных HR-сайтов отзывов и выбрали самые посещаемые взгляды. Их и определили в качестве темы Диптихи.
Прописали поисковые запросы и объект тональности, запустили сбор упоминаний. В результате система собрала 18 637 отзывов за месяц.
И вот их то мы и решили взять для фундаментальных исследований. Точнее не все отзывы, а только негативы. Положительные отзывы не всегда отражают полную картину, так как многие компании занимаются управлением HR-репутацией и часть таких отзывов создается исключительно для корректировки рейтинга работодателя.
КОРРЕКТИРОВКА ТОНАЛЬНОСТИ Обработка данных началась с корректировки тональности, так как она не всегда обеспечивает корректность – было очень много разметок, которые правильны в ручном режиме. Ниже приведены положительные отзывы, которые никак нельзя назвать.
Правила в несколько этапов. Сначала используйте фильтр по оценке.
Понятно, что иногда авторы обзоров промахиваются с оценкой, но в 98% случаев, если в тексте отрицательно, то и количество звезд меньше 4-х. Фильтр по оценке, использованный от противного, сначала составили все отзывы с оценкой 5 и 4 звезды и размечали их как позитивные, при этом отметили, что этот кластер отработан.
К сожалению, нет на всех сайтах отзывов с описанием рейтингов. С такими отзывами работали по другой схеме. Сначала отработали все отзывы категорий «Агрессия» и «Нецензурная лексика». Но и такого выхода наружу, защиты проявлений оказалось недостаточно. Стали подбирать слова-индикаторы и, с помощью поиска, выбирать отзывы, в которых они представлены. Какие-то маркеры отрабатывали очень хорошо, какие-то слабее.
Всего отобрали 55 маркеров для отрицательных отзывов и 63 для позитивных.
ТЕГИРОВАНИЕ ПРОБЛЕМЫ СОИСКАТЕЛЕЙ Попутно с корректировкой тональности работал с настройкой тегов проблем соискателей:
Тут всё по классике, подбирали запросы и прописывали минус-слова.
СОРТИРОВКА ПО ТИПАМ БИЗНЕСА И, казалось бы, всё – можно закрывать сбор вопросов. Но тут нам пришла идея проверить во всех секторах бизнеса одинаковое соотношение претензий к работодателю. Начали искать, как рассортировать все замечания по секторам бизнеса. Ответ нашел во вкладке «Продукты».
Сначала обрадовались, но когда поняли, что сортировка продуктов даже путем тегирования невозможна, пришли к мысли, что кампании все сортируют самостоятельно.
Выгрузили сводный отчёт и уже вручную стали вести сектор бизнеса. Сначала фильтровали фрагменты по темам, которые характеризуют бизнес. Например:
Те, компании, в сниппетах которых не было характерного слова (приблизительно 40%), отрабатывали вручную. Да, муторно. Но результат того стоил.
ВМЕСТО ЗАКЛЮЧЕНИЯ Интересный получился опыт. Будем пробовать ещё. Есть задумка, продумать свою систему для подобных исследований.
Спасибо, что дочитали нашу статью до конца. Мы рады поделиться с вами довольно подробностями сложного и длительного процесса.
Не будьте внимательны на канале ТГ . Здесь публикуем посты на темы рекламы, продвижения, дизайна, разработки и просто новости нашей дружной команды:)