Всем привет! Я директор питерской студии разработки Unistory. Мы специализируемся на продуктах с интеграциями искусственного интеллекта. В своем Telegram-канале пишу о том, как разные сферы бизнеса используют ИИ — подписывайтесь :)
Сегодня расскажу вам об одном из продуктов, который мы создали. Это устройство, вычисляющее человекопоток возле рекламных билбордов. Зачем это нужно? Давайте расскажу по порядку, с чего все началось.
К нам пришел заказчик, который занимается созданием цифровых инструментов для маркетологов. Его идея была в том, чтобы создать независимый инструмент, который будет давать информацию об эффективности рекламных билбордов.
Есть только два вида билбордов: эффективный и неэффективный. Возле первого проходят сотни людей в минуту, второй не видит никто.
Легко отличить один от другого, если маркетолог, который заказывает рекламу out-of-home, хорошо знает город. Но если он живет в Мадриде, а рекламу размещает в Стокгольме? Именно для таких ситуаций и нужен независимый инструмент оценки человекопотока возле билборда.
Технически наша задача решалась просто: устанавливаем камеру, подключаем AI-модель компьютерного зрения, она считает людей. Однако решение должно было работать на европейском рынке, а в Европе действует GDPR, закон о защите персональных данных.
Снимать людей на улицах в маркетинговых целях запрещено законом. Наше решение должно было фиксировать информацию только о количестве людей. Поэтому обычная камера не подошла.
Чтобы решить проблему, рассматривали два варианта на замену обычной камеры: лидары и тепловизоры. Оба этих устройства способны зафиксировать количество людей, при этом не получая никакую информацию об их личности.
Лидары оказались более надежной технологией, так что поиграть в хищников из фильма со Шварценеггером нам не удалось.
Перешли к расчетам: какой лидар нам нужен, с каким углом обзора, в каком положении его установить возле билборда.
Высота, на которой заказчик планировал устанавливать наши устройства, около 3-4 метров.
Поэтому наш разработчик прямо на бумажке рассчитал, как лучше установить лидар, чтобы он получил всю нужную информацию. Оказалось, идеальный вариант, с минимальным числом слепых зон — установить лидар линзой вниз.
Оптимальной моделью оказалась MID-360. Компактная, высокое качество сборки, большое разрешение, а главное — 10 кадров в секунду.
Лидар передает данные в виде набора координат. Это текстовый файл, с которым не сможет работать ни одна из моделей компьютерного зрения.
Было два варианта, что делать:
Написали специальный софт, который превращает координаты в изображения. На таких изображениях невозможно рассмотреть лицо человека — фиксация данных на лидар не является нарушением GDPR.
Чтобы собирать данные и передавать их на сервер, мы:
Теперь вопрос, какую нейросеть использовать, чтобы считать людей на таких картинках с лидара? Мы решили использовать YOLO8, потому что она не требовательна к мощностям и есть много открытых библиотек, что упростило работу программистов.
При этом нам все равно пришлось обучить нейросеть, ведь до этого ей не приходилось выполнять именно такую задачу — считать фигуры людей на пиксельных изображениях, где можно различить только силуэт.
Чтобы обучать нейросети, нужен размеченный датасет. Что это такое? Это когда вы берете картинку и показываете нейросети, где находятся разные объекты.
В нашем случае это были фигуры людей. Мы сделали 8000 фотографий с лидара, разметили там людей и на этом материале обучили нейросеть. Вот как выглядят размеченные изображения, на которых мы учили YOLO8.
Готовый сервис работает следующим образом:
Итак! Нейросеть обучена, софт готов, лидар подключен к компьютеру и модему. Выходим на осеннюю питерскую улицу — тестировать.
Было холодно, лидар нужно было держать высоко над головой, мы устали, но вернулись с очень радостным чувством — наше изобретение заработало.
Теперь у нашего заказчика есть инструмент, который позволяет маркетологам узнать, какие точки наружной рекламы — самые эффективные, а на какие не стоит тратить деньги.
Конечно, проект еще не закончен — есть над чем поработать. Самое главное — нужно собрать все детали нашего устройства в одну красивую стильную коробку, которая не будет бояться ни жары, ни холода, ни дождя.
А еще нужно дообучить нейросеть, чтобы она понимала, в какую сторону идет человек и видит ли билборд. Это важно, так как большинство билбордов двусторонние, и на разных сторонах обычно разная реклама.
В своем Телеграм-канале я постоянно рассказываю о новинках в мире нейросетей и юзкейсах AI в разных сферах бизнеса. А еще — делюсь с подписчиками полезными гайдами и другими материалами. Подписывайтесь — я активно отвечаю на комменты, будем оставаться на связи :)