Собрали ИИ для проверки сайтов, нашли ошибку, скрывавшую полсайта от поиска.

Заказчик
Мы — ИТ-компания из Сочи, развивающая собственный корпоративный сайт с материалами на русском и английском: десятки статей, историй, описаний услуг.
Задача
С 1 марта 2026 года в России вступил в силу закон об ограничении иностранных слов. За использование слов не из разрешённого перечня — штраф.

Мы — ИТ-компания из Сочи, развивающая собственный корпоративный сайт с материалами на русском и английском: десятки статей, историй, описаний услуг. С 1 марта 2026 года в России вступил в силу закон об ограничении иностранных слов. За использование слов не из разрешённого перечня — штраф. На сайте больше сотни страниц. Ручная вычитка такого объёма — гарантированно пропущенная ошибка: на сотой странице глаз уже не тот. Нам нужно было уменьшение человеческого фактора там, где оно критически влияет на риски для бизнеса.

Изначально всё выглядело проще. Мы пришли к тестировщикам с запросом на разовую проверку: просто найти англицизмы. Те быстро выгрузили текст, прогнали через сервисы и отдали список. Но почти сразу мы вернулись с новыми вводными: нужна не разовая акция, а постоянная система, которая проверяет ещё и орфографию, грамматику, пробелы, знаки препинания. И чтобы работала сама, по расписанию, без нашего участия.

Цель: быстро, без внешних подрядчиков и платных лицензий сделать инструмент для ии проверки сайта — систему, которая будет регулярно обходить сайт, выискивать запрещённые слова, орфографию и грамматику, и присылать готовый отчёт.

Реализация

Тестировщик сел за ресёрч, выбрал ЛэнгвичТул — открытый сервис, смесь нейросетевого агента и лингвистической базы, — и за день написал сценарий на Пайтоне с использованием создания кода с помощью ИИ. Сценарий брал карту сайта, обходил страницы и прогонял текст через ЛэнгвичТул.

На старте мы упёрлись в неожиданную стену. Сценарий возвращал только 30 страниц из 103. Когда стали копать, выяснилось: половина сайта открывалась только по клику в браузере, а не по прямой ссылке. Для роботов — поисковых и нашего — эти страницы просто не существовали. Мы годами не знали, что контент не индексируется. Отправили баг команде фронтенда, те исправили — и сценарий впервые увидел все 103 страницы.

Дальше — итерационная доработка. ЛэнгвичТул ругался на заголовки без точек — добавили правило-исключение. Первая версия отчёта была неудобной, просто списком — переделали в структурированную страницу с аналитикой: где какое слово, на каких страницах, сколько всего уникальных заимствований. Настроили белый список разрешённых слов, которые система просто пропускает. Если завтра появится новый список — просто добавим его.

Мы не обещаем стопроцентной точности — это технологически невозможно. Поэтому в конвейере есть страховочный пояс — человек. Он открывает отчёт и принимает решение по каждой находке: исправить, пропустить или внести слово в белый список. Пара кликов — и сайт чист. Разница с ручной вычиткой колоссальная: раньше нужно было прочитать каждую из 103 страниц, теперь — просмотреть готовый список находок. На ручную вычитку ушли бы дни, здесь — минуты.

Сценарий полностью написан с использованием создания кода с помощью ИИ. Тестировщик описывал логику, нейросеть генерировала код, который тут же проверялся и дорабатывался. За счёт этого прототип собрали за день. Автоматизация ии разработки позволила не отвлекать серверную команду на раннем этапе.

Но есть нюанс: нейросеть не прибирает за собой, дописывает новое поверх старого. Кодовая база распухает. Мы прошли через несколько итераций: написали запрос — проверили — не подходит — добавили правки — проверили снова. Каждая итерация делала отчёт удобнее и точнее. Вывод: для прототипа — отлично, для стабильной работы — нужно профессиональное ревью и встройка в нормальную архитектуру.

Сейчас закладываем интеграцию в серверную часть: периодическая задача будет запускать сценарий раз в месяц и отправлять отчёт на почту. Никакого ручного запуска. Уменьшение человеческого фактора начинает работать на постоянной основе.

Результат

103 страницы проверяются за 10 минут. Авторы, которые внутренне готовились к неделям ручной вычитки, получают готовый структурированный отчёт и точечно правят найденное. Мы ожидали, что машина отловит процентов 70 ошибок — по факту точность и полнота оказались выше.

Попутно нашли и исправили баг, который годами скрывал полсайта от поисковиков. Материалы для зарубежных заказчиков, статьи, истории — всё снова доступно для индексации.

Весь проект реализован на бесплатных инструментах, без внешних подрядчиков и платных лицензий. ЛэнгвичТул — бесплатный, Пайтон — открытый язык, создание кода через нейросеть — тоже без дополнительных затрат. Сценарий написан за 1 день силами одного тестировщика. Уменьшение человеческого фактора достигнуто: рутина ушла, риск штрафов под контролем, проверка работает на постоянной основе.

Заключение

Механика не привязана к заимствованиям или конкретному рынку. Та же связка «обход сайта + лингвистический анализ + отчёт» работает для наблюдения за терминологией бренда, требованиями поисковиков, обновлением контента после смены названия. ЛэнгвичТул поддерживает десятки языков — инструмент можно приспособить под законы любой страны. Заменили список запрещённых слов на список терминов бренда — получили контроль фирменного стиля. Добавили правила проверки метатегов — получили SEO-мониторинг.

Мы не обещаем стопроцентной точности — встраиваем проверку человеком и белые списки. Слышим боль бизнеса: штрафы, невидимые материалы, тонны рутины. Уменьшение человеческого фактора — наша цель, а не просто слова. Используем создание кода с помощью ИИ для быстрой разработки прототипа. Автоматизация ии разработки — наш подход: быстро проверить предположение и только потом расширять. И попутно проверяем техническое здоровье сайта — такого подарка от ручной проверки не дождёшься.

Если вам нужна ии проверка сайта, которая снимет риски, уберёт рутину и попутно проверит техническое здоровье проекта — оставляйте заявку. Мы собираем такие инструменты за 1 день.


Перейти на сайт

В карточку агентства

Письмо автору кейса

Пользуйтесь реальным опытом в IT и следите за успехами потенциальных подрядчиков и конкурентов
Подпишитесь на рассылку
Подпишитесь
на наши каналы в MAX или Телеграм, чтобы не пропускать новые материалы
MAXКанал в MAXTelegramКанал в TG
Кейсы по теме#Информационные и инженерные технологии

©2007-2026

Проекты компании Proactivity Group
Нажмите «ОК», если вы соглашаетесь с условиями обработки cookie и ваших данных о поведении на сайте, необходимых для аналитики. Запретить обработку cookie можете через браузер