
Как запретить незаконное использование лица в рекламе?
09.03.2026
Как остановить шантаж бывшего сотрудника, угрожающего сливом данных?
10.03.2026Всем привет, меня зовут Антон Таранов, я ведущий специалист агентства Pantera Digital. Только за первые месяцы 2026 года мы помогли 65 клиентам успешно решить проблему с защитой личных и коммерческих изображений от парсинга — в том числе через механизмы удаления из обучающих датасетов. Если вы ищете защиту репутации частных лиц в цифровом пространстве, эта статья даст вам конкретный алгоритм действий. Сегодня мы детально разберём, как действовать в такой ситуации.
Антон Таранов | Ведущий специалист по ORM
В этой статье я поделюсь алгоритмами и правовыми механизмами, которые наша команда применяет на практике прямо сейчас, в 2026 году. Никакой теории — только проверенные инструкции.
Кто сталкивается с этой проблемой
Ситуация не экзотическая. Ежедневно миллионы изображений автоматически собираются из открытого интернета и попадают в обучающие датасеты — без уведомления авторов и без их согласия. Вот типичные сценарии, с которыми приходят ко мне:
📸
Личные фото без согласия
Ваши портреты или семейные снимки попали в датасет LAION-5B через индексацию публичных страниц в соцсетях или личного сайта.
🎨
Кража авторского стиля
Вы — фотограф или художник. Ваши работы использованы для обучения генеративной модели, которая теперь воспроизводит ваш стиль по запросу.
💼
Коммерческие изображения бренда
Корпоративные фотографии, продуктовые снимки или фото сотрудников оказались в открытом датасете и используются конкурентами через ИИ-генерацию.
⚖️
Нарушение права на изображение
Ваше лицо используется нейросетью для генерации контента без вашего ведома — это прямое нарушение охраны изображения гражданина.
🔍
Обнаружение факта постфактум
Вы случайно узнали, что ваши снимки есть в датасете — через поиск по изображениям или публикации исследователей.
Экстренные действия в первые 24 часа
Паника здесь не помогает. Нужна фиксация. Вот что делать немедленно.
Определите, где именно используются ваши фото
Первый инструмент — Have I Been Trained (haveibeentrained.com). Сервис позволяет загрузить изображение и проверить его наличие в датасете LAION-5B — крупнейшем открытом датасете для обучения нейросетей, содержащем более 5 миллиардов пар «изображение — описание». Параллельно используйте Google Images и TinEye для обратного поиска по изображению.
Также проверьте датасеты через Hugging Face — платформу, где хранятся и распространяются многие обучающие наборы данных. Поиск по имени автора или URL источника иногда даёт прямые результаты.
Соберите доказательства использования изображений
Сделайте скриншоты с отметкой времени. Зафиксируйте URL страниц, где обнаружены ваши изображения. Если сервис показывает метаданные — сохраните их. Для нотариального заверения скриншотов в России используйте услугу нотариального протокола осмотра сайта — это усилит доказательную базу при последующих претензиях.
Подготовьте запрос на удаление данных
Определите правовую основу: вы гражданин ЕС или обрабатываете данные европейских граждан — используйте GDPR (Общий регламент о защите данных). Вы правообладатель контента, размещённого на американских платформах — используйте DMCA (Закон об авторском праве в цифровую эпоху). В российской юрисдикции опирайтесь на закон о персональных данных (152-ФЗ) и нормы ГК РФ об авторском праве.
Механика проблемы: как это работает
Как нейросети парсят и используют изображения
Парсинг — это автоматический сбор данных из интернета с помощью программ-краулеров. Для формирования обучающих датасетов организации сканируют Common Crawl — гигантский архив веб-страниц — и извлекают из него пары «URL изображения — альтернативный текст». Именно так был создан LAION-5B: не путём ручного отбора, а через автоматическую фильтрацию миллиардов ссылок.
Ваше фото не копируется физически в датасет на этапе формирования — в него попадает лишь ссылка и описание. Но при обучении модели изображение загружается по этой ссылке, обрабатывается и «встраивается» в веса нейросети. После этого удаление ссылки из датасета не удаляет информацию из уже обученной модели.
Процесс включения данных в датасеты
Схема выглядит так: Common Crawl → фильтрация по CLIP-модели (отбор релевантных пар) → формирование датасета → публикация на Hugging Face или аналогичной платформе → использование для обучения моделей типа Stable Diffusion, DALL-E и других.
Ключевой момент: большинство датасетов формируются без проверки авторских прав на каждое изображение. Это системная проблема, а не случайность.
Юридические аспекты использования изображений
В российском праве использование фотографии гражданина без его согласия нарушает статью 152.1 ГК РФ. Авторские права на фотографии охраняются статьёй 1259 ГК РФ. Обработка биометрических данных (а изображение лица — это биометрия) без согласия субъекта нарушает 152-ФЗ. Подробнее о смежных рисках — в нашем материале о том, что такое незаконный сбор биометрии и как с ним бороться.
В европейском праве GDPR статья 17 закрепляет «право на забвение» — субъект данных вправе потребовать удаления своих персональных данных. Изображение лица однозначно квалифицируется как персональные данные. Штрафы за нарушение GDPR — до 20 млн евро или 4% от глобального годового оборота компании.
Пошаговый маршрут решения

Шаг 1: Проверка наличия ваших фото в датасете
- Перейдите на haveibeentrained.com
- Загрузите изображение или введите URL
- Сервис покажет совпадения в датасетах LAION-5B, LAION-Aesthetics и других
- Зафиксируйте результаты скриншотом с датой
- Дополнительно проверьте через clip-retrieval.huggingface.co — поиск по семантическому сходству в датасете
Шаг 2: Подготовка запроса на удаление через DMCA или GDPR
Для DMCA (если вы правообладатель и изображение размещено на американской платформе):
- Установите, кто является DMCA-агентом платформы (обычно указано в разделе Legal или Terms of Service)
- Подготовьте уведомление с указанием: вашего имени и контактов, описания защищённого произведения, URL нарушения, заявления о добросовестности и подписи
Для GDPR (если вы гражданин ЕС или данные обрабатываются европейской организацией):
- Направьте запрос на erasure (удаление) в адрес Data Protection Officer организации
- LAION e.V. — немецкая некоммерческая организация, подпадающая под GDPR
- Контакт для запросов: contact@laion.ai
Для российской юрисдикции:
- Направьте претензию на основании 152-ФЗ и ГК РФ
- При отсутствии реакции — жалоба в Роскомнадзор
Шаг 3: Отправка запроса и отслеживание статуса
Отправляйте запрос в письменном виде с подтверждением получения. Для email — запросите read receipt. Для почтовых отправлений — используйте заказное письмо с уведомлением. Зафиксируйте дату отправки: по GDPR организация обязана ответить в течение 30 дней. По DMCA платформа обязана отреагировать оперативно во избежание собственной ответственности.
Шаг 4: Подтверждение удаления данных
После получения подтверждения об удалении повторно проверьте датасет через haveibeentrained.com. Учтите: удаление из датасета не означает удаление из уже обученных моделей — это технически невозможно без переобучения модели. Однако удаление из датасета предотвращает использование в будущих обучающих циклах.
Шаблоны документов
Столкнулись с такой же проблемой?
Самостоятельные запросы нередко отклоняются из-за технических ошибок в формулировках или неверно выбранной правовой основы. Мы проведём бесплатный анализ вашей ситуации и определим оптимальный маршрут удаления.
Пороговые ситуации: когда нужны специалисты
Если запрос на удаление отклонён
Отказ должен быть мотивированным. Если организация ссылается на «законный интерес» или «научные цели» — это не автоматическое основание для отказа. По GDPR вы вправе обжаловать решение в надзорном органе: в Германии это Bundesbeauftragter für den Datenschutz (BfDI). Параллельно можно направить жалобу в надзорный орган по месту вашего проживания.
Если данные продолжают использоваться после удаления
Зафиксируйте факт продолжения использования. Это основание для подачи иска о возмещении ущерба. В европейской практике уже есть прецеденты взыскания компенсаций с организаций, игнорирующих GDPR-запросы. Если речь идёт о незаконном использовании лица в рекламе или коммерческих целях — масштаб претензий существенно возрастает.
Если требуется юридическая поддержка
Ситуации, требующие привлечения юриста: организация зарегистрирована в юрисдикции с ограниченной правовой защитой; ущерб носит коммерческий характер и поддаётся оценке; изображения используются для создания дипфейков или дискредитирующего контента. В таких случаях параллельно с юридическим сопровождением имеет смысл подключить ORM-специалистов для мониторинга распространения контента.
Превентивные меры и защита
Как предотвратить попадание фото в датасеты
Первый инструмент — файл robots.txt. Добавьте директиву, запрещающую индексацию изображений краулерами датасетов. Это не даёт 100% гарантии, но снижает вероятность автоматического парсинга.
User-agent: CCBot Disallow: / User-agent: GPTBot Disallow: /
Второй инструмент — мета-тег noai и noimageai в HTML-коде страниц с изображениями. Ряд организаций уже учитывает эти директивы при формировании датасетов.
Третий инструмент — ограничение разрешения публикуемых изображений. Снимки с разрешением ниже 512×512 пикселей менее ценны для обучения моделей и реже включаются в датасеты.
Использование цифровых водяных знаков
Цифровой водяной знак — это скрытая метка, встроенная в изображение на уровне пикселей. Она невидима глазу, но позволяет отследить источник утечки. Инструменты: Imatag, Digimarc, а также открытый проект Stable Signature от Meta. Последний встраивает водяной знак непосредственно в процессе генерации изображения.
Для фотографов и художников рекомендую также инструмент Glaze (от Чикагского университета) — он вносит минимальные изменения в изображение, незаметные человеку, но существенно искажающие то, как нейросеть «видит» и запоминает ваш стиль.
Регулярный мониторинг использования изображений
Настройте Google Alerts на своё имя и названия ключевых работ. Используйте TinEye и Google Reverse Image Search на регулярной основе — минимум раз в квартал. Для профессиональных фотографов существуют платные сервисы мониторига: Pixsy, ImageRights. Они автоматически отслеживают появление ваших изображений в сети и формируют отчёты о нарушениях.
Также рекомендую периодически проверять раздел защита биометрических данных — там мы регулярно обновляем информацию об актуальных инструментах мониторинга.



