Google предлагает создать единый «водяной знак» для ИИ-контента

Фото: Trac Vu, Unsplash.com

Фото: Trac Vu, Unsplash.com

Новая технология от компании активно внедряется в крупнейшие и популярные нейросети.

Google начал активно распространять свою новую технологию, которая позволит обозначить в сети контент, сгенерированный искусственным интеллектом, сообщает портал Mashable.

Речь идет о технологии SynthID, которую недавно представили на большой презентации корпорации. Новая функция уже доступна в «Поиске».

Теперь пользователь может выяснить, использовался ли ИИ при создании изображения. Но Google решил работать сразу с источником. Объем данных с каждым днем растет, что не позволяет охватить все изображения, видео или музыку, созданные ИИ. Поэтому Google предлагает маркировать такой контент специальными «водяными знаками» прямо во время генерации.

Как это будет работать?

Технология SynthID уже на этапе генерации добавляет в изображение, видео, аудио или текст специальный незаметный сигнал. Такой маркер сохраняется даже после редактирования, сжатия или пересылки и помогает определить, что материал был создан нейросетью.

Если раньше все могло ограничиваться метаданными, от которых легко избавиться, то новая фишка от Google делает «водяной знак» частью ИИ-контента.

При генерации изображений специальный блок нейросети – embedder – начинает работать одновременно с основной генеративной моделью. Он вносит крошечные, математически рассчитанные корректировки в значения пикселей, распределяя их равномерно по всей площади кадра. Эти изменения формируют уникальный статистический «узор», который не создает видимых артефактов и не влияет на четкость, цвета или композицию.

Искусственный интеллект

Фото: Freepik.com

Впоследствии специальные детекторы могут обнаружить эти пиксели. То же касается создания видео, однако здесь невидимый «узор» вшивается сразу в каждый кадр, что дает возможность SynthID определить нейровидео, даже если оно было сжато, обрезано или изменен формат.

В случае со звуком система использует особенности человеческого слуха. Во время генерации SynthID встраивает маркер прямо в звуковую волну, но делает это в тех частях сигнала, которые человеческое ухо не улавливает.

С текстом SynthID работает иначе, чем с изображениями или звуком.

Во время генерации система слегка меняет вероятность выбора отдельных слов и фраз, формируя скрытый статистический отпечаток. Для читателя текст выглядит совершенно обычным – не меняется ни стиль, ни смысл, ни связность изложения.

Однако специальный детектор в дальнейшем может проанализировать последовательность токенов и определить, что материал был создан моделью с поддержкой SynthID. При этом саму языковую модель не нужно переобучать: технология подключается уже на этапе генерации текста.

Кто уже начал маркировать контент?

Google уже начал активно внедрять свою технологию в крупнейшие ИИ-модели. Так, к примеру, SynthID внедряют OpenAI для изображений в ChatGPT, Codex и через API, NVIDIA в своих моделях Cosmos, а также Kakao и ElevenLabs.

Однако многие нейросети используют собственные «маркировки» контента или вовсе не применяют их. Google настаивает на том, что если компаний, которые будут использовать технологию, станет больше, то распознавать синтетический контент в сети станет гораздо проще.