Обнаружение подделок мп3 сделанных ИИ.

Обученные подмодели.

Технологическая компания Remark AI, специализирующаяся на клонировании голосов, представила новое поколение своей модели распознавания фейков. Точность данной модели достигает 94%.

Detect-2B использует серию предварительно обученных подмоделей и тонкую настройку для изучения аудиоклипа и определения, был ли он сгенерирован с помощью искусственного интеллекта. Этот процесс включает в себя анализ различных аспектов аудиозаписи, таких как тон, тембр, ритм и другие характеристики, которые могут указывать на то, что запись была создана искусственно. Если модель определяет, что запись является подделкой, она классифицирует ее как таковую. Если же запись считается подлинной, она классифицируется как реальная.

Управление сегодняшним ландшафтом угроз в машинном масштабе.

“Основываясь на прочном фундаменте нашей оригинальной модели обнаружения, DETECT-2B представляет собой значительный скачок вперед с точки зрения архитектуры модели, обучающих данных и общей производительности. Результатом является чрезвычайно надежная и точная модель обнаружения подделок, которая достигает замечательного уровня производительности при сравнении с огромным набором данных реальных и поддельных аудиоклипов ”, – говорится в сообщении компании в самом блоге.

Подделки мп3

По словам Simple, подмодели Detect-2B “состоят из замороженной модели представления звука с модулем адаптации, встроенным в ее ключевые слои”. Модуль адаптации смещает фокус моделей в сторону артефактов — или случайных звуков, оставленных на записи, — которые часто отличают настоящий звук от поддельного. Большинство аудиоклипов, сгенерированных искусственным интеллектом, могут звучать “слишком чисто”. Detect-2B может предсказать, какая часть звука произведена искусственным интеллектом, без переподготовки модели каждый раз, когда она прослушивает новый клип. Подмодели также обучаются на больших наборах данных.

Модель Detect-2B, созданная компанией Reminish, способна анализировать свои показатели прогнозирования и сравнивать их с установленным пороговым значением, чтобы определить, является ли аудиозапись подлинной или фальшивой. Отмечается, что метод, использованный исследователями Reminish при разработке Detect-2B, позволяет быстро обучать модель, не требуя при этом значительных вычислительных ресурсов для её внедрения.

Стохастические архитектуры упрощают работу со звуковыми сигналами.

Архитектура модели базируется на моделях Mamba-SSM или пространства состояний, которые не зависят от статических данных или повторяющихся паттернов. Вместо этого применяется стохастическая, или случайная вероятностная, модель, которая лучше адаптируется к различным переменным. Компания Reminish утверждает, что такая архитектура эффективно функционирует в контексте обнаружения звука, поскольку она способна улавливать разнообразную динамику в аудиоклипах, гибко переключаться между состояниями аудиосигнала и сохранять работоспособность даже при работе с записями низкого качества.

Компания Simple запустила свою платформу в апреле текущего года. Модель Detect-2B, предназначенная для обнаружения подделок, будет доступна через API и может быть интегрирована в различные приложения, что обеспечит их способность выявлять и подтверждать серьезные подделки до того, как они станут достоянием общественности

Чтобы оценить модель, компания Reminish заявила, что провела тест Detect-2B, который включал невидимые динамики, звук, сгенерированный deepfake, и различные языки. Компания заявила, что модель корректно обнаружила подделку звука для шести разных языков с точностью не менее 93%.

Эффективность обнаружения с помощью Detect-2B на разных языках
Detect-2B показал высокие результаты в прогнозировании глубоко подделанного звука на шести языках. Источник: Remark AI

Выявление глубоких подделок стало более важным.

Важность идентификации голосов или видео, сгенерированных искусственным интеллектом, особенно актуальна в преддверии президентских выборов в США в 2024 году. Использование искусственного интеллекта для создания голосов может упростить введение избирателей в заблуждение и распространение дезинформации. Существуют опасения по поводу глубоких подделок с помощью искусственного интеллекта, включая подделку голосов политиков, имитацию знаменитостей в песнях или просто использование искусственного интеллекта для иллюстрации чего-либо, что подрывает доверие к брендам.

Инструменты, такие как Detect-2B, могут значительно помочь в выявлении и доказательстве серьезных подделок до того, как они станут достоянием общественности. Detect-2B – не единственный инструмент, работающий для обнаружения клонов искусственного интеллекта. McAfee запустила Project Mockingbird в январе для обнаружения звука, сгенерированного искусственным интеллектом, в то время как Meta разрабатывает способ добавления водяных знаков к аудио, генерируемому искусственным интеллектом.

“Наша работа далека от завершения. По мере того, как генеративные возможности искусственного интеллекта продолжают развиваться, должны развиваться и наши возможности обнаружения. У нас запланировано несколько интересных направлений исследований по дальнейшему совершенствованию DETECT-2B, включая улучшение обучения представлению, разработку расширенных архитектур моделей и расширение данных”, – сказал представитель Detect-2B.

Прокрутить вверх