Надежны ли генеративные детекторы искусственного интеллекта? С момента вторжения в Интернет контента, созданного генеративными искусственными интеллектами (в частности, ChatGPT), обнаружение этого типа контента стало приоритетом. В своем последнем обновлении поисковой системы Google объявил, что будет наказывать некачественный контент. Итак, я протестировал 11 бесплатных инструментов обнаружения генеративного ИИ, чтобы найти наиболее надежный. Как вы увидите в этой статье, результаты далеко не однородны и часто очень разочаровывают.

Свяжитесь с IntoTheMinds, Агентством маркетинговых исследований

Контент, написанный генеративными искусственными интеллектами, стал проклятием Интернета, что побудило некоторых заявить, что его контент на 100% создан человеком. Google оказался в ловушке своей собственной игры. Это требовало «свежего» контента, что и произошло, когда ChatGPT стал доступен широкой публике. Некоторые люди ухватились за возможность создавать контент, который был оригинальным только по названию. Как я показал в другом исследовании, уровень сходства текстов, создаваемых ChatGPT, чрезвычайно высок. Вероятно, у вас уже возникли подозрения относительно происхождения текста, публикации в социальных сетях или комментария, когда вы его прочитали. Когда это пишет генеративный ИИ, это видно.

Столкнувшись с проблемой контента, создаваемого генеративными искусственными интеллектами, появились инструменты для их обнаружения. Я выбрал 11 из них и протестировал их.

Методология

Чтобы проверить способность различных инструментов распознавать тексты, написанные генеративным ИИ, я подготовил корпус, состоящий из:

  • 3 текста, полностью написанные Chat GPT4.0 на английском языке.
  • 3 французских перевода текстов, написанных ChatGPT
  • 3 текста из моего блога, полностью написанные мной на французском языке
  • 3 английских перевода текстов, написанных мной

В итоге у меня получилось 12 текстов, распределенных следующим образом:

Затем я прогнал каждый текст с помощью инструментов, перечисленных в конце этой статьи.

Я использовал только бесплатные версии различных инструментов. В случае Scribbr и Copyleaks французские тексты проанализировать не удалось.

Результаты суммированы в следующей таблице. Тексты с 1 по 6 были созданы Chat GPT 4.0. Тексты с 7 по 12 были написаны мной на французском языке, а затем переведены на английский. За номером текста в скобках указан язык текста.

Результаты в таблицах ниже соответствуют процент текста, который был обнаружен как написанный генеративным ИИ.

Обнаружение текстов, написанных генеративным ИИ

В таблице ниже показаны результаты работы различных инструментов, используемых для обнаружения текстов, полностью написанных ChatGPT. Указанный процент соответствует доле текста, которую инструмент приписывает генеративному ИИ. В случае Neuralwriter процент соответствует уверенности инструмента в приписывании контента генеративному ИИ.

Для Copyleaks и Scribbr французский язык не может быть проанализирован в бесплатной версии.

Scribbr и Copyleaks лучше всего работают с английской версией: англоязычный контент, созданный ChatGPT, обнаруживается в 3 случаях из 3. Detecting-ai.com и Copyleaks работают почти так же хорошо с английской версией. Тем не менее, им нужна помощь в анализе контента, написанного на французском языке.

Если вы ищете детектор искусственного интеллекта, который работает на обоих языках, Quillbot предлагает лучший компромисс для этого теста.

С другой стороны, plagiarismdetector.net и freetextclassifier ничего не обнаруживают, и их следует избегать независимо от языка.

Другие детекторы искусственного интеллекта работают умеренно хорошо и допускают ошибки разной важности.

Обнаружение текстов, написанных людьми

Вторая часть теста направлена ​​на правильное обнаружение текстов, написанных человеком (в данном случае мной). Это не задача для генеративного ИИ. Таким образом, искомые значения в таблице ниже составляют 0% в каждом столбце.

Freeaitextclassifier возвратил ошибки и не смог быть протестирован.

Вот результаты.

Несколько инструментов генеративного обнаружения ИИ работают безупречно: Quillbot, Detecting-ai.com, contenscale, plagiarismdetector.net. Copyleaks, которая обрабатывает английский только в своей бесплатной версии, однажды ошиблась, приписав половину текста 8 генеративному ИИ.


Как правило, инструменты обнаружения генеративного искусственного интеллекта реже ошибаются в отношении контента, написанного человеком.


Окончательные результаты

Чтобы определить победителя(ов) этого теста, конечно, необходимо принять во внимание 2 теста. Недостаточно обнаружить текст, написанный ИИ. Также важно не приписывать ИИ текст, написанный человеком. Поскольку тест проводится на двух языках (французском и английском), бесплатная версия инструмента должна поддерживать оба языка.

Quillbot — явный победитель этого теста. Этот детектор AI выполняет безупречно на контенте, написанном человеком и почти безупречен в отношении контента, написанного ChatGPT. (в среднем 96% обнаружения по 6 предоставленным текстам).

Хочу отметить Copyleaks, который допустил всего одну ошибку, но правильно определил остальной англоязычный контент. Напоминаем, что платная версия Copyleaks поддерживает французский язык.

Все остальные инструменты допускают ошибки в большей или меньшей степени, но я заметил следующее: в целом, инструменты генеративного обнаружения ИИ реже ошибаются, когда дело касается контента, написанного человеком. Это весьма парадоксально.

Следует избегать двух сайтов, поскольку они систематически ошибочны: freeaitextclassifier (который тоже работает лишь иногда) и plagiarismdetector.net.



Опубликовано в Данные и ИТ.