На прошлой неделе оператор OpenAI сделал для меня следующее:
-
Заказал мне новый шарик мороженого на Amazon.
-
Купил мне новое доменное имя и настроил его параметры.
-
Забронировал дату на День святого Валентина для меня и моей жены.
-
Запланирована стрижка.
Он выполнял эти задачи в основном автономно, хотя мне приходилось время от времени подталкивать его вперед и время от времени спасать его из петли неудачных попыток.
Если вы только наверстаете упущенное или отвлеклись на новости DeepSeek на этой неделе, которые затмили все остальные новости об искусственном интеллекте, Operator — это новый так называемый агент искусственного интеллекта, выпущенный на прошлой неделе компанией OpenAI.
Инструмент, который был заявлен как «предварительная версия исследования», доступен только людям, которые платят 200 долларов в месяц за самый высокий уровень подписки компании, ChatGPT Pro. Это дает пользователям возможность управлять агентом искусственного интеллекта, который может использовать веб-браузер, заполнять формы и выполнять другие действия от имени пользователя.
Агенты искусственного интеллекта сейчас в моде в Кремниевой долине. Некоторые инсайдеры отрасли считают, что это следующий большой шаг в развитии возможностей искусственного интеллекта, потому что агент искусственного интеллекта, который может использовать компьютер, может выполнять ценные задачи в реальном мире, а не просто оказывать помощь. Многие из ведущих компаний в области искусственного интеллекта, в том числе Google и Anthropic, тестируют автономных агентов, которых, как они утверждают, компании в конечном итоге смогут «нанимать» в качестве полноценных работников.
Я обновил свою подписку на ChatGPT, чтобы испытать Operator и посмотреть, что агент искусственного интеллекта может сделать для меня.
На первый взгляд, Operator немного похож на обычный ChatGPT, за исключением того, что когда вы даете ему задание — например, «Купите мне 30-фунтовый мешок собачьего корма на Amazon» — оператор открывает миниатюрное окно браузера, набирает «Amazon.com» в адресной строке и начинает щелкать мышью, пытаясь следовать вашим инструкциям.
В нем может быть задано несколько уточняющих вопросов. (Вы хотите еду со вкусом курицы или говядины? Ночная доставка или двухдневная?) Затем, когда оператор чувствует себя уверенным в том, что сделал правильный выбор, он предлагает вам окончательное подтверждение, кладет корм для собак в корзину и оформляет заказ. (Оператор не будет вводить пароли или номера кредитных карт — вам придется взять на себя управление мини-браузером и ввести эти данные самостоятельно — но все остальное он сделает сам.)
Весь смысл Operator в том, что вам не нужно контролировать его — он может выполнять задачи в фоновом режиме, пока вы занимаетесь другими делами. Но я обнаружил, что прикован к окну, загипнотизированный видом беспилотного веб-браузера, который нажимает на кнопки, вводит слова в поля и выбирает из выпадающих меню, и все это самостоятельно. Смотри, Ма, компьютер с компьютером!
Operator также впечатляюще хорошо справился с несколькими относительно простыми задачами, которые я ему дал:
-
Он успешно заказал обед на DoorDash для моего коллеги Майка и отправил его ему домой. (Я не сказал, что ему заказать, но оператор выбрал мексиканский ресторан, выбрал для него несколько блюд и даже дал чаевые курьеру в размере 7 долларов.)
-
Он ответил на сотни непрочитанных сообщений LinkedIn за меня после того, как я дал ему контроль над своим профилем LinkedIn. (Хотя, к моему ужасу, он также зарегистрировал меня на вебинар.)
-
Для меня это заработало 1,20 доллара, создав аккаунты на сайтах, которые предлагают небольшие денежные вознаграждения за заполнение опросов. (Возможно, это принесло бы больше, но я начал чувствовать себя виноватым за то, что засорял опросы фальшивыми, написанными роботами ответами.)
Но Operator также не справился с кучей других задач и выявил свои ограничения:
-
Он не смог отсканировать мои последние колонки и добавить их на мой личный сайт, потому что браузер оператора был заблокирован для входа на сайт Times. (Он также заблокирован на ряде других сайтов, включая Reddit и YouTube. The Times подала в суд на OpenAI и Microsoft за нарушение авторских прав, связанных с обучением моделей искусственного интеллекта.
-
Он не стал бы играть в онлайн-покер для меня. (Оператор ответил: «Я не могу помочь с азартными играми или связанными с ними действиями», что казалось разумным отказом, учитывая хаос, который может создать игровой бот.)
-
А войти на ряд сайтов ему помешали тесты CAPTCHA. (Что меня обнадеживает, учитывая, что весь смысл CAPTCHA заключается в том, чтобы отпугивать роботов.)
В целом, я обнаружил, что использование Operator обычно приносит больше хлопот, чем пользы. Большую часть того, что он сделал для меня, я мог бы сделать сам быстрее, с меньшим количеством головной боли. Даже когда это работало, он требовал столько подтверждений и заверений, прежде чем действовать, что я чувствовал себя не столько виртуальным помощником, сколько тем, что я руковожу самым неуверенным в себе стажером в мире.
Это, конечно, первые дни для агентов ИИ. Продукты с искусственным интеллектом имеют тенденцию улучшать from от версии к версии, и можно с уверенностью сказать, что следующие итерации Operator будут лучше. Но в своем нынешнем виде Operator — это скорее интригующая демоверсия, чем продукт, который я бы рекомендовал использовать, и определенно не то, на что большинству людей нужно тратить 200 долларов в месяц.
Тем не менее, я думаю, что было бы ошибкой списывать со счетов агентов искусственного интеллекта. Когда они станут более способными, они смогут начать заменять людей в некоторых профессиях. (OpenAI и Meta уже заявили, что создают агентов для инженеров с искусственным интеллектом.) Некоторые эксперты опасаются, что более мощные, неограниченные агенты искусственного интеллекта могут представлять угрозу безопасности, если они научатся выполнять такие команды, как «опустошить банковский счет» или «выполнить кибератаку».
Запуск группы агентов искусственного интеллекта в Интернет также может спровоцировать негативную реакцию со стороны веб-издателей, сайтов электронной коммерции и других предприятий, которые полагаются на трафик, генерируемый человеком, чтобы оплачивать свои счета. (Если вы занимаетесь покупкой рекламы на Amazon, вы хотите, чтобы эту рекламу видели люди, а не боты, притворяющиеся людьми.) В будущем я могу представить, что все больше веб-сайтов будут предпринимать шаги по блокировке агентов искусственного интеллекта или направлять их на определенные страницы или продукты.
В настоящее время агенты искусственного интеллекта слишком некомпетентны, чтобы представлять серьезную угрозу. Но не нужно много воображения, чтобы представить себе ближайшее будущее, в котором большая часть Интернета будет состоять из роботов, разговаривающих с роботами, покупающих вещи у роботов и пишущих электронные письма, которые будут читать только другие роботы.
Беспилотный интернет уже почти здесь, другими словами — подключайтесь к ним, пока можете.