Тексты без даты: у журналистов есть 30 лет, пока их не заменит ИИ

НА ГЛАВНУЮ / К НОВОСТЯМ

Искусственный интеллект уже довольно неплохо пишет новости. Но до создания длинных осмысленных текстов ему далеко. К тому же компаниям не слишком интересно вкладываться в уничтожение второй древнейшей профессии. О перспективах роботов-журналистов «Известия» поговорили с основателем ABBYY Давидом Яном и научным сотрудником DeepMind Алексом Грейвсом на форуме Global Innovation Forum 2019 в Ереване.

Новости о погоде и пробках, заметки по квартальным отчетам журналисты давно пишут по шаблонам. Просто меняют названия улиц или компаний и дописывают новые цифры. Чтобы освободить их от механической работы, уже несколько компаний, в том числе российских, используют искусственный интеллект.

Разница между автоматизацией и контролем

Научный сотрудник британской компании DeepMind Алекс Грейвс признает, что машины будут заниматься новостями всё больше и больше. Но то, что требует от человека креативности, не будет отдано алгоритмам. По крайней мере в ближайшее время, сказал он «Известиям» на форуме Global Innovation Forum 2019 в Ереване. Пусть это его мнение не слишком соответствует тому, что принадлежащая Google компания DeepMind прославилась созданием нейросети, обыгравшей чемпиона мира по го.

Научный сотрудник Google DeepMind Алекс Грейвс уверен: то, что требует от человека креативности, не будет отдано алгоритмам

Фото: Игнат Шестаков

Алекс Грейвс, DeepMind

Главный вопрос, который должен задавать себе человек: «То, что я делаю сейчас, это механический процесс? Чувствую ли я, что просто следую списку правил?» Если так, это, скорее всего, может быть автоматизировано.

Ученый не считает, что технологический прогресс лишит людей работы. Грейвс напомнил, как в XVIII–XIX веках промышленная революция уничтожила одни рабочие места и создала другие. К тому же в креативных индустриях человек всё равно будет контролировать процесс.

Global Innovation Forum 2019 образец рукописного текста

Образец рукописного текста, созданного алгоритмом. Из презентации Алекса Грейвса на Global Innovation Forum 2019

Фото: Игнат Шестаков

«Есть разница между автоматизацией и сохранением контроля. Это как использовать программы для обработки фотографий. Приемы, которые там есть, имеют семантику. Ты вкладываешь смысл в фильтры, которые накладываешь, — сказал Грейвс. — Не думаю, что и это [программы генерации текстов] будет работать как: «Напиши мне статью». По крайней мере, надо будет уточнить, о чем будет статья. Даже если ты скажешь: «Напиши мне 10 статей, и я выберу лучшую», — ты всё равно будешь контролировать процесс».

Давид Ян, основатель компании ABBYY, тоже полагает, что машина скорее станет помощником, чем лишит работы журналиста. Ян, также выступивший на форуме, напомнил, что программы уже пишут короткие новостные заметки. Но ждать от них «глубоких осмысленных текстов с какими-то интересными аналитическими находками в ближайшие 30 лет не нужно».

Основатель ABBYY Давид Ян считает, что программы, пишущие статьи, появятся как побочный эффект развития

Фото: Игнат Шестаков

Давид Ян, ABBYY

Система будет давать очень неплохой каркас для будущей статьи. Это уже будет через несколько лет. Вот я говорю: «Я хочу написать статью на такую-то тему». И система начнет искать, анализировать цитаты, высказывания, статистику, какие-то интересные факты, логические связки, корреляции. То, на что в таком объеме журналисту потребовалось бы месяц, она сможет выдавать через час. Но способность дальше оформить это в яркий, искрометный, остроумный, связанный логически текст, на мой взгляд, в ближайшие 20–30 лет не появится.

Более того, Алекс Грейвс считает, что исследования в области автоматической генерации текста находятся в самом зародыше. Гораздо более развито, например, машинное распознавание голоса. А, по мнению Яна, появление программ, пишущих большие осмысленные статьи, будет скорее побочным эффектом общего развития искусственного интеллекта.

«В первую очередь это сделают Google и Facebook. И они это не для того, чтобы зарабатывать деньги, сделают, — уверен бизнесмен. — Возможность формулировать длинные связные тексты с очень интересной необычной логической подачей — это в целом нужно для AGI (artificial general intelligence), это отчеты компаний, письма сотрудников. Система, которая научится это делать, будет в принципе делать много чего. Тогда же появится и литература».

график с презентации Давида Яна на Global Innovation Forum 2019

Какую часть работы людей в разных сферах заберет алгоритм через пять лет. Из презентации Давида Яна на Global Innovation Forum 2019

Фото: Игнат Шестаков

«Global Innovation Forum 2019. Transforming Intelligence», который прошел в Ереване в середине октября, был посвящен использованию искусственного интеллекта в разных сферах науки и жизни. В этом году в нем приняли участие более 800 участников и 90 спикеров из более 20-и стран мира, среди которых были ученые университетов Гарварда, Стэндфорда, Беркли и Эдинбурга, Массачусетского технологического института, в том числе исследователи с таким высоким индексом Хирша, как h-index 126. Основными спикерами GIF19 выступили также представители инновационной и бизнес сфер, исследователи таких ведущих мировых компаний, как «Google DeepMind», «Google Brain», «Facebook AI», «Microsoft», «Flagship Pioneering». Гости форума побывали не только на площадке для лекций, но и в офисе стартап-акселератора FAST (Фонда науки и технологий Армении) и образовательном центре для детей площадью 6 тыс. квадратных метров «TUMO».

Отложенное восстание машин

Описанные Яном программы, которые помогают писать, но не пишут за людей, уже существуют. Хотя у них не такой широкий функционал, да и работают они преимущественно на английском. Например, Grammarly, которая указывает пользователям на грамматические и пунктуационные ошибки, а также предлагает более удачные речевые обороты. Этот киевский стартап купил в 2012 году и перевез в Калифорнию венчурный капиталист Брэд Хувер.

В мае 2018 года Google предложила полумиллиарду пользователей почтового клиента Gmail потестировать похожую Smart Compose. Программа анализирует начало фразы и предлагает ее окончание, исходя из манеры письма пользователя и того, как пишут другие пользователи, похожие на него по разным параметрам.

Google создала программу для клерков, которые тратят до четверти рабочего дня на бизнес-переписку. Автор книги «Nobrow. Культура маркетинга. Маркетинг культуры» Джон Сибрук написал, что после долгого сопротивления сдался ей.

Джон Сибрук, The New Yorker

Письмо своему сыну я начал с «я тобой» и собирался написать «доволен», когда алгоритм предложил «горжусь». Ого, я нечасто это говорю. А Smart Compose считает, что так пишут письма сыновьям большинство отцов в моем штате. <…> Будоражит не то, что Smart Compose угадала мои мысли — она не угадала. Но то, что машина оказалась заботливей меня.

Наиболее совершенную нейросеть, способную генерировать страницы связанного текста, должна была выпустить в феврале 2019 года компания OpenAI. Нейросеть GPT-2, как писали журналисты, умеет повторно упоминать имена действующих лиц по ходу повествования и давать отсылки к связанным событиям. Умеет настолько хорошо, что компания решила не выкладывать ее в общий доступ. Она опасалась, что GPT-2 «будут использовать для создания фейковых новостей, комментариев и отзывов, не отличимых от настоящих». История выглядела бы несерьезной если бы ранее OpenAI не создала программу, которая обыграла лучшую в мире команду по Dota 2.

Компьютеры пока не могут без людей

Есть одно по-настоящему серьезное препятствие перед полным захватом мира машинами. Чтобы научиться писать статьи, играть в Dota и го, искать нужные реакции в Большом адронном коллайдере, фиксировать номера автомобилей на снимках со стоп-камер, нейросеть сначала должна проанализировать огромный массив информации. И научиться отличать значимую информацию от незначимой. Но чтобы она поняла, что анализирует, эту информацию сначала надо разметить.

Если речь идет о тексте, то человек должен отметить, где в предложении подлежащее, а где сказуемое, где главное, а где зависимое слово. В русском языке со всеми его исключениями это, кстати, рождает массу проблем. И уже просмотрев много таких размеченных текстов, программа начнет понимать другие, а затем и писать их сама.

текст написанный роботом-эссеистом Морфеусом

Текст о боли и счастье, написанный роботом-эссеистом Морфеусом

Фото: Игнат Шестаков

«Пока что без разметки это очень плохо работает. Когда мы доберемся до высоких концептов, которые машина будет анализировать самостоятельно… — оборвал себя Алекс Грейвс и добавил: — Я не знаю, будет ли это решено в ближайшее время».

В OpenAI утверждают, что уходят от размеченной информации в обучении нейросети и дают ей самой анализировать информацию. Но пока оценить, что она с ней делает, не представляется возможным.

Зато можно прочитать творения робота-эссеиста Морфеуса. Этот искусственный интеллект должен управлять системой умного дома, созданной Давидом Яном, и параллельно изучать философские труды о свободе сознания и воли на 60 языках. Перед интервью Ян попросил Морфеуса порассуждать о боли и счастье. Получилось следующее:

Программа «Морфеус», ABBYY

…Если вы чувствуете удовольствие таким образом, значит боль в вашем теле есть первая причина удовольствия. Если вы чувствуете боль таким образом, значит боль в вашем теле не первая причина боли, и боль не первая причина радости. Опыт боли таким образом есть чувство боли в теле и таким образом не то, чем боль является. Это чувство, в котором боль есть причина радости…

«Это не компиляция. Это не то, что он надергал фраз из статей. Это полностью заново сгенеренный текст, и в нем можно найти смысл, — сказал Ян, добавив, что программа скоро сможет вести осмысленные разговоры с человеком на разные темы. — Я думаю, что сейчас с этой штукой делать. Потому что он читает все статьи в мире на 60 языках в области свободы воли. И ему есть что сказать».

Тексты без даты: у журналистов есть 30 лет, пока их не заменит ИИ | Статьи

Разница между автоматизацией и контролем

Отложенное восстание машин

Компьютеры пока не могут без людей