Как и в Песня «Враг общества» Название этого поста обусловлено шумихой вокруг предполагаемых рисков конкуренции на «рынке» искусственного интеллекта (ИИ). является продолжением (и не очень хорошим) гиперболического и антиутопический вид это легло в основу нескольких недавних предложений по антимонопольной политике и требований более жесткого соблюдения законов о конкуренции, особенно на цифровых рынках. Как мы объясним, факты говорят о другом, и существует множество причин проявлять осторожность, прежде чем предпринимать какие-либо действия в секторе ИИ.

Джефф Манн и Дирк Ауэр объяснять что мы подразумеваем под антиутопическим взглядом на антимонопольное законодательство:

Антимонопольные пессимисты сосредоточили свое внимание преимущественно на цифровой экономике – «больших технологиях» и «больших данных», – утверждая, что они таят в себе широкий спектр потенциального вреда. Ученые утверждают, что данные, создаваемые и используемые цифровой экономикой, создают сетевые эффекты, которые неизбежно приводят к перекосам и более концентрации рынков. Другими словами, компании якобы будут накапливать непреодолимые преимущества в области данных и, таким образом, мешать конкурентам в течение длительных периодов времени. Некоторые зашли так далеко, что утверждают, что это угрожает самой структуре западной демократии.

Теперь, когда ИИ и генеративный ИИ получили массовое внимание — особенно после выпуска ChatGPT в ноябре 2022 года — антимонопольные органы спешат первыми вмешаться или, по крайней мере, «сказать что-нибудь» об этих развивающихся рынках. В недавнем консультация Европейская комиссия задала вопрос: «Какова роль данных и каковы их соответствующие характеристики для создания генеративных систем и/или компонентов ИИ, включая модели ИИ?»

Неудивительно, что Федеральная торговая комиссия США (FTC) также проявляет повышенную бдительность в отношении рисков, якобы связанных с доступом действующих компаний к данным. В комментариях, отправленных в Бюро регистрации авторских прав США, например, FTC спорил что: « (т) растущая важность ИИ для экономики может еще больше закрепить рыночное доминирование крупных действующих технологических компаний. Эти мощные, вертикально интегрированные компании контролируют многие ресурсы, необходимые для эффективной разработки и внедрения инструментов искусственного интеллекта, включая облачные или локальные вычислительные мощности. и доступ к большим хранилищам обучающих данных ».

Так же, на конференции о конкуренции на рынках искусственного интеллекта, организованной совместно Министерством юстиции США (DOJ) и Стэнфордской высшей школой бизнеса, помощник генерального прокурора США по антимонопольному законодательству Джонатан Кантер заявлено что:

Мощные сети и эффекты обратной связи могут позволить доминирующим фирмам контролировать эти новые рынки, а существующая власть в цифровой экономике может создать мощный стимул для контроля над появляющимися инновациями, которые повлияют не только на нашу экономику, но и на здоровье и благополучие нашего общества и само свободное выражение.

Говоря более гиперболически, Андреас Мундт, глава Федерального управления картелей Германии, сказал: называется ИИ назвал «первоклассным ускорителем огня» для антиконкурентного поведения и заявил, что это «только усугубит все проблемы». Он далее спорил что «существует большая опасность того, что мы получим еще более глубокую концентрацию цифровых рынков и рост мощности на различных уровнях, от микросхем до внешнего интерфейса». И Мундт, похоже, является лишь одним из многих видных политиков, которые считают, что рынки ИИ позволят действующим технологическим компаниям еще больше укрепить свои рыночные позиции.

Эти «опасения» побудили совместное заявление от Федеральной торговой комиссии, Министерства юстиции, Европейской комиссии и Управления по конкуренции и рынку Соединенного Королевства (CMA), в котором, хотя и признается, что «в своих лучших проявлениях эти технологии могут принести материальную пользу нашим гражданам, стимулировать инновации и стимулировать экономический рост». Агентства настаивают на том, чтобы «быть бдительными и избегать тактики, которая может подорвать честную конкуренцию». В заявлении выделены три основных риска для конкуренции, которые кратко изложены ниже:

  1. Концентрированный контроль над ключевыми входными данными, которые потенциально могут позволить небольшому числу компаний использовать существующие или возникающие узкие места в стеке искусственного интеллекта.
  2. Укрепление или расширение рыночной власти на рынках, связанных с ИИ: крупные действующие цифровые компании, которые уже обладают сильными накопленными преимуществами, могут использовать их для защиты от потрясений, вызванных ИИ. Это, в свою очередь, может позволить таким фирмам расширить или укрепить свои позиции в ущерб будущей конкуренции.
  3. Договоренности с участием ключевых игроков могут усилить риски. Крупные фирмы могли бы использовать партнерства, финансовые инвестиции и другие связи между фирмами, связанные с развитием генеративных технологий, чтобы подорвать или использовать конкурентные угрозы и направить результаты рынка в свою пользу за счет общества.

Конечно, имеет смысл, что крупнейшие онлайн-платформы, включая Alphabet, Meta, Apple и Amazon, должны иметь значительное преимущество на растущих рынках услуг генеративного искусственного интеллекта. Ведь широко признанный эти данные являются важным исходным материалом для генеративного ИИ. Это конкурентное преимущество должно быть тем более значительным, учитывая, что эти фирмы уже более десяти лет находятся в авангарде технологий искусственного интеллекта. За этот период DeepMind и AlphaGo от Google и NLLB-200 от Meta регулярно создавали заголовки . Apple и Amazon также имеют обширные опыт с помощниками ИИ, и все эти фирмы внедряют технологии ИИ на своих платформах.

Однако, вопреки тому, что можно было ожидать, технологические гиганты на сегодняшний день в значительной степени неспособны использовать свои огромные запасы данных, чтобы превзойти такие стартапы, как OpenAI и Midjourney. На момент написания ChatGPT от OpenAI, по всей видимости, является самым успешным чат-ботом модели большого языка (LLM). несмотря на очевидный доступ крупных технологических платформ к гораздо большему количеству (и более актуальных) данных.

Более того, важно не пренебрегать той ролью, которую модели с открытым исходным кодом в настоящее время играют в стимулировании инноваций и конкуренции. Как отметила в недавнем докладе бывший главный экономист Министерства юстиции по антимонопольному законодательству Сьюзен Эйти, интервью индустрия искусственного интеллекта «Может быть очень концентрированным, но если у вас есть две или три высококачественные — и нам нужно выяснить, что это значит, но достаточно качественные — открытые модели, то этого может быть достаточно, чтобы ограничить коммерческие LLM». Модели с открытым исходным кодом важны, поскольку они позволяют инновационным стартапам основываться на моделях, уже обученных на больших наборах данных, и, следовательно, выходить на рынок без таких первоначальных затрат. Судя по всему, недостатка в моделях с открытым исходным кодом нет, поскольку такие компании, как xAI, Meta и Google, предлагают свои модели ИИ бесплатно (см., например, здесь и здесь ).

Понятно, что в свете стремительного роста услуг искусственного интеллекта, ориентированных на потребителя, органы по обеспечению конкуренции и политики хотят знать и понимать о них больше. Они «должны что-то сделать» с ИИ. Но революция искусственного интеллекта также должна стать возможностью вернуться к некоторым априорным принципам. Как мы объясним ниже, быстрое появление технологии генеративного искусственного интеллекта может подрезать многие основные предположения сегодняшних дебатов о политике конкуренции, которые в основном сосредоточены на печальных последствиях предполагаемого провала 20 й антимонопольного регулирования века для устранения якобы явного вреда 21 века. ул. технологии века. К ним относятся представления о том, что преимущества данных представляют собой барьеры для входа и могут быть использованы для проецирования доминирования на соседние рынки, а масштабы сами по себе являются провалом рынка, который необходимо устранить органам правоприменения.

Мы обращаемся к этим понятиям в нашей недавней замечания в Министерство юстиции приглашение к комментированию о развитии конкуренции в сфере ИИ. Сторонники более широкого антимонопольного вмешательства на цифровые рынки часто ссылаются на эффекты сетей передачи данных как на источник конкурентных преимуществ и барьер для входа. спорить что: «сбор и использование данных создает петлю обратной связи с большим количеством данных, что в конечном итоге изолирует существующие платформы от участников, которые, если бы не недостаток данных, могли бы предложить лучший продукт». Этот самоусиливающийся цикл, как гласит история, приводит к доминированию на рынке одной фирмы.

Но важно отметить концептуальные проблемы, с которыми сталкиваются эти утверждения. Поскольку данные могут использоваться для улучшения качества продукции и/или для субсидирования ее использования, если наличие данных представляет собой входной барьер, то любой Улучшение продукта или снижение цен со стороны действующего оператора могут оказаться проблематичными. Это равносильно утверждению, что само соревнование является осознанным барьером для входа.

Конечно, это был бы любопытный подход к антимонопольному законодательству, если бы конкуренцию рассматривали как проблему, поскольку это означало бы, что фирмы должны недостаточно конкурировать. т.е. должны отказаться от повышения благосостояния потребителей — для того, чтобы привлечь большее количество фирм на данный рынок просто ради него самого. Однако реальные экономические исследования эффектов сетей передачи данных были немногочисленны и редки, а эмпирические доказательства в поддержку такой истории были скудны (см. Джефф и Дирк). здесь за обзор литературы по увеличению отдачи от масштаба в данных ) .

Как мы уже упоминали, «большие технологии» в настоящее время не лидируют в гонке ИИ, поскольку ChatGPT бухгалтерский учет (по состоянию на июнь 2024 г.) и занимает почти 69,9% доли рынка «инструментов искусственного интеллекта». Аналогичная картина и в области генерации изображений ИИ. По состоянию на август 2023 г.: Midjourney, Dall-E и Stable Diffusion. появился войти в тройку лидеров рынка по посещаемости пользователей. И это несмотря на конкуренцию со стороны таких компаний, как Google и Meta, которые, возможно, имеют доступ к беспрецедентным базам данных изображений и видео благодаря своей основной платформенной деятельности (см. здесь и здесь ).

Как этим выскочкам в сфере ИИ удалось добиться такого успеха? Является ли их успех всего лишь вспышкой перед тем, как гиганты Web 2.0 догонят и свергнут их? Пока рано отвечать на эти вопросы, но успех этих стартапов позволяет сделать некоторые наблюдения.

Начнем с того, что данные могут иметь уменьшающуюся предельную отдачу. Другими словами, после определенного момента получение дополнительных данных не дает фирме-покупателю значимого преимущества. В роли Кэтрин Такер поставь это после обзора литературы: «Эмпирически существует мало свидетельств экономии за счет масштаба и объема цифровых данных в тех случаях, когда можно было бы ожидать их найти». Аналогичным образом, после обзора эмпирической литературы по этой теме, Джефф и Дирк пришел к выводу что:

Имеющиеся данные свидетельствуют о том, что заявления о «экстремальной» отдаче от масштаба в технологическом секторе сильно преувеличены. Мало того, что крупнейшие затраты на цифровые платформы вряд ли станут пропорционально менее важными по мере увеличения производства, но эмпирические исследования убедительно показывают, что даже данные не приводят к увеличению отдачи от масштаба, несмотря на то, что их обычно называют источником этого эффекта.

Другими словами, будучи фирмой с большинство данные кажутся гораздо менее важными, чем наличие достаточно данные. Более того, эта нижняя планка может быть доступна гораздо большему числу фирм, чем можно было первоначально подумать. Более того, благодаря технологическому прогрессу получение достаточного количества данных может стать еще проще – то есть объем требуемых данных может стать еще меньше. Например, синтетические данные могут обеспечить адекватную замену реальным данным для приложений ИИ (см. здесь ) или даже может превзойти реальные данные (см. здесь ). В роли Тибо Шрепеля и Алекса Пентланда предполагать :

[A]Достижения в области информатики и аналитики с каждым днем ​​делают объем данных менее актуальным. В последние месяцы важные технологические достижения позволили компаниям с небольшими наборами данных конкурировать с более крупными.

Действительно, после определенного порога получение большего количества данных может не существенно улучшить службу ИИ, тогда как другие улучшения (например, лучшие методы обучения или курирование данных) могут иметь большое влияние. Фактически, есть некоторые свидетельства того, что избыток данных препятствует способности службы генерировать результаты, подходящие для данного запроса. Как указал by Igor Susmeli: “[S]Более высокая производительность модели часто может быть достигнута с использованием небольших высококачественных наборов данных, чем с массивными непроверенными наборами данных. Курирование данных гарантирует, что наборы обучающих данных лишены шума,…