В феврале Министерство энергетики США (DOE) в сотрудничестве с OpenAI, американской исследовательской компанией по искусственному интеллекту, запустило первый в своем роде джем-сейшн «1000 ученых AI». В Брукхейвенской национальной лаборатории Министерства энергетики США, которая является одной из девяти принимающих площадок в национальном лабораторном комплексе Министерства энергетики США, более 120 ученых испытали и оценили возможности новейшей модели искусственного интеллекта OpenAI на основе ступенчатых логических рассуждений, созданной для решения сложных проблем. В общей сложности в мероприятии приняли участие более 1600 ученых из комплекса Министерства энергетики США. Такое партнерство между лабораториями Министерства энергетики и промышленностью приобретает все большее значение для поддержания технологического преимущества страны, особенно в глобально конкурентоспособной области исследований ИИ.

«Одним из величайших активов нашей страны – и предметом зависти всего мира – является сеть национальных лабораторий Министерства энергетики, которая на протяжении десятилетий способствовала прорывам в науке и технике, укрепляла национальную безопасность и способствовала процветанию Америки», – сказал министр энергетики США Крис Райт, присутствовавший на мероприятии в Национальной лаборатории Оук-Ридж Министерства энергетики США. «Как и Манхэттенский проект, который объединил лучших ученых и инженеров мира для патриотических усилий, изменивших мир, развитие ИИ — это гонка, в которой Соединенные Штаты должны победить. Сегодняшнее сотрудничество национальных лабораторий Америки и технологических компаний является важным шагом в наших усилиях по обеспечению будущего Америки».

Эксперименты для улучшения экспериментов

В учебном классе Брукхейвенского управления вычислительной техники и наук о данных (CDS) исследователи, представляющие многие критически важные области исследований лаборатории, взаимодействовали с самыми передовыми генеративными предварительно обученными моделями Transformer (GPT) OpenAI, включая o3-mini-high и o1 pro, чтобы убедиться в их жизнеспособности в качестве полезных «помощников исследователей». Модели OpenAI, такие как популярный ChatGPT, представляют собой большие языковые модели (LLM), обученные на огромных наборах данных для понимания нюансов человеческого языка. Это позволяет им быстро реагировать на различные темы, создавая текст или другой контент в зависимости от подсказок пользователя. Модели серии «o», используемые для AI Jam, по сути, были «подвергнуты стресс-тестам» на способность к многоступенчатому решению проблем и генерации кода, особенно при применении в различных научных исследованиях.

«Такие продукты, как ChatGPT, универсальные LLM как услуга, значительно изменили восприятие и доступ к современным методам ИИ для людей, которые не являются экспертами в области ИИ, — сказал Карлос Х. Сото, руководитель группы по теории и безопасности ИИ в CDS, который принял участие в AI Jam. — Они также снизили барьер для входа в сферу применения ИИ к научным проблемам. что является частью того, о чем был AI Jam Session. Несколько ученых из Брукхейвенской лаборатории и других организаций уже применяли эти инструменты в своей работе, но джем-сейшн предложил управляемый подход к работе с новейшими моделями, в частности, с новейшими моделями симуляции рассуждений, которые, как ожидается, будут более полезными для ученых».

Ученые из Национального источника синхротронного излучения II (NSLS-II), пользовательского объекта Управления науки Министерства энергетики США в Брукхейвенской лаборатории, использовали AI Jam Session, чтобы изучить, как модели могут помочь решить множество сложных проблем, особенно таким образом, чтобы сэкономить время, оптимизировать анализ данных и изучить подробное моделирование. Их проекты охватывали визуализацию биологических образцов, анализ данных спектроскопии, рабочие процессы для облегчения мультимодальных исследований, автоматизацию экспериментов и даже расчеты для потенциальных конструкций ускорителей.

Милинда Абейкун (Milinda Abeykoon), ведущий ученый по функции распределения пар (PDF) в NSLS-II, использовала модели Open AI для создания функций Python, которые могут интерполировать и экстраполировать дифракционные данные на различных расстояниях от образца до детектора на линии луча, используя данные измерений с нескольких известных расстояний. Пучок PDF может регулировать расстояние от образца до детектора от 200 миллиметров до 3500 миллиметров с высокой точностью. Более короткие расстояния охватывают более широкий угловой диапазон со сжатыми пиками, обеспечивая плотный обзор многих объектов одновременно. Напротив, большие расстояния дают более высокое разрешение с более разбросанными пиками, обеспечивая более четкое и детализированное изображение в более узком угловом диапазоне.

«Моя конечная цель состояла в том, чтобы объединить лучшее из обоих миров, смоделировав дифракционную картину, которая охватывает большой угловой диапазон с высоким угловым разрешением, используя несколько измеренных наборов данных», — объяснил Абейкун. «С помощью OpenAI я разработал скрипт на ранней стадии, который интерполирует и экстраполирует дифракционные данные для выбранного расстояния от образца до детектора, используя данные известных расстояний. Несмотря на то, что первоначальные результаты многообещающие, скрипт все еще нуждается в дальнейшей доработке, тестировании,d Валидация с использованием как синтетических, так и реальных данных, обеспечивающая адекватное учет всех реалистичных условий сбора данных. Это усовершенствование остается одной из моих основных целей в будущем».

Дин Хидас (Dean Hidas), ученый из группы Insertion Devices подразделения NSLS-II Accelerator Division, использовал свое время в Jam, чтобы бросить вызов этим моделям в приложениях, связанных с оптимизацией яркости на источнике света.

«Мое первое впечатление заключалось в том, что эти модели ИИ очень способны писать код для создания полезных инструментов», — вспоминает Хидас. «После того, как я почувствовал эти функции, я начал проверять логику и разум. Я просил модели решать связанные математические задачи, которые становились все сложнее. Я обнаружил, что результаты немного различаются в зависимости от модели. Они смогли выполнить за меня некоторые задачи, которые могли бы сэкономить много времени, но еще предстоит проделать некоторую работу, прежде чем мы сможем решить некоторые из более сложных проблем, над которыми мы работаем».

Хидас был не единственным, кто обнаружил, что модели серии «o» не могут легко ориентироваться в действительно сложной науке, с которой исследователи лаборатории сталкиваются каждый день в своей работе — по крайней мере, без небольшого человеческого вмешательства. Пол Бейти, старший научный сотрудник отдела систем, архитектур и новых технологий CDS, изучил разработку кода для новых физических процессов в пакете физического моделирования с открытым исходным кодом G4CMP. Код имитирует перенос фононов и электронно-дырочных пар в кремнии и других материалах.

«Моя цель состояла в том, чтобы попытаться выполнить простое кодирование динамики квазичастиц в качестве проверки возможностей ChatGPT», — объяснил Бейти. «Проблема была тщательно отобрана, чтобы стать сложной, но все же поддающейся сопоставительному анализу. Модель быстро сгенерировала файлы кода определения частиц Geant4, хотя изначально допустила ошибку в определении спина частицы. Однако при запросе модель не смогла правильно определить, какие файлы должны использовать новые определения частиц. В конце концов, я смог направить его на конкретные соответствующие файлы кода для написания фонон-квазичастичных взаимодействий. После изрядного количества ошибок по устранению неполадок, которые заняли остаток дня, мне удалось сгенерировать код для моделирования взаимодействия фонон-квазичастиц. Модель ИИ полезна для предоставления простых кодов для узкоспециализированных задач с нуля или устранения незначительных ошибок, но для умеренно сложных кодов или задач, вероятно, потребуется столько же времени, чтобы предложить инженеру модель».

Куан-Чие Сюй, научный сотрудник CDS Systems, Architectures, and Emerging Technologies, воспользовался возможностью, чтобы попросить модель предоставить идеи и новые решения для существующей проблемы вычислительной производительности без предоставления каких-либо данных.

«Я не выполнил то, что намеревался сделать. Тем не менее, с точки зрения возможностей сбора и обобщения информации, модель показала себя очень хорошо», — сказал Сюй. «Оперативное проектирование по-прежнему играет решающую роль в получении удовлетворительных или ожидаемых ответов. Я считаю, что просить инструменты искусственного интеллекта выполнять четко определенные задачи в небольшом объеме действительно полезно и экономит время».

Сюй отметил, что хотел бы видеть больше таких видов сотрудничества между промышленностью и национальными лабораториями, которые оценивают, как ИИ может ускорить научные открытия.

«Я хотел бы принять участие в еще одном, и я хочу посмотреть, смогу ли я изменить свою стратегию подсказок, а также иметь больше опыта работы с различными инструментами», — добавил он.

Чунтянь Цао, помощник ученого в области вычислительной техники в Trustworthy AI Group в CDS, поддержал это мнение.

«Если я приму участие в очередном AI Jam, я могу сменить тему с вопросов по физике на вопросы по программированию и получить больше опыта использования LLM, чтобы помочь или улучшить мое кодирование», — сказала она.

Она работала над моделированием рентгеновского структурного фактора воды, чтобы увидеть, может ли включение информации о плотности электронов из центров Ваннье увеличить согласованность между моделированием и экспериментом. Цао нашел его «частично работоспособным».

«LLM может генерировать рентгеновские атомные форм-факторы, которые согласуются со значениями в базах данных», — добавила она. «LLM также может объяснить общий рабочий процесс расчета структурных коэффициентов воды. Однако, поскольку существует не так много предыдущих исследований по включению информации об электронной плотности, LLM затронул эту тему, но не решил ее. В итоге нам не удалось успешно решить проблему. Но это не слишком разочаровывает или удивляет, потому что это сложная проблема, которая не была решена раньше. Мы были рады, что LLM дает разумные ответы, связанные с вопросами о структурных факторах рентгеновского излучения и атомных форм-факторах».

Между тем, ученые из Лаборатории биомолекулярной структуры (LBMS) использовали джем-сейшн для изучения того, как ИИ может улучшить исследования, проводимые в их крио-ЭМ-центре, особенно для Улучшение визуализации биологических образцов с нанометровым разрешением.

«Модели искусственного интеллекта, к которым у нас был доступ, включали полезные функции, которые недоступны в бесплатных версиях», — сказал Лиго Ванг, директор по научным операциям LBMS. «Мы были впечатлены тем, как смоделированные модели рассуждений начали предоставлять информацию, которую мы изначально не рассматривали во время работы. Мы спрашивали о некоторых публикациях, о которых у них не было информации, поэтому обеспечение того, чтобы эти модели содержали текущие исследования, специфичные для различных научных областей, может стать способом улучшения систем искусственного интеллекта для ученых».

В дополнение к CDS, NSLS-II и LBMS, в однодневном мероприятии приняли участие исследователи из Брукхейвенского центра функциональных наноматериалов (CFN), Департамента физики конденсированных сред и материаловедения, Отдела экологических наук и технологий, Отдела коллайдеров-ускорителей, Отдела приборостроения и электронно-ионного коллайдера.

Куда ученые пойдут дальше?

В то время как джем-сессия 1000 ученых AI Jam Session предложила первый практический опыт определения того, как модели GPT могут повлиять на темпы и качество научных открытий, следующие шаги будут включать обзор и агрегацию на лабораторном уровне среди всех девяти участвующих национальных лабораторий Министерства энергетики: Брукхейвен, Аргоннская национальная лаборатория, Национальная лаборатория Лоуренса Беркли, Национальная лаборатория Айдахо, Ливерморская национальная лаборатория. Лос-Аламосская национальная лаборатория, Национальная лаборатория Оук-Ридж, Тихоокеанская северо-западная национальная лаборатория и Принстонская лаборатория физики плазмы. Полученные отзывы будут переданы разработчикам, таким как OpenAI и Anthropic, базирующимся в Сан-Франциско, штат Калифорния. Anthropic предложила нескольким лабораториям доступ к своей модели Claude 3.7 Sonnet во время AI Jam для создания систем искусственного интеллекта специально для научных нужд.

На местном уровне результаты и обсуждения, которые были проведены в ходе этого совместного мероприятия, уже начали оказывать влияние на отдельные объекты лаборатории. Например, несколько команд из NSLS-II начали планировать проект по разработке нового кода моделирования порошковой дифракции, основанного на их опыте участия в AI Jam.

«Что лично я получил от этого мероприятия, так это большую видимость типов проблем, для решения которых ученые Brookhaven Lab заинтересованы в применении ИИ, а также некоторые ранние признаки …