Всего через несколько месяцев после дебюта Gemini, амбициозной большой языковой модели Google, технологический гигант уже находится на пороге представления своего продвинутого преемника, Gemini 1.5. Сегодняшний запуск ориентирован на разработчиков и корпоративных пользователей, и на горизонте ожидается более широкий выпуск для потребителей. Приверженность Google Gemini подчеркивает ее универсальные приложения: от бизнес-инструментов до личных помощников, поскольку компания стремится укрепить свое лидерство в области искусственного интеллекта.
Gemini 1.5 знаменует собой значительный шаг вперед, особенно с появлением Gemini 1.5 Pro, который соответствует производительности недавно представленного Gemini Ultra и превосходит Gemini 1.0 Pro в большинстве тестов производительности. Эта эффективность объясняется методом «Смесь экспертов», оптимизирующим скорость модели и операционную эффективность Google за счет активации только необходимых частей модели для каждого запроса.
Однако выдающейся особенностью Gemini 1.5 является расширенное контекстное окно, способное обрабатывать до 1 миллиона токенов. Это усовершенствование значительно превосходит возможности OpenAI GPT-4 и существующего Gemini Pro, позволяя модели одновременно обрабатывать и интерпретировать значительно большие объемы данных. Генеральный директор Google Сундар Пичаи упрощает это усовершенствование, приравнивая емкость контекстного окна к «10 или 11 часам видео» или «десяткам тысяч строк кода», облегчая выполнение сложных запросов, охватывающих обширные диапазоны контента.
Открытие Пичаи о том, что исследователи Google экспериментируют с контекстным окном в 10 миллионов токенов, предполагает возможность анализа всей серии книг или существенного видеоконтента за один раз. Этот прорыв имеет практическое применение, выходящее за рамки новизны: от выявления ошибок непрерывности в фильмах до комплексного финансового анализа для бизнеса, что знаменует собой значительный шаг вперед в области полезности и универсальности ИИ.
Первоначально Gemini 1.5 будет обслуживать бизнес-клиентов и разработчиков через платформы Google Vertex AI и AI Studio, при этом планируется поэтапный отказ от Gemini 1.0. Стандартная версия Gemini Pro, доступная для широкой публики, вскоре будет обновлена до версии 1.5 Pro с окном на 128 000 токенов, с премиальным доступом, необходимым для полной емкости в миллион токенов. Google также подчеркивает постоянные оценки безопасности и этических соображений модели, особенно в отношении ее расширенных контекстных возможностей.
По мере усиления гонки вооружений в области искусственного интеллекта, когда такие компании, как OpenAI, продвигают свои предложения, Google Gemini 1.5 позиционирует себя как грозного соперника, особенно для тех, кто уже интегрирован в экосистему Google. Эволюция технологий искусственного интеллекта продолжается быстрыми темпами, при этом лежащая в основе этих моделей механика становится все более актуальной как для разработчиков, так и для конечных пользователей. По словам Пичаи, хотя сейчас основное внимание уделяется технологиям, обеспечивающим работу искусственного интеллекта, будущее за бесшовным взаимодействием, напоминающим использование смартфонов без размышлений о внутренних процессорах.