К Бен Моррис, Редактор BBC Technology of Business

Би-би-си

Ян Кроуфорд курирует архивирование СМИ Имперского военного музея.

2039 год может показаться очень далеким, но Ян Кроуфорд уже планирует его.

Он будет отмечать 100-летие начала Второй мировой войны – важный год для его работодателя, Имперского военного музея.

Г-н Кроуфорд является директором по информационным технологиям музея и курирует проект по оцифровке огромной коллекции изображений, аудио и фильмов.

Учитывая, что коллекция насчитывает около 24 000 часов фильмов и видео, а также 11 миллионов фотографий, это огромная задача.

А в преддверии 2039 года приоритетом будут материалы Второй мировой войны.

Создание цифровых копий этих исторических источников жизненно важно, поскольку оригинальные копии со временем портятся и однажды будут потеряны навсегда.

«Когда у вас есть единственная копия, вам нужна уверенность в надежности вашей системы хранения», — говорит Ян Кроуфорд.

Объем данных, необходимых для такого длительного хранения, постоянно растет, поскольку новейшие сканеры позволяют очень детально записывать документы и фильмы.

«Потенциал роста на самом деле огромен», — говорит г-н Кроуфорд.

«Сейчас мы смотрим на сами объекты и сканируем их в 3D, что позволяет создавать очень большие файлы».

Подобные ленты являются наиболее распространенным способом хранения данных в течение длительного периода времени.

Этот поток данных обрушивается не только на музеи — он льется повсюду.

Предприятия покупают больше места для резервного копирования данных, больницам нужно где-то хранить записи, правительству нужно место для хранения растущих объемов информации.

«Мы продолжаем создавать безумные объемы данных», — говорит Саймон Робинсон, главный аналитик исследовательской компании Enterprise Strategy Group.

«Для большинства организаций (а они сильно различаются) объем данных удваивается каждые четыре-пять лет. А в некоторых отраслях он растет гораздо быстрее», — говорит он.

Данные, которые необходимо хранить в течение длительного времени, не хранятся в традиционных центрах обработки данных, в этих огромных складах со стойками серверов и мигающими лампочками. Эти операции предназначены для данных, к которым необходимо часто обращаться и обновлять.

Вместо этого наиболее популярный способ хранить данные в течение длительного времени — на ленте. В частности, формат, известный как LTO (Linear Tape Open), последняя версия которого называется LTO-9.

Сами кассеты мало чем отличаются от старых кассет VHS, но немного меньше и более квадратные.

Внутри кассеты находится километр магнитной ленты, способной хранить 18 терабайт данных.

Это очень много — всего на одной ленте можно хранить столько же данных, сколько почти на 300 стандартных смартфонах.

Имперский военный музей в Даксфорде использует магнитофонную систему Spectra Logic. Машина размером с большой шкаф вмещает до 1500 лент LTO.

Такие системы LTO доминируют на рынке долговременного хранения. Они существуют уже несколько десятилетий и зарекомендовали себя как надежные.

Это также довольно дешево, что важно, поскольку, как правило, клиенты хотят платить как можно меньше за долгосрочное хранение.

ХолоМем

В HoloMem данные хранятся в голограммах, созданных в полимере с помощью лазеров.

Тем не менее, некоторые убеждены, что можно сделать лучше.

На бывшей фабрике по производству обоев в Чизвике, западный Лондон, начинающая фирма разрабатывает систему долговременного хранения, которая использует лазеры для выжигания крошечных голограмм в светочувствительный полимер.

Генеральный директор Чарли Гейл отмечает, что с помощью магнитной ленты данные могут храниться только на поверхности, тогда как голограммы могут хранить данные в нескольких слоях.

«Вы можете делать вещи, называемые мультиплексированием, с помощью которых вы можете размещать несколько наборов информации в одном пространстве. Это действительно суперсила того, что мы делаем. И мы верим, что можем разместить больше информации в меньшем пространстве, чем когда-либо прежде», — он говорит.

Полимерные блоки HoloMem могут выдерживать экстремальные температуры без повреждения данных — от -14°C до 160°C.

ХолоМем

Чарли Гейл из HoloMem уверен, что его система сможет превзойти существующие технологии хранения данных.

Для сравнения, магнитная лента должна быть держится между 16C и 25Cчто означает значительные затраты на отопление и охлаждение, особенно в странах с экстремальными температурами.

Ленту также необходимо заменить примерно через 15 лет, тогда как срок службы полимера составляет не менее 50 лет.

Г-н Гейл отмечает, что, поскольку лазер химически изменяет полимер, данные невозможно подделать после того, как они были записаны.

Прототип системы Holomem, которая сможет хранить и извлекать данные, будет готов позднее в этом году.

Г-н Гейл говорит, что стоимость системы удалось снизить за счет использования стандартных, широко доступных компонентов, включая лазер, поэтому он уверен, что HoloMem сможет сравниться или превзойти стоимость магнитной ленты.

Microsoft Исследования

Система, разработанная Microsoft Research, хранит данные о стеклянных панелях

HoloMem должен быть конкурентоспособным, поскольку над рынком нависает грозный конкурент.

Через свое исследовательское подразделение Microsoft разрабатывает собственную систему долговременного хранения данных.

Как и HoloMem, компания решила, что пришло время отказаться от магнитной ленты, но Microsoft выбрала в качестве материала для хранения данных стекло.

Система, получившая название Project Silica, использует мощные лазеры для создания крошечных структурных изменений в стекле, называемых вокселами, которые можно использовать для хранения данных. Вокселы невероятно малы и могут быть упакованы в слои.

Microsoft утверждает, что кусок стекла толщиной 2 мм, размером с DVD-диск, сможет хранить более семи терабайт данных.

Система хранит стеклянные панели на стеллажах, где к ним могут получить доступ небольшие роботы, похожие на крабов, которые перемещаются по рельсам.

Дешевое и прочное стекло — привлекательный носитель информации, говорит Ричард Блэк, возглавляющий Project Silica.

«Он практически невосприимчив к температуре, влажности, частицам и электромагнитным полям», — говорит г-н Блэк.

Потенциально он может сохранять данные в течение сотен, а возможно, и тысяч лет.

Такая система однажды может быть интегрирована в огромный бизнес облачных вычислений Microsoft — Azure.

Но до этого еще далеко, поскольку впереди у системы годы развития.

Гетти

IWM проверяет, может ли ИИ различать модели Spitfire

Еще в Даксфорде Имперский военный музей, как и многие другие организации, экспериментирует с искусственным интеллектом. Недавно они проверили, может ли ИИ идентифицировать различные модели Spitfire на изображениях из его каталога изображений.

Г-н Кроуфорд считает, что ИИ может быть невероятно полезен при каталогизации своей цифровой библиотеки, а это работа, которая заняла бы у людей сотни лет.

Способность ИИ анализировать огромные объемы данных сделала сохранение этих данных еще более важным — там может скрываться что-то ценное.

«Раньше бизнес архивировал данные на тот случай, если они им понадобятся. Теперь есть реальная деловая причина, по которой они могут захотеть вернуться и провести некоторый анализ», — говорит г-н Робинсон.