Управляемость
Система должна требовать минимального управления. В идеальном случае – только распределение прав доступа и отслеживание заполнения.
Ни одна из традиционных систем не отвечает указанным требованиям. Дисковые массивы ориентированы в основном на хранение интенсивно модифицируемой информации (базы данных, почтовые системы, ERP и т.д.), они дороги и сложны в управлении. Кроме того, все функции по управлению контентом фактически перекладываются на внешний сервер.
Ленточные и магнитооптические библиотеки, в свою очередь, не могут предоставить быстрый доступ, не защищают данные от повреждения носителя и от устаревания технологии. Широко известна так называемая "проблема NASA". У этого агентства за 30 лет накопился огромный архив данных на магнитных лентах, которые уже не на чем прочитать.
Всем вышеперечисленным условиям отвечает система хранения контента EMC Centera.
Технологически Centera представляет из себя кластер из однотипных узлов, каждый из которых может быть сконфигурирован как узел хранения или узел доступа, в зависимости от требований производительности. Взаимодействие с внешним миром осуществляется по IP-сети через собственный API (Application Programming Interface). Этот интерфейс является открытым и опубликован.
Как работает Centera.
 |
| Рис. 1 |
На рис.1 представлена схема взаимодействия приложения и массива Centera. Документ (1) передается приложением на массив по сети IP (2) через Centera API. Для каждого объекта Centera генерирует уникальный идентификатор, который является одновременно цифровой подписью и адресом документа (3). Идентификатор возвращается приложению (4), которое сохраняет его (5) и использует в дальнейшем для доступа к документу.
Вся информация внутри массива может быть продублирована, либо защищена контрольными суммами таким образом, что выход из строя узлов хранения не приводит к потере данных. Катастрофоустойчивость достигается путем репликации данных на удаленный аналогичный массив.
Как реально можно использовать Centera.
То, что данный массив взаимодействует на уровне объектов, а не томов или файловых систем, порождает требование по интеграции Centera с приложениями.
Существует несколько способов такой интеграции.

приложение уже умеет работать напрямую с данным массивом. В настоящий момент существует более 200 подобных программных комплексов. К ним относятся Documentum, IBM Tivoli Storage Manager и т.д.

специальное ПО, позволяющее организовать архивирование данных приложений с использованием Centera. Примером может служить Legato EmailXtender, KVS, которые служат для архивирования почтовых сообщений.

ПО, осуществляющее перемещение данных в многоуровневом хранилище (Legato DiskXtender, Veritas DLM и т.д.). Так, с помощью DiskXtender можно организовать перемещение файлов с NAS-системы, где они находятся в оперативной работе и активно модифицируются, на систему архивного долговременного хранения Centera, и обратно. Перемещение происходит в соответствии с прописанными политиками.

Возможна самостоятельная разработка ПО. Программный интерфейс Centera опубликован, EMC
2 предлагает стандартные библиотеки под различные платформы и языки программирования (Centera Software Development Kit) и всячески поддерживает разработчиков.

Существует отдельный продукт (Universal Access), который может быть установлен на часть узлов доступа внутри массива и который предоставляет доступ по стандартным протоколам NFS, CIFS, FTP, HTTP. Важно, что Universal Access является внешним приложением и не нарушает общей идеологии работы этого массива.
Достоинства решений с применением Centera.
Подобное решение удовлетворяет всем вышеупомянутым требованиям.
Доступность: Centera работает по IP, а это означает, что можно организовать архивирование в любом месте через Internet. Скорость доступа также характеризуется определением Web-like, т.е. "Как из Internet". Реальная пропускная способность определяется количеством узлов в кластере и соотношением количества узлов доступа и узлов хранения.
Аутентичность: Сам принцип работы Centera подразумевает невозможность несанкционированной модификации данных. Кроме того, для каждого объекта можно установить временной интервал, в течение которого этот объект невозможно удалить.
Масштабируемость: Centera может иметь виртуально неограниченный объем. Протестированная в лаборатории емкость на сегодняшний момент составляет 1ПБ.
Данное хранилище спроектировано с возможностью объединения в один кластер узлов разного поколения. Это позволяет постоянно обновлять аппаратное и программное обеспечение и продлевать жизненный цикл всего решения до бесконечности. Информация со старых, медленных и выходящих из строя узлов самостоятельно перемещается на новые.
Управляемость: Centera не требует постоянного административного вмешательства. Все что необходимо – это назначать права доступа и следить за тем, чтобы массив не переполнился.
На сегодняшний день в мире произведено более тысячи успешных внедрений решений с применением Centera. Основными потребителями являются государственные и финансовые учреждения, банки, научно-исследовательские и конструкторские организации, телекоммуникационные, медицинские, топливно-энергетические и промышленные предприятия.