Необходимую производительность доступа серверов к данным можно обеспечить созданием выделенной высокоскоростной транспортной инфраструктуры между серверами и устройствами хранения данных (дисковым массивом и ленточными библиотеками). Для создания такой инфраструктуры в настоящее время наилучшим решением является SAN. Сетевой инфраструктурой, объединяющей большое количество серверов и устройств хранения, необходимо управлять и, как минимум, отслеживать ее состояние. Сказанное не означает, что нет необходимости мониторинга состояния, например, двух серверов и одного массива, подключенного к ним напрямую. Однако это можно реализовать подручными средствами — встроенными утилитами серверов, массива и операционной системы, бесплатными (freeware) утилитами или "самописными" скриптами. Каждое из устройств в системе хранения данных (СХД) имеет несколько объектов, требующих управления и контроля состояния, например дисковые группы и тома у массивов, порты у массивов и коммутаторов, адаптеры в серверах. Как только число объектов управления в СХД начинает исчисляться десятками, управление такой конфигурацией при помощи "подручных" средств отнимает у администраторов слишком много времени и сил, и неизбежно приводит к ошибкам. Справиться с такой задачей можно, только используя полномасштабную систему управления. Это справедливо для любых больших систем и для большой системы хранения данных, в частности. Внедрение системы управления становится особенно актуальным в тех случаях, когда система хранения данных выделена не только структурно и функционально, но и организационно.
В сетях хранения данных SAN, которые на предприятиях часто являются инфраструктурой для работы приложений, необходимо не только поддерживать безотказную работу SAN и ее постоянную готовность, но и следить за основными показателями ее работы. В связи с этим следует различать понятия «управление ресурсами SAN» и «мониторинг SAN».
Управление ресурсами SAN, т. е. установка и оптимизация компонентов и наблюдение за ними, осуществляется при помощи соответствующих инструментов конкретного производителя. Главные задачи системы мониторинга — контроль за достижением ожидаемой производительности, опережающее исправление ошибок, рациональная поддержка при локализации и анализе ошибок и, конечно, доказательство работоспособности сети.
Отсюда следуют самые важные и самые сложные требования к мониторингу SAN: совместная работа с компонентами SAN всех производителей и их простое включение, возможность сохранения детализированной информации о состоянии сети хранения в базе данных, а также предоставление и оценка этих данных в соответствии с задачами управления. Дополнительными требованиями являются автоматическая подача сигналов тревоги при превышении граничных значений, а также запись сведений о происходящем в случае возникновения ошибки в SAN. Сети SAN из-за сложной инфраструктуры доставляют много проблем при их обслуживании и ненадежны. Причина происходящего кроется в следующих явлениях:
- старение конструктивных элементов;
- износ/загрязнение кабелей и штекеров;
- новые и развивающиеся стандарты;
- смешение и интеграция разных технологий;
- дополнительные устройства и компоненты;
- увеличение нагрузки;
- растущая сложность;
- виртуализация.
Мониторинг существенно помогает администратору SAN в решении следующих вопросов:
- организации бесперебойной работы SAN;
- быстрого поиска ошибки и ее изоляции в случае возникновения проблемы в сети.
Условием точного анализа ошибок в сети хранения данных является сбор данных. Он производится посредством программных средств, собирающих сведения от подключенных устройств, например, при помощи простого протокола управления сетью (Simple Network Management Protocol, SNMP) и спецификации интерфейса управления хранилищами SMI-S. Альтернативу им представляют аппаратные зонды, принимающие всю информацию в реальном времени по Fibre Channel и оценивающие ее. Этот подход более точен и исключает возникновение новых ошибок вследствие несовместимости или перегрузок. Важное значение имеют гибкие возможности настройки оповещения для своевременного получения информации об аномалиях и изменениях. Для этого необходимо определить базовые характеристики производительности, в частности, показатели производительности. В таком случае система мониторинга предлагает безопасность и прозрачность.
Программные зонды позволяют проводить пассивный сбор статичных данных непосредственно из коммутаторов. Кроме того, агрегирование статистики коммутаторов во всей SAN дает исчерпывающий обзор производительности и тенденций. Так, пользователь сможет без проблем идентифицировать отклонение от обычного потока трафика в сети хранения. При этом необходимо сохранять статистику со всех коммутаторов, чтобы совместно с данными аппаратных зондов определить пропускную способность всей сети, а также показатели ввода/вывода и ошибки. При мониторинге выявляются такие ошибки, как неправильная сумма CRC, сброс и отказ канала, потеря сигнала, нарушение синхронизации или отбракованные пакеты. Полученная при помощи программных методов информация служит для проверки планирования емкости и определения соответствующей нагрузки на систему.