![]() |
![]() |
Кластеры как средство повышения отказоустойчивости систем, страница 2
|
||||
|
|
© Александр Матвеев, 2004. Компания «ТИМ». Кластеры как средство повышения отказоустойчивости системЦель этой статьи - ознакомить посетителей нашего сайта с преимуществами применения кластерных решений. Построим это знакомство на примерах конкретных реализаций и постараемся дать сводный обзор кластерных отказоустойчивых технологий. Более полную информацию от производителей рассматриваемых решений можно найти по приведенным в тексте ссылкам. В конце даются ссылки на статьи доступные в Интернет, материалы которых использовались при подготовке этого обзора. Хочется надеяться, что эта статья поможет получить общее представление об особенностях кластерных решений для повышения отказоустойчивости компьютерных систем. По мере развития своей функциональности информационные технологии все более полно интегрируются в деятельность предприятий и организаций. Чем больше мы полагаемся на компьютерные системы, тем больше и наша зависимость от их бесперебойной работы. Понимание того, что отказы и простои обходятся все дороже, заставляет искать отказоустойчивые решения - вносить изме-нения в структуру существующих систем и переосмысливать правила построения информационных комплексов предприятий. Выбор конкретного решения разумно определяется тем, что стоимость последствий возмож-ного отказа не должна превышать стоимости затрат, необходимых для построения отказоустойчивой системы. Кластеры, как технологии для построения систем высокой доступности, на рынке известны давно, однако, несмотря на целый ряд преимуществ, их массовое применение сдерживалось из-за вы-сокой цены. Сегодня из-за снижения стоимости аппаратных средств и совершенствования самих кла-стерных технологий, их применение становится экономически оправданным в большинстве органи-заций. Действительно, сейчас для построения кластеров можно использовать недорогие серверы на платформе Intel, стандартные сетевые адаптеры и распространенные операционные системы. Именно доступность недорогих кластеров делает эту технологию все более привлекательной, и кластеры из разряда экзотики переходят в категорию рядовых решений повышения отказоустойчивости компью-терных систем. Повышение отказоустойчивости и преимущества кластера Понятно, что для повышения надежности компьютерной системы можно использовать неко-торую избыточность ее оборудования, чтобы, в случае выхода из строя, неисправное устройство за-менялось на резервное. Например, использование резервных вентиляторов, двух или трех блоков пи-тания и применение избыточной RAID технологии в дисковой подсистеме являются типичными ре-шениями повышения отказоустойчивости при построении серверов. При этом переход на резерв обычно осуществляется на аппаратном уровне. Резервирование принято называть горячим, если пе-реход на резерв производится без перерыва в доступности системы и холодным, если для восстанов-ления работоспособности, требуется ее останов и перезапуск. Комплексным решением повышения отказоустойчивости может быть резервирование не только на аппаратном уровне, но на уровне всей компьютерной системы в целом, включая и опера-ционную систему (ОС) и работающие под ней приложения. Переход на резерв, в этом случае, осуще-ствляется под управлением программного обеспечения (ПО), иногда с использованием дополнитель-ного оборудования. Коротко рассмотрим, как такое резервирование может быть технологически реа-лизовано. Компанией Novell на базе ОС NetWare была разработана система SFT III работающая по принципу горячего резервирования. Два сервера с одинаковым аппаратным обеспечением, при работе синхронизируясь по специальному каналу, динамически поддерживают зеркальную копию содержи-мого жестких дисков и процессов в памяти. Все клиентские запросы обслуживаются только одним из серверов, другой же находится в пассивном режиме до момента отказа активного сервера. Клиенты не ощущают сбоев в работе при переходе на резерв, так как перезапуска процессов при переключе-нии не происходит. Платой за повышение отказоустойчивости в данном случае является неэффек-тивное использование вычислительных ресурсов - резервный сервер в режиме ожидания кроме дуб-лирования никакой работы для клиентов не выполняет. Оригинальное и значительно более экономичное решение было предложено компанией Vinca. Пакет StandbyServer Many-to-One реализует принцип холодного резервирования в среде ОС Novell Netware. Во время работы на диски резервного сервера ведется копирование данных с нескольких разных активных серверов. Идентичности аппаратного обеспечения серверов не требуется. При отка-зе одного из активных серверов, резервный сервер способен заменить клиентам вышедший из строя сервер. Недостатком данного решения является то, что процесс активизации резервного сервера за-нимает значительное время, так как требуется его перезапуск. А можно ли построить отказоустойчивую систему свободную от недостатков показанных в вышеприведенных примерах? Вот, наконец-то, мы и подошли к рассмотрению кластерных систем. Кластерные решения также применяются для обеспечения устойчивости к сбоям на уровне всей системы, однако имеют ряд преимуществ по сравнению с обычным резервированием. Строго говоря, кластеры могут работать и в режиме резервирования, но такая настройка будет неоправданна. Итак, кластер - это программно-аппаратный комплекс, состоящий из нескольких свя-занных между собой компьютеров, который используется и управляется как единая система. Пользователи при обращении "видят" кластер как один большой сервер, на котором работает множество приложений, и предоставляются сетевые службы, хотя в действительности все это функ-ционирует на различных компьютерах кластера называемых узлами. При отказе программного или аппаратного компонента узла его сервисы и приложения, по указанным правилам, автоматически пе-рераспределяются между другими узлами, и кластер продолжает предоставлять эти ресурсы пользо-вателям. При восстановлении работоспособности отказавшего узла его приложения и сервисы, если это предварительно указано в настройках, могут быть перенесены обратно. По внутрикластерным каналам узлы осуществляют обмен необходимой информацией, контролируют работу и состояние друг друга. Эти межузловые соединения обычно не связаны с клиентской ЛВС, хотя существуют реализации кластеров, позволяющие узлам взаимодействовать и по внешней общедоступной сети в случае отказа межузлововых каналов.
Узлов в кластере может быть от двух до нескольких десятков, причем узлы могут иметь различную аппаратную конфигурацию: разное количество процессоров и оперативной памяти, разную емкость локальных жестких дисков и т.д. Возможно добавление нового узла в кластер, и это не требует перегрузки других узлов. Таким образом, при нехватке вычислительных ресурсов кластер можно "на ходу" наращивать. В распределении нагрузки задействованы все узлы, что, по сравнению с простым резервиро-ванием, позволяет более эффективно использовать имеющиеся вычислительные мощности. Представление кластера как единого владельца ресурсов всех узлов позволяет управлять кла-стером как одной системой, что намного проще, чем управлять разрозненным парком серверов. Разу-меется, с помощью соответствующих утилит, администратор может управлять и отдельными узлами.
|
|
|||||||||||||||||||||||||||||||||||||||||
| © 2011 Группа компаний ТИМ, Почта: info@timcompany.ru, Ссылки | |||||||||||||||||||||||||||||||||||||||||||