Кластеры

Все мы с завидным постоянством покупаем натуральные соки или нектары. При этом мы с Вами имеем колоссальный выбор из множества производителей и торговых марок. Теперь давайте вспомним любую торговую сеть, ну скажем федеральную, в которой на полках рядом с «разрекламированными» марками стоят соки с надписью «для магазинов сети …». Они сделаны тем же производителем, что и известные соседи, но стоят зачастую на 30-40% дешевле. Вопрос за что же мы тогда платим лишние деньги излишен. А ответ на него очевиден – за известный бренд!


Ситуация на рынке вычислительной техники очень похожа на описанную «соковую». Например, мощный сервер по производительности превосходит среднюю персоналку в 2-3 раза, а вот в стоимости эта разница может доходить до 5-10 раз (все зависит от производителя). Справедливо? По-моему, тоже нет! Зачем платить лишние деньги за эфемерную аппаратную надежность, на которую так напирают производители и сомнительное превосходство по быстродействию, если можно предусмотреть вероятности сбоев и отказов программно и продублировать «узкие места».

Это и есть ключевая идея, положенная в основу построения кластеров. Технология кластерных вычислений еще очень молода, но стремительно завоевывает популярность из-за своей дешевизны и широких возможностей масштабирования. Кластерный суперкомпьютер предпочтительнее «традиционного» именно по этим причинам.

Кластер состоит из нескольких десятков или сотен персональных компьютеров или серверов, соединенных обыкновенной высокоскоростной локальной сетью (например, Gigabit Ethernet). У каждого компьютера есть владелец, использующий свой компьютер по назначению, а объединившись в кластер компьютеры решают общую задачу, требующую огромные вычислительные ресурсы.

Увеличивающееся число внедренных кластерных решений обусловлено появлением высокоскоростных проводных линий связи, позволяющих существенно снизить время информационного взаимодействия между вычислителями, что приближает их по скорости к MPP-структурам. MPP, как известно, дороги и правильно будет предположить, что их удел – дорогостоящие проекты, где требуется экстремальная производительность.

ПРИМЕЧАНИЕ

Кластеры разделяются на централизованные и децентрализованные. Централизованным кластером называется вычислительная система, смонтированная в пределах одного помещения. Соответственно децентрализованные разбросаны в пределах здания.

Характерным и крайне интересным является пример и опыт компании Google4, которая строит большие кластеры на базе недорогих персоналок [6]. Google состоит из множества информационных центров, разбросанных по всему миру. Поэтому запрос к поисковику переадресуется на ближайший к отправителю информационный центр. Типовая структурная схема информационного центра Google представлена на рис. 4.5.



Рис. 4.5. Структурная схема типичного кластера Google

Каждый центр имеет два высокоскоростных оптоволоконных канала, по которым он подключен к Интернет – это основной ОС-48 (2,488 Гбит/с) и резервный (622 Мбит/с). Внутри кластера используется Gigabit Ethernet и имеются два 128 портовых Ethernet-коммутатора, каналы ОС-48 и ОС-12 подключены к коммутаторам через специальные платы, т.е. порты коммутаторов не занимаются. К коммутаторам подключены стойки, из каждой такой стойки выходят 4 линии.

ПРИМЕЧАНИЕ

Наиболее яркие примеры создания кластеров – это модель человеческого сердца, реализованная IBM в 2000 на базе серверов RS/6000 и компьютер для создания модели Земли (Earth Simulator), представленный в 2002 году корпорацией Nec.

В типовом компьютере, используемом в кластере Google, установлены процессор Intel Pentium с тактовой частотой 2 ГГц, оперативная память емкостью 512 Мб и жесткий диск объемом 80 Гб. Компьютеры размещаются в корпусах 1u (почти 5 см) и устанавливаются в вертикальные стойки по 40 штук с передней и задней стороны. Таким образом, имеем 64 стойки (четыре канала из стойки на 256 портов двух коммутаторов) по 80 компьютеров, итого 5120 ЭВМ.

ПРИМЕЧАНИЕ

В конце 2007 года в МГУ им. Ломоносова отечественной компанией «Т-Платформы» совместно с российскими и белорусскими учеными будет создан суперкомпьютер производительностью 60 терафлоп. К 2010 году планируется реализация суперкомпьютера «СКИФ-П1» производительностью 1 петафлоп.

Поэтому к основным достоинствам кластеров следует отнести [4]:



  • высокая суммарная производительность;

  • высокая надежность работы;

  • наилучшее соотношение стоимость/производительность;

  • возможность динамического перераспределения нагрузок между вычислителями;

  • масштабируемость;

  • удобство управления и контроля работы вычислительной системы.

Лекция добавлена 28.02.2013 в 03:15:32