LINUX.ORG.RU

Cell blade сервер в действии


0

0

На выставке CeBit IBM продемонстрировала blade сервер, который обсчитывал модель сердца, позволяя поворачивать вид и выделять для наблюдения отдельные системы (делая остальное прозрачным) в реальном времени. Сервер, который будет запущен в производство в третьем квартале, будет управляться двумя Cell процессорами (PowerPC 970 2.4-4 GHz, 90 нм, в будущем IBM планирует довести технологический процесс до 30 нм) с девятью дополнительными DSP ядрами на каждый. Оба процессора делят 1 Gb оперативной памяти. И наконец главное: информацией поделился лидер IBM's Linux on Cell development team:)

>>> Подробности

Ответ на: комментарий от anonymous

Последние новости: PS3 в ноябре по всему миру с Линукс: Kutaragi proclaims that the PS3 will require a hard drive, but not whether all systems will come bundled with one or not. What he does say is that the HDD "will be 60GB big, be completely upgradeable, and support Linux OS. Additionally, the peripheral will act as a home server and allow users to store various forms of media to be pulled up elsewhere

anonymous
()
Ответ на: комментарий от lenin

не тупи
IBM как бы и не скрывает нигде что Cell это многоядерная железка, а достоинства (и недостатки) распаралеливания программ уже стотысячмиллионов раз обсуждались
1) если алгоритм принципиально не параллелится, то хоть на тысяче SPE его пускай - будет работать медленно
2) если алгоритм парралелится, а ты не асилил его портировать на Cell - ты неудачник, убей себя
3) если некий индивидум (lenin) не умеет писать программ под Cell (или SMP, не суть), то из этого не следует что никто этого не умеет делать

HellAngel ★★
()
Ответ на: комментарий от anonymous

> Ага, не программируется... и на CEBit ничего не показали, и игр на PS3 не будет ... Маразм крепчает

И что показали на CEBit ? Игры будут, будут использовть PPC ядро. Производительности для приставки - хватит. Для полноценного компютера, которые к тому времени уже будут появляться 4-х ядерные, очень мало.

lenin
()
Ответ на: комментарий от HellAngel

> некий индивидум (lenin) не умеет писать программ под Cell (или SMP, не суть)

Cell - не SMP.

> то из этого не следует что никто этого не умеет делать

Это следует из того, что ничего еще не сделано.

lenin
()
Ответ на: комментарий от lenin

>И вот только не надо отождествлять SMP архитектуру на универсальных процессорах (путь по которому идёт Intel) с несимметричной на нескольких DSP+убогий универсальный (Cell). Ты видимо разницы не понимаешь, раз такую туфту произносишь. Восьмипоточная машина Xeon доступна уже сейчас за недорого. 2 проца * 2 ядра * HT. Что не нравится? Слово "Intel" конечно же.

PS3 выйдет - посмотрим как она заработает. Думаю, офигенно круто. А себестоимость, думаю, будет не выше того XBox 360.

jackill ★★★★★
()
Ответ на: комментарий от lenin

Я не знаю что ты делаешь на полноценном компе, но лично у меня уже складывается желание не апгрейдить домашнюю машинку, а просто прикупить PS3, ибо играть на последней все равно будет приятнее, а компа мне домашнего хватает по самие уши.

jackill ★★★★★
()
Ответ на: комментарий от jackill

> не знаю что ты делаешь на полноценном компе, но лично у меня уже складывается желание не апгрейдить домашнюю машинку, а просто прикупить PS3, ибо играть на последней все равно будет приятнее, а компа мне домашнего хватает по самие уши.

World of Warcraft на приставке, ага.

lenin
()
Ответ на: комментарий от jackill

> PS3 выйдет - посмотрим как она заработает. Думаю, офигенно круто. А себестоимость, думаю, будет не выше того XBox 360.

Тока на XBox игр будет больше, выходить они будут быстрее, выглядеть будут лучше. А со временем выкинут Nintendo и Microsoft кретинаф из Sony с рынка приставок туда, где им и мэсто.

lenin
()
Ответ на: комментарий от lenin

8 однотипных ядер + одно управляющее
про кластеры слышал? вот практически один-в-один. только RCP очень быстрое из-за того что все рядом
впрочем можно какую угодно абстракцию на это дело натянуть. думаю что под разные классы задач и решения будут разные. что-то будет решаться подобно SMP, что-то - OMP

HellAngel ★★
()
Ответ на: комментарий от HellAngel

> 8 однотипных ядер + одно управляющее
> про кластеры слышал? вот практически один-в-один.


Мама.
Афтар, ти слишалъ што пра DSP или нэт ?

lenin
()
Ответ на: комментарий от lenin

очень хорошо симулинк работает например

anonymous
()
Ответ на: комментарий от HellAngel

> если алгоритм парралелится, а ты не асилил его портировать на Cell

Так в том-то и дело, что на Cell лучше всего решаются не параллельные задачи, а именно очень линейные, с большим объемом вычислений и небольшим -- данных.

В этом случае оптимальный режим для Cell -- каждый SPE вычисляет свой собственный кусочек задачи, и передаёт результат "по цепочке" следующему. Без перепрограммирования "ядрышек" по ходу задачи.

baka-kun ★★★★★
()
Ответ на: комментарий от HellAngel

> про кластеры слышал? вот практически один-в-один.

Мама, роди кого-нибудь обратно... ;)

Если хочешь назвать кластером, то представь такой:

1. Управляющий узел -- мощный процессор общего назначения (PIV какой-нибудь)
2. Узлы -- очень быстрые микрокалькуляторы, но с частично выломанными кнопками. На выбор -- ты сам их выламываешь. Часть умеет только сложение, часть только вычитание, некоторые -- умножение. Но умеют быстро.
3. И все это счастье связано в сеть token-ring.

baka-kun ★★★★★
()
Ответ на: комментарий от baka-kun

а чем тебе аналогия не нравится?
одно ядро в Cell "за главного", а у остальных "выломаны кнопки". или если сеть будет не tokenring, то это уже не кластер? ;)
а лучше так: по каким формальным признакам Cell не "кластер на кристалле"?

HellAngel ★★
()
Ответ на: комментарий от baka-kun

> Так в том-то и дело, что на Cell лучше всего решаются не параллельные задачи, а именно очень линейные, с большим объемом вычислений и небольшим -- данных. а что, ты его уже в руках вертел и тестировал на разных задачах чтобы такое утверждать?

> В этом случае оптимальный режим для Cell -- каждый SPE вычисляет свой собственный кусочек задачи, и передаёт результат "по цепочке" следующему. Без перепрограммирования "ядрышек" по ходу задачи.

а что, религия (спецификация) не позволяет нагружать ядра независимо друг от друга (не передавать данные другому SPE после обсчета)? сжатие 8 потоков видео к примеру может идти независимо на каждом ядре без передачи данных другим ядрам. в этом случае получаем симметричную обработку + один управляющий блок, который всех нагружает. а можно и по другой схеме все построить - на 7 ядрах выполняется самая ресурсоемкая часть (например анализ перемещения блоков), на 8-ом все поступившее от 7-ми ядер пакуется. да как угодно все делится - зависит много от каких факторов

HellAngel ★★
()
Ответ на: комментарий от lenin

>Бред сивой кобыли. ZX-Spectrum умер полностью в 1988, а родился в 1982м. Даже очень небольшой путь. П3 живёт дольше. только в xUSSR он пришёл позже, но это уже другоая история.

Я понимаю, что написание glukalka отбило весь моск, но родился он в промышленном исполнении в 1980 году, о чем свидетельствует опять же надпись на фирменных спекки при загрузке, а в 94-м действительно было еще очень много машин и фирмы типа codemasters выпускали игры.

jackill ★★★★★
()
Ответ на: комментарий от lenin

>World of Warcraft на приставке, ага.

Легко, если будет порт.

Насколько я знаю из своих источников, порты многих весьма интересных игр, в том числе MMORPG будут на приставках.

Рынок PC-игр схлопывается за исключением России и Бразилии на 10% в год.

Понимаешь, да?

jackill ★★★★★
()
Ответ на: комментарий от lenin

>Тока на XBox игр будет больше, выходить они будут быстрее, выглядеть будут лучше. А со временем выкинут Nintendo и Microsoft кретинаф из Sony с рынка приставок туда, где им и мэсто.

Ленин, ты занимаешься серверами, так не 3.14зди в тех темах, в которых не понимаешь. Я занимаюсь играми и в том числе мы постоянно делаем обзор платформ.

XBOX 360 у нас уже давно стоит - не впечатляет пока что, хотя машинка хорошая.

Шансы PS3 согласно мнению аналитиков потрясающие - на японском и вообще азиатском рынке xbox провалился. Мощностей микрософт по прежнему не хватает, чтобы насытить рынок США.

В отличии от MS Sony предоставит свой онлайновый сервис бесплатно полностью. Плюс они могут воспользоваться тем же приемом, которым убили dreamcast - заявить, что xbox 360 уже устарел, ибо выходят они осенью с разницей в год.

Попутно разработчикам первых игр дается больше времени на доводку приложений, значит ситуаций с глюками, как было в xbox 360 (и я их сам лично видел) не будет.

Ну и есть много еще различных мелочей.

У nintendo приставка намного проще, чем xbox или sony и занимать она будет несколько другую нишу.

jackill ★★★★★
()
Ответ на: комментарий от HellAngel

> а что, религия (спецификация) не позволяет нагружать ядра независимо друг от друга (не передавать данные другому SPE после обсчета)?

Я вижу, ты просто не знаешь, о чем говоришь. Рекомендую повнимательней изучить архитектуру Cell, чтобы не теоретизировать, а основываться на фактической информации.

> в этом случае получаем симметричную обработку + один управляющий блок, который всех нагружает.

Не получишь почти никакой выгоды, архитектура такая. Если совсем упрощенно: ты вгружаешь маленький кусок данный в небольшую по объему статическую память SPE, это всё считается в 128 128-бит регистрах, результат сохраняется в ту же память, ты его забираешь. При этом, пока ты общаешься с одним SPE, еще пяток могут передавать данные друг другу.

Если тебе будет проще понять, считай лучше SPE этакими сопроцессорами, которые с одной стороны связаны с PPE мультиплексированной шиной, с дугой -- еще и независимо между собой.

> да как угодно все делится - зависит много от каких факторов

Давай продолжим аналогию с калькуляторами. Например, разгрузим "управляющую ноду" от вычисления основного цикла CRC16 (сам по себе он не параллелится), для чего возьмем всего два калькулятора (К1, К2), и будем на них считать два разных файла (а это идеальный для распараллеливания случай).

Твой способ:

1, 2. Запишем в оба константу "1".
3, 4. Переставим кнопки для выполнения сдвига влево на эту константу
5, 6. Запишем начальные uint32 от каждого CRC16 в К1 и К2.
7, 8. Запишем в оба константу 0x800500l. Считаем, что калькуляторы уже успели рассчитать, иначе всё еще хуже для тебя.
9, 10. Переставим кнопки на "выполнить XOR на константу, если в данных установлен двадцатьпятый бит".
11--66. Повторим еще семь раз с шага 3.
67, 68. Прочитаем результаты.

Итого: 68 "тиков" мы были полностью заняты.

Рекомендуемый способ:

1, 2. Запишем в К1 константу "1" и переставим кнопки для сдвига.
3, 4. Запишем в К2 константу 0x800500l и переставим кнопки для XOR.
5. Запишем в K1 начальный uint32 первого CRC16
6. Запишем в К2 начальный uint32 второго CRC16 (параллельно К1 передал результат своих рассчетов в К2)
7--20. Подождем (в это время калькуляторы будут перекидываться данными и считать). Тут я опять делаю выгодное для тебя допущение: на этот раз предполагаю, что рассчет занимает один тик, а не моментален.
21. Прочитаем результат первого CRC16 из К2.
22. Прочитаем результат второго из К2.

Итого: 22 "тика", из которых 14 мы могли заниматься другими делами.

Выводы делай самостоятельно.

baka-kun ★★★★★
()
Ответ на: комментарий от baka-kun

Естественно, s/6\. Запишем в К2/6\. Запишем в К1/

baka-kun ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.