Суперкомпьютеры в ракетно-космической отрасли

Автор АниКей, 05.05.2010 21:29:00

« назад - далее »

0 Пользователи и 2 гостей просматривают эту тему.

SGS_67

ЦитироватьNot пишет:
ЦитироватьSGS_67 пишет:
Тут сейчас бьют с носка, и могут невзначай зацепить.
Вы уже deflate распараллелили, или никак от косяка отцепиться не можете ?  :D  
Deflate - это совокупность алгоритмов, которые можно распараллелить на реальных задачах.
Так и делают сейчас. Смотрите синтетические тесты, когда сжимаемые массивы находятся в ОЗУ.
Я тоже это делал, хоть и факультативно.

https://www.youtube.com/watch?v=UrpSiFPY-Mg


SGS_67

#1121
ЦитироватьНу-и-ну пишет:
ЦитироватьSGS_67 пишет:
Тут сейчас бьют с носка, и могут невзначай зацепить.
Тут всё просто - о распараллеливании задач я могу кое-что рассказать участникам. Ибо занимаюсь этим на работе. Но могу и не рассказывать.

Вот тупым хамам рассказывать точно бесполезно, но Вы же не из них  :)  
Нет, не из них. И - было б интересно.

В какой области, если не секрет, работаете с параллельными методами вычислений?

Про себя скажу, что начал баловался этим ещё лет 8-9 тому. 
Реальная задача появилась год назад, но пока отложена, хоть и матчасть имеется в наличии.
Вообще, у нас в конторе есть кластер с Теслами (Not, молчать! Это к Маску не имеет отношения!   :D    ), для обсчёта численными методами... чего, не скажу, чтоб не палиться.  :)

Ну-и-ну

ЦитироватьSGS_67 пишет:
При сжатии больших массивов, так никогда не делают сейчас, и не делали раньше.
Да ну, не делали. Пока многоядерность и файлы в сотни мегабайт не стали нормой, никто с блоками не заморачивался. Нафига? Блочность прикрутили лет пятнадцать назад, можно сказать - вчера.

ЦитироватьSGS_67 пишет:
В современных методах компрессии, изначально заточенных под многопоточность, я не спец.
Насколько знаю, беспотерьное сжатие застабилизировалось на уровне сильно продвинутых производных LZ с теми же Хафманами и арифметикой. Энтузиасты бьются за жалкие проценты. По-крайней мере мне ни о каком продвинутом новом колдунстве не доносили.

А прогресс ускакал в сжатие кино, музыки и прочих текстур. Там да, всё блочное изначально. Т.е. по идее, параллелизуется естественно.

ЦитироватьSGS_67 пишет:
В какой области, если не секрет, работаете с параллельными методами вычислений?
Оптимизирую видеоигры. Иногда получается. Если задача оптимизировать скорость - там распараллеливание и вылезает регулярно. Но там не столько вычисления, сколько "вообще код". Много-много кода.

Not

ЦитироватьSGS_67 пишет:
Вообще, у нас в конторе есть кластер с Теслами (Not, молчать! Это к Маску не имеет отношения!  :D  ), для обсчёта численными методами... чего, не скажу, чтоб не палиться.  :)
Умник, у меня в рабочей станции стоят две Теслы, рядом шкаф со (старенькими правда уже сановскими SMP) кластером селл-процессоров IBM, на которых я регулярно гоняю разного рода задачки. Впрочем сейчас интерес смещается в область квантовых вычислений, для этой цели в NASA Ames есть машинка поинтереснее. Но вы уже давно спалились на вашей тупой упертости в сказанную ранее глупость. ;)

Василий Ратников

ЦитироватьNot пишет:
у меня в рабочей станции стоят две Теслы
я так понимаю переход на эльбрусы на горизонте ?

PS горизонт воображаемая линия, в которой небо сходится с землей и которая удаляется от нас, когда мы пытаемся к ней приблизиться.

Not

ЦитироватьВасилий Ратников пишет:
ЦитироватьNot пишет:
у меня в рабочей станции стоят две Теслы
я так понимаю переход на эльбрусы на горизонте ?
Как только, так сразу  8)

Denis Voronin

Ну так что, нашли уже в куда засунуть распилонедопроцессор Эльдерево Эльбрус?
Кривыми должны быть извилины, а не руки.

dmdimon

ЦитироватьSGS_67 пишет:
Цитироватьdmdimon пишет:
хотите пример простой? классическая зип-компрессия не параллелится без потерь, чем больше параллелизм - тем выше потери эффективности компрессии. например. ну или скоростью можно заплатить.
Это не так; зип отлично параллелится.
Как и любая статистическая задача.

Если есть желание подискутировать - приведите конкретный алгоритм зипа, и я его распараллелю.  :)
Хаффман не параллелится нормально, т.е. без потерь в степени компрессии. Запакованный Хаффманом поток не распаковывается в параллель, только последовательно.
хорошо параллелится там только построение дерева при компрессии, и все.
push the human race forward

dmdimon

ЦитироватьDenis Voronin пишет:
распилонедопроцессор
Fujitsu SPARC64 VII 2.4 GHz processor board
Part Number: SELX1B1Z
MSRP:  $23,400.00
push the human race forward

DiZed

Цитироватьdmdimon пишет:
Fujitsu SPARC64 VII 2.4 GHz processor board
Part Number: SELX1B1Z
MSRP: $23,400.00
гм
http://www.itinstock.com/fujitsu-oracle-sun-selx1b1z--cpu-module-2x-sparc64-vii-qc-240ghz-375-3568-05-25867-p.asp
Excluding VAT: £475.00
Including VAT:£570.00

на ибее -
Sun SELX1B1Z 375-3568 2x 2.4GHz SPARC64 VII CPU Module
US $75,00  Приблизительно 4 312,08 руб.
Не отправляет товар в страну: Россия
ради читаемости и содержательности форума в настройках аккаунта отключено отображение всего, что можно отключить; я не вижу ваши (и свои) юзерпики, подписи, посты персонажей из блеклиста  ("старый", "бендер","аникей", "nonconvex" "alexandru" "streamflow" etc ) и т.п. бесполезности

dmdimon

#1130
Это голый процессор. Цена голого Эльбруса мне неизвестна.  Был неправ, что не отменяет нижеследующего:

Да это и неважно, по логике того, кому я отвечал, фуджики пилят совсем неподетски и их процессорный модуль вообще никому не нужен - за такие-то деньги. Сами посчитайте, сколько терафлопос можно в видяхах на это бабло взять.
Мой пост был об этом.
push the human race forward

DiZed

ну сервер на видяхе точно не поднимешь. по-моему, здесь вряд ли кто-то полагает, что классические процы умирают; речь о том, что GPU совершают (небольшую) революцию в собственно расчетных задачах, и в их присутствии меряться именно тера-флопсами становится несколько неприлично и малосодержательно. вероятно, для классических процессоров пора вводить какой-то другой квалификационный параметр.. типа число ветвлений, обрабатываемых в единицу времени ; )
кстати я встречал предположение, что эльбрусовы терафлопсы лукавы еще и потому, что получены сложением таковых собственно ядра и сигнального процессора
ради читаемости и содержательности форума в настройках аккаунта отключено отображение всего, что можно отключить; я не вижу ваши (и свои) юзерпики, подписи, посты персонажей из блеклиста  ("старый", "бендер","аникей", "nonconvex" "alexandru" "streamflow" etc ) и т.п. бесполезности

TAU

#1132
ЦитироватьSGS_67 пишет: Deflate
Что вы все с этим deflate одним носитесь?

Я выше привел пример целого класса ("царства", ежели выражаться биологическим языком) алгоритмов, кои не "параллелятся". Но вы мое послание проигнорировали. Неудобное?   :D  

Речь об управляющих алгоритмах. Задействованных в системе управления сложным технических комплексом. Например, космического кораблем. В них нужно учитывать физику (логику) процессов, происходящих на объекте управления, их скорость.

Характерная ситуация - выдать некую команду на аппаратуру, подождать заданное время, проконтролировать заданный параметр.

Вот скажите мне, как вы ЭТО будете распределять на параллельные процессоры, и ЗАЧЕМ?

Можно заставить, если захотеть, простаивать не один процессор, а 10 или 1000 - но от подобной "параллельности" будет вред, а не польза.

Кстати, это и к системам, интерактивно взаимодействующим с пользователем, относится  ;)

Not

ЦитироватьDiZed пишет:
Цитироватьdmdimon пишет:
Fujitsu SPARC64 VII 2.4 GHz processor board
Part Number: SELX1B1Z
MSRP: $23,400.00
гм
 http://www.itinstock.com/fujitsu-oracle-sun-selx1b1z--cpu-module-2x-sparc64-vii-qc-240ghz-375-3568-05-25867-p.asp
Excluding VAT: £475.00
Including VAT:£570.00

на ибее -
Sun SELX1B1Z 375-3568 2x 2.4GHz SPARC64 VII CPU Module
US $75,00 Приблизительно 4 312,08 руб.
Не отправляет товар в страну: Россия
Промышленные фирмы на ибей не ходят. Почему - сами догадаетесь? ;)

Not

ЦитироватьDiZed пишет:
речь о том, что GPU совершают (небольшую) революцию в собственно расчетных задачах, и в их присутствии меряться именно тера-флопсами становится несколько неприлично и малосодержательно
Только в вашем воображении.

Not

ЦитироватьTAU пишет:
ЦитироватьSGS_67 пишет: Deflate
Что вы все с этим deflate одним носитесь?

Я выше привел пример целого класса ("царства", ежели выражаться биологическим языком) алгоритмов, кои не "параллелятся".
Этому клиенту  усложнять не нужно, для него усложнение - возможность выкрутиться. Ему достаточно привести один простой как гвоздь пример, который легко найти в интернете, и где словами разработчиков оного написано, что он не параллелится. Только тогда он перестанет выеживаться и уйдет плакать.

Василий Ратников

#1136
Not, внимание ) в этом то и соль что эльбрус совершенно убог в сложных задачах
и 4 ядерный эльбрус сливает катку древнему Атому Д2500
сливает и5 от 5 до 25 раз в сложных прикладных задачах
 
ну а в простых где мог бы выстрелить его теоретический гигафлопс он карлик перед видеокартами.

"во сколько раз V8 на Э4С отстает от V8 на Intel Core i7-4770 3.4 ГГц в каждом тесте JS"
http://forum.ixbt.com/post.cgi?id=attach:8:25409:6244:1.png

наслаждайтесь
у интела  4 ядра и дата выпуска  Q2'13 )
у современного и7 уже 6 ядер и частота повыше и кэш побольше )
так что эльбрус будет отсасывать еще больше
и самое печальное эльбрусу что он "многососисочный" и это уродство не починить никогда

Василий Ратников

а еще главнее что эльбрус это процессор будущего ) он всегда существует в будущем времени
еще 8С нигде не применяется, и массовое производство не развернуто, даже для полицаев
а уже на горизонте 8СВ ! который то огого ! будет наверное
пока на роль огого которого надо подождать не поместят 16С который то уж точно покажет кузькину мать
как только так сразу

и все они будут существовать только в бравурных статьях об успехах импортозамещения и фантазиях псевдо-патриотов.

кое куда его пихнут конечно, тайваньская фабрика то работает ) (И - импортозамещение)
но софта нет, работает как говно, стоит как золотой унитаз, даже полицаи получат системники на эльбрусе
сфотают в газету, запрут на склад и будут дальше юзать интел.

DiZed

ЦитироватьNot пишет:
Промышленные фирмы на ибей не ходят. Почему - сами догадаетесь?  ;)
конешно догадаюсь. только лох будет покупать процессорный модуль за 400 евро, когда можно купить за 40K.  только лох будет использовать ракетные ступени по несколько раз. тем более только лох станет сажать их на старую списанную баржу
ради читаемости и содержательности форума в настройках аккаунта отключено отображение всего, что можно отключить; я не вижу ваши (и свои) юзерпики, подписи, посты персонажей из блеклиста  ("старый", "бендер","аникей", "nonconvex" "alexandru" "streamflow" etc ) и т.п. бесполезности

mahor11

Цитироватьнаслаждайтесь
у интела 4 ядра и дата выпуска Q2'13 )
у современного и7 уже 6 ядер и частота повыше и кэш побольше )
так что эльбрус будет отсасывать еще больше
и самое печальное эльбрусу что он "многососисочный" и это уродство не починить никогда
Самые быстрые процессоры vs Эльбрус
[IMG]
Сегодня о возможностях Эльбрус ходит множество слухов. О них часто спорят и задают вопросы в комментариях к любой статье об Эльбрус.
На видео с канала Горшенина – немало интересного о новой машине Эльбрус-801 PC на базе 8-ядерного процессора Эльбрус-8С. Однако даже после просмотра этих инсайдерских видео остаются вопросы. Например Максим только намекнул с чем надо сравнивать Эльбрус-8С по производительности. Надеюсь что таблица ниже полностью устраняет этот пробел.
[TH]Процессор, № (Имя)[/TH][TH]Число
ядер[/TH][TH]GFlops,
с ДТ[/TH][TH]Частота,
GHz[/TH][TH]L3 cache,
MB[/TH][TH]Техпроцесс,
нм[/TH][TH]Тип
ОЗУ[/TH][TH]ОЗУ
MAX[/TH][TH]Слотов
ОЗУ[/TH][TH]4[/TH][TH]50[/TH][TH]3.3[/TH][TH]8[/TH][TH]45[/TH][TH]DDR3-1066[/TH][TH]24[/TH][TH]3[/TH][TH]4[/TH][TH]50[/TH][TH]0.8[/TH][TH]0[/TH][TH]65[/TH][TH]DDR3-1600[/TH][TH]48[/TH][TH]3[/TH][TH]4[/TH][TH]118[/TH][TH]3.3[/TH][TH]6[/TH][TH]32[/TH][TH]DDR3-1333[/TH][TH]32[/TH][TH]2[/TH][TH]8[/TH][TH]125[/TH][TH]1.3[/TH][TH]16[/TH][TH]28[/TH][TH]DDR3-1600[/TH][TH]64[/TH][TH]8[/TH][TH]10[/TH][TH]247[/TH][TH]3.0[/TH][TH]26[/TH][TH]14[/TH][TH]DDR4-3000[/TH][TH]128[/TH][TH]4[/TH][TH]8[/TH][TH]288[/TH][TH]1.6[/TH][TH]16[/TH][TH]28[/TH][TH]DDR4-2600[/TH][TH]2048[/TH][TH]8[/TH][TH]16[/TH][TH]750[/TH][TH]2.0[/TH][TH]32[/TH][TH]16[/TH][TH]DDR4-2600[/TH][TH]2048[/TH][TH]8[/TH][TH]24[/TH][TH]844[/TH][TH]2.2[/TH][TH]60[/TH][TH]14[/TH][TH]DDR4-1600[/TH][TH]3078[/TH][TH]12[/TH][TH]32[/TH][TH]2000-4000[/TH][TH]2.0[/TH][TH]≥32[/TH][TH]14[/TH][TH]DDR4-3200[/TH][TH]2048[/TH][TH]8[/TH][TH]32[/TH][TH]2500[/TH][TH]2.1[/TH][TH]45[/TH][TH]14[/TH][TH]DDR4-3200[/TH][TH]3078[/TH][TH]12[/TH]
Core i7 975
Эльбрус-4С (E2S)
2x Xeon x567741043.51232DDR3-13332889
i5-2500K (Sandy Bridge)
Эльбрус-8С (P1)
i7-4960X (Ivy Bridge)62443.61622DDR3-1866644
i7-6950X (Broadwell E)
Эльбрус-8C2 (P9)
i7-5960X (Haswell)83503.52022DDR4-24001284
AMD A10-7850K124273.7028DDR3-2133644
Эльбрус-16С
Xeon E7-8890 v4
Xeon E7-8894 v4249212.46014DDR4-1600307812
Эльбрус-32С
Xeon E5-2699 V5
Xeon Phi™ Processor 72107230001.53614DDR4-2400307812
ДТ – двойная точность
8 ядер, L3 в 16 Мб и 28-нм у Эльбрус-8С – это уже очень серьезно. МЦСТ созданы образцы 4-процессорных серверов на базе микропроцессоров P1 с общей пиковой производительностью в 500 гигафлопс. Учитывая масштабирование на 4 ЦП, получаем 8 х 4 = 32 ядра.
Сегодня самый быстрый процессор в мире – это Xeon Phi™ Processor 7210. Как видим перспективный российский процессор Эльбрус-32С уже дышит ему в затылок.


http://youinf.ru/kakaya-proizvoditelnost-u-elbrus-8s/     :D
Back in the  U.S.S.R !