A A A A Автор Тема: Мощный комп для обработки  (Прочитано 2567 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн hyperion

  • *****
  • Сообщений: 713
  • Благодарностей: 147
  • Мне нравится этот форум!
    • Skype - Mutalizg
    • Сообщения от hyperion
Re: Мощный комп для обработки
« Ответ #20 : 26 Авг 2015 [17:09:15] »
Я как бы о чем и говорю что смысла городить многопроцессорную станцию на ксеонах бессмысленная идея. Только максимальная частота процессора и памяти.
По ХДД активность волнами - идет чтение и запись фитов после астрометрии. Как вы уже сказали проблема не в жестком.
Если процессор не загружен, память свободная есть, жесткий тоже не перегружен, так что еще может сказываться? Имхо только скорость памяти.

Оффлайн smitty0Автор темы

  • ****
  • Сообщений: 348
  • Благодарностей: 98
  • Гугл - панацея от глупых вопросов!
  • Награды Призер конкурса астрофото
    • Сообщения от smitty0
    • Astrophotography blog
Re: Мощный комп для обработки
« Ответ #21 : 26 Авг 2015 [17:31:46] »
Я как бы о чем и говорю что смысла городить многопроцессорную станцию на ксеонах бессмысленная идея. Только максимальная частота процессора и памяти.
По ХДД активность волнами - идет чтение и запись фитов после астрометрии. Как вы уже сказали проблема не в жестком.
Если процессор не загружен, память свободная есть, жесткий тоже не перегружен, так что еще может сказываться? Имхо только скорость памяти.
Фотометрия - единичная работа, в потоке я так понимаю может использоваться разве что для поиска новых объектов на снимке, а до такой работы ещё не дорос :) Изначально задача ставилась для работы с пиксом, а он-то прожорлив именно до процессоров и памяти, использует всё что есть (загрузка 100% при обработке это норма).

Выводы сделал, буду собирать станцию на ксеонах (2 штуки минимум), всем спасибо за советы!
Meade RCX-400 12" | Celestron C9.25 | CGEM mount | ZWO ASI178MC | ZWO ASI174MM-COOLED |
LUNAR100.com

Оффлайн Jaws

  • *****
  • Сообщений: 955
  • Благодарностей: 28
  • Решением большинства чипирован добровольно
    • Сообщения от Jaws
    • Подбор автоподборщиков (ответственно).
Re: Мощный комп для обработки
« Ответ #22 : 26 Авг 2015 [17:35:52] »
Я как бы о чем и говорю что смысла городить многопроцессорную станцию на ксеонах бессмысленная идея. Только максимальная частота процессора и памяти.
По ХДД активность волнами - идет чтение и запись фитов после астрометрии. Как вы уже сказали проблема не в жестком.
Если процессор не загружен, память свободная есть, жесткий тоже не перегружен, так что еще может сказываться? Имхо только скорость памяти.
Нет-нет, "скорость памяти", да еще для процессора с интегрированным контроллером, если и может сказаться, то это +/- 5 процентов. Процессор спроектирован так, что память не может стать узким горлом, если только этого не делать специально. Не может быть "этого же" процессора, но с памятью в два раза "быстрее". По сути весь запас в настройках таймингов и частоты (а они находятся, к сожалению, в обратной взаимозависимости ).
А процессор у вас "свободен" потому как задача, по крайней мере ее конкретная реализация, не в состоянии утилизировать более одного ядра.  Т.е. только подъем частоты процессора, или более прогрессивная его архитектура могут дать выигрыш в данном случае.

Оффлайн hyperion

  • *****
  • Сообщений: 713
  • Благодарностей: 147
  • Мне нравится этот форум!
    • Skype - Mutalizg
    • Сообщения от hyperion
Re: Мощный комп для обработки
« Ответ #23 : 26 Авг 2015 [17:51:15] »
Не могу с вами согласиться.
Процесс распараллеливается. Это видно по разным загруженным ядрам. Был бы он одно поточный - было загружено только одно ядро.
Как я вижу - идут интенсивные операции внутри ячеек памяти. Что то копируется туда-сюда а процессор задействуется только когда работа с памятью окончена и нужны какие то арифметические операции над данными.
Взять те же бенчмарки, аида64 или OCCT. Они проц грузят на все 100% арифметическими операциями.

Оффлайн jet

  • *****
  • Сообщений: 3 115
  • Благодарностей: 56
  • Outfitter hypervisor
    • Сообщения от jet
Re: Мощный комп для обработки
« Ответ #24 : 26 Авг 2015 [17:58:16] »
Если процессор не загружен, память свободная есть, жесткий тоже не перегружен, так что еще может сказываться? Имхо только скорость памяти.

Кривой код программы. Для таких плохораспараллеленных задач проще тогда копеечный G3258 в разгон до 4.3-4.5 на плате Z97, толку будет поболее чем от дорогих много ядерных зионов или i7.
Контроллер памяти уже лет 10 как непосредственно  в процессорах встроен, так что пропускная способность памяти давно не проблема.
Одну простую сказку,
А может, и не сказку,
А может, не простую
Хотим вам рассказать.
Её мы помним с детства,
А может, и не с детства,
А может, и не помним,
Но будем вспоминать...

Оффлайн Jaws

  • *****
  • Сообщений: 955
  • Благодарностей: 28
  • Решением большинства чипирован добровольно
    • Сообщения от Jaws
    • Подбор автоподборщиков (ответственно).
Re: Мощный комп для обработки
« Ответ #25 : 26 Авг 2015 [18:09:15] »
Не могу с вами согласиться.
Процесс распараллеливается. Это видно по разным загруженным ядрам. Был бы он одно поточный - было загружено только одно ядро.
Как я вижу - идут интенсивные операции внутри ячеек памяти. Что то копируется туда-сюда а процессор задействуется только когда работа с памятью окончена и нужны какие то арифметические операции над данными.
Взять те же бенчмарки, аида64 или OCCT. Они проц грузят на все 100% арифметическими операциями.

То что поток выполняется на разных ядрах не означает что он распараллеливается (тут этот "процесс" последовательный, а не параллельный. ОС по своему разумению перекидывает исполнение на другое ядро выделяя очередной квант времени для задачи). Вы можете это проверить,  привязав в диспетчере задач процесс к одному из ядер. При этом вы не потеряете, в нашем случае, ни "грамма" производительности.  Проверьте, если это не сложно.
« Последнее редактирование: 26 Авг 2015 [18:15:44] от Jaws »

Оффлайн hyperion

  • *****
  • Сообщений: 713
  • Благодарностей: 147
  • Мне нравится этот форум!
    • Skype - Mutalizg
    • Сообщения от hyperion
Re: Мощный комп для обработки
« Ответ #26 : 26 Авг 2015 [18:31:26] »
Вот привязал фитстекер к одному ядру. Загрузка одного 100% остальные почти простаивают. Ничто никуда не перекидывает.
Если стоят галки на всех ядрах то ни один на 100% постоянно не грузится.

Оффлайн Jaws

  • *****
  • Сообщений: 955
  • Благодарностей: 28
  • Решением большинства чипирован добровольно
    • Сообщения от Jaws
    • Подбор автоподборщиков (ответственно).
Re: Мощный комп для обработки
« Ответ #27 : 26 Авг 2015 [19:16:22] »
Вот привязал фитстекер к одному ядру. Загрузка одного 100% остальные почти простаивают. Ничто никуда не перекидывает.
Если стоят галки на всех ядрах то ни один на 100% постоянно не грузится.

Ну для полноты надо сделать замер времени, и... что мы докажем, в случае если увидим, что чуда не произошло и задача выполнилась за то же время? :) А то, что и так было видно, она не может прыгнуть выше 25% утилизации процессора, что для четырех ядерной модели CPU наталкивает на мысль, что задача по своей реализации однопоточная. Если бы ей мешало что-то иное (диск,отсутствие достаточного количества памяти) то она могла бы замереть например на 33% или 67%, но нет - 25%. Уверяю, запустите эту задачу на восьми-поточном CPU - загрузка будет 13%.
« Последнее редактирование: 26 Авг 2015 [19:45:48] от Jaws »

Оффлайн Алексей Юдин

  • ...
  • *
  • Сообщений: 28 996
  • Благодарностей: 1140
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re: Мощный комп для обработки
« Ответ #28 : 26 Авг 2015 [20:08:21] »
Проблема в том что не сталкивался с многопроцессорными машинами, не знаю с какой стороны к ним подходить..
Тут всё как раз вполне понятно - надо начать с софта и определить его узкие места.

Первое упражнение для Вас - определить масштабирование производительности от объёма памяти. Экспериментируйте с разными объёмами серии, если выясните, что критично упираетесь в своп, то поймаете резкое ускорение на некоторой небольшой и короче серии.

Вообще, обработка серий кадров - это не задача для машин с общей памятью и даже кластеров. Это грид-задача, поскольку тяжесть обработки внутри кадра и внутри субсерии кадров доминирует над очень небольшими объёмами передаваемых результатов. Поэтому если строить оптимальную по цене/производительности решётку, то состоять она будет из верхнего десктопа с абы каким эзернетом. Разбивку на субсерии, не затыкающие узлы свопом, Вам предстоит осуществить самостоятельно, скриптами, как и объединение результатов работы отдельных узлов.

Выигрыш двойной - однопроцессорные узлы обладают невысокой ценой и высокими тактовыми частотами.

Если же идти прямолинейно в сторону увеличения памяти, то забудьте сразу о ксеонах на сокеты 115х. Это всего лишь перелицованные десктопы без поддержки регистровой памяти, с ними совершенно нечего ловить кроме символической скидки от i7(увы, за минусом разгона...) - это кандидаты в узел кластера/грида, не более. Аналогично FX83хх и соответствующие Оптероны 3ххх.

В то же время, если действительно нужно набрать солидный объём памяти, на зарубежных барахолках в изобилии встречаются рдиммы 4-8 гб рддр3. Поэтому выбор платформы - 1366/2011/С32/G34. Если надо просто умеренно набрать память, С32. Если хочется уже подразгуляться занедорого, G34.
1366 может быть копеечной по процам, но есть две проблемы - найти мамку и неподдержка AVX. 2011 недёшева и капризна, но если софт плохо масштабируется на большое количество ядер, она вполне может стать платформой выбора, однако, и цены наибольшие.

Обо всех ДДР2 платформах, как уже сказали выше, забудьте!

Хотя я бы, конечно, не драматизировал масштаб проблемы. Любительский астрософт в своей массе - известное деpьмище, писанное рукожoпами, чем особенно славится MaxIm DL, очень может оказаться, что используемым поделкам приличная машина - как корове седло. Вылезите для начала из свопа и перейдите с ноутбука на приличный 8-поточный десктоп и, возможно, всё уже станет терпимо, т.к. ноутбучный "i5" это, увы, то что в десктопе называется младшими моделями i3...

Оффлайн Anatoly 64

  • Новичок
  • *
  • Сообщений: 47
  • Благодарностей: 3
    • Сообщения от Anatoly 64
Re: Мощный комп для обработки
« Ответ #29 : 26 Авг 2015 [20:37:10] »
Лёша, 2011 сокет, если взять б.у., выйдет не так дорого. Проц 3820, мать и память, тысяч до 30 можно найти. Проц гонится до 4.5-4.6 ггц совершенно свободно. У самого такой. Система будет актуальна еще довольно долго.
CGEM 1100; Сантел МК 200; Vixen A80Mf Porta

Оффлайн Алексей Юдин

  • ...
  • *
  • Сообщений: 28 996
  • Благодарностей: 1140
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re: Мощный комп для обработки
« Ответ #30 : 26 Авг 2015 [20:42:46] »
Да 3820 не нужен, под него подбор держащих рдиммы мамки/биоса - вопрос лотереи. Речь о 2011 на ксеонах, минимум двухсокетной.

Оффлайн Jaws

  • *****
  • Сообщений: 955
  • Благодарностей: 28
  • Решением большинства чипирован добровольно
    • Сообщения от Jaws
    • Подбор автоподборщиков (ответственно).
Re: Мощный комп для обработки
« Ответ #31 : 26 Авг 2015 [21:02:46] »
Вообще, наличие большого свопа еще не факт того, что задача активно его использует. Возможно разработчики просто не "сократили дроби" или им нравятся большие числа.  :)
Топикстартеру похвалиться бы длинной очереди диска, а то - "все ядра на 100% загружены" и т.д, но тогда только увеличение их, ядер, количества и частоты.

Оффлайн xd

  • *****
  • Сообщений: 17 982
  • Благодарностей: 378
    • Skype - deimos.belastro.net
  • Награды Открытие комет, астероидов, сверхновых звезд, научно значимые исследования.
    • Сообщения от xd
    • Белорусская любительская астрономическая сеть
Re: Мощный комп для обработки
« Ответ #32 : 26 Авг 2015 [21:34:15] »
Это видно по разным загруженным ядрам. Был бы он одно поточный - было загружено только одно ядро.
В корне неверно. Планировщик потоков операционки может перемещать потоки и процессы между ядрами. В настройках диспетчера задач включите показ количества потоков. Если будет 1 или 2 (1 на GUI и 1 на расчёт), то оставьте свои иллюзии о параллелизме. Если интересны глубоко технические моменты, могу завтра дать ссылку на детальное описание работы планировщика потоков в Windows семейства NT ;D
У природы нет плохой погоды, у неё просто на нас аллергия.

Учение без размышления бесполезно, но и размышление без учения опасно /Конфуций/
Слово есть поступок. /Л. Толстой/

Оффлайн Anatoly 64

  • Новичок
  • *
  • Сообщений: 47
  • Благодарностей: 3
    • Сообщения от Anatoly 64
Re: Мощный комп для обработки
« Ответ #33 : 26 Авг 2015 [21:35:35] »
Речь о 2011 на ксеонах, минимум двухсокетной.
Золотой системник получится.
CGEM 1100; Сантел МК 200; Vixen A80Mf Porta

Оффлайн Алексей Юдин

  • ...
  • *
  • Сообщений: 28 996
  • Благодарностей: 1140
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re: Мощный комп для обработки
« Ответ #34 : 26 Авг 2015 [23:08:41] »
Если брать новое и официальное, то да. При таком раскладе только грид выгоден. Но если набрать инженерников с eбая и б/у рдиммов, то расклад может быть поинтереснее. Правда, с Интелом есть тугой момент - для инженерников изрядную стопку мамок перепробовать возможно придётся...

Оффлайн Алексей Юдин

  • ...
  • *
  • Сообщений: 28 996
  • Благодарностей: 1140
  • Так-с, где тут у Вас Кровавое Мясное Бодалово?
    • Сообщения от Алексей Юдин
Re: Мощный комп для обработки
« Ответ #35 : 26 Авг 2015 [23:32:39] »
А вообще, что-то разговор слишком теоретический - топикстартер, пакуйте поскорее бенч, а мы погоняем у кого на чём есть!

Оффлайн VAKT

  • *****
  • Сообщений: 2 687
  • Благодарностей: 90
  • GSO 8" на AZ-EQ6 GT / DOB, pro optic 11x80
    • Сообщения от VAKT
Re: Мощный комп для обработки
« Ответ #36 : 26 Авг 2015 [23:50:47] »
Если же идти прямолинейно в сторону увеличения памяти, то забудьте сразу о ксеонах на сокеты 115х. Это всего лишь перелицованные десктопы без поддержки регистровой памяти, с ними совершенно нечего ловить кроме символической скидки от i7(увы, за минусом разгона...) - это кандидаты в узел кластера/грида, не более. Аналогично FX83хх и соответствующие Оптероны 3ххх.

Вы не правы: даже на кастрированном socket1156 работают ксеоны серии x3400 которые поддерживают ECC. Вот пруф на первоисточник, где я выбрал доступный и недорогой xeon x3450 (десктопный аналог i7-850), процитирую:

Цитата
Поддержка памяти ECC     Yes

Цена этого камня на авито - 3500 руб., что в купе с матплатой и одной планкой памяти на 16ГБ выйдет не дороже 10000 руб.

т.к. ноутбучный "i5" это, увы, то что в десктопе называется младшими моделями i3...
А тут соглашусь, но с оговоркой т.к. есть с чем сравнивать: два ноутбука, один из которых на i7 первого поколения (i7-740qm), а другой на i5 третьего поколения (i5-4210u), я ожидал, что i5 третьего поколения будет не хуже i7 первого, но оказалось совсем нет - сокетный core i7 нехалем в целом шустрее.
« Последнее редактирование: 27 Авг 2015 [00:06:29] от VAKT »
(кликните для показа/скрытия)

Оффлайн jet

  • *****
  • Сообщений: 3 115
  • Благодарностей: 56
  • Outfitter hypervisor
    • Сообщения от jet
Re: Мощный комп для обработки
« Ответ #37 : 27 Авг 2015 [00:50:50] »
ИМХО с серверами подзагнули. Если автор узнает сколько стоит небольшой набор SSD под SAS, его энтузиазм исчезнет, надолго. А ведь кроме того многое надо настраивать ручками. В общем, я это себе как то плохо представляю в домашних условиях... Ещё понимаю там NAS какой-нибудь, или вебсервер там, в режиме 24/365.
Все таки, рабочая станция и сервер это несколько разные темы
Если время не критично то поставить можно хоть 2-ядерный селерон. Загрузил его вечером работой-утром готово.
Дёшево и сердито.
Если время критично, а объемы большие то поискать "облачные" сервисы, как вариант.
Одну простую сказку,
А может, и не сказку,
А может, не простую
Хотим вам рассказать.
Её мы помним с детства,
А может, и не с детства,
А может, и не помним,
Но будем вспоминать...

Оффлайн jet

  • *****
  • Сообщений: 3 115
  • Благодарностей: 56
  • Outfitter hypervisor
    • Сообщения от jet
Re: Мощный комп для обработки
« Ответ #38 : 27 Авг 2015 [06:04:51] »

Это видно по разным загруженным ядрам. Был бы он одно поточный - было загружено только одно ядро.
В корне неверно. Планировщик потоков операционки может перемещать потоки и процессы между ядрами. В настройках диспетчера задач включите показ количества потоков. Если будет 1 или 2 (1 на GUI и 1 на расчёт), то оставьте свои иллюзии о параллелизме. Если интересны глубоко технические моменты, могу завтра дать ссылку на детальное описание работы планировщика потоков в Windows семейства NT ;D

Запустить несколько копий, по числу ядер. Это самый простой способ загрузки процессора.
Др дело что в реальной работе это не всегда целесообразно, но попробовать стоит.


Одну простую сказку,
А может, и не сказку,
А может, не простую
Хотим вам рассказать.
Её мы помним с детства,
А может, и не с детства,
А может, и не помним,
Но будем вспоминать...

Оффлайн Anatoly 64

  • Новичок
  • *
  • Сообщений: 47
  • Благодарностей: 3
    • Сообщения от Anatoly 64
Re: Мощный комп для обработки
« Ответ #39 : 27 Авг 2015 [09:32:40] »
О каких объёмах оперативки речь? Тот же старый уже SB-E работает с 64 гигами обычной памяти в четырёхканале.
CGEM 1100; Сантел МК 200; Vixen A80Mf Porta