Mizuchi · 14-Май-20 08:59(5 лет 2 месяца назад, ред. 20-Дек-23 18:59)
Gaussian Год/Дата Выпуска: 2019 Версия: ES64L-G16RevC.01 Разработчик: Gaussian, Inc. Сайт разработчика: gaussian.com Разрядность: 64bit Язык интерфейса: Английский Таблэтка: не требуется Системные требования: GNU/Linux x86_64
AVX-compatible CPU like Intel Sandybridge and AMD Bulldozer or later
NVIDIA GPU of Kepler, Pascal or Volta generation - optionally Описание: Gaussian - популярная программа для вычислений, связанных с электронной структурой вещества. Доп. информация: Вместо этой программы лучше использовать ORCA: orcaforum.kofo.mpg.de Благодарность: Спасибо minj12 за предоставление файлов / 感谢minj12提供文件 / Thanks to minj12 for providing files
Thank you so much Mizuchi for your recommendation of using ORCA.
This is now officially my new tool for when I need some ab-initio quantum chemistry computations!
Fantastic piece of software.
Mizuchi
Thank you very much. it is surprising that you are good at Chinese website www.baidu.com, because this website doesnot even have a English page. Now the downloading is going well.
Thanks again
Mizuchi
wow, you are awsome!! I am pretty sure you are a professional specilist about Gaussian software. I wish I could get help from you in future. But I am wondering if you have the AVX2 version which usually run faster than the AVX version of Gaussion 16. Gaussian 16 has four versions below,
1. legacy for when none of the instruction sets listed below are available (no longer needed applicable any of the CHPC resources)
2 SSE4 -- version for lonepeak nodes; 12 core nodes on ash
3 AVX -- version for all tangent nodes; 16 and 20 core nodes on kingspeak and ash
4 AVX2 -- version for 24 and 28 core nodes on kingspeak and ash; notchpeak nodes Thank you very much
Скоро будет нужно AVX-512 - так что готовьтесь
Кстати, собираюсь покупать новую системку для расчетов. Не знаю, что лучше - один Xeon из серии Workstation, типа Xeon W-3245M (на 16 ядер 32 потока) или два серверных с таким же числом ядер в общей сумме и такой же частотой?
С одной стороны для workstation версии можно памяти оперативной до Tb доставить, но от Intel таких системных плат я не видел, особенно на пару слотов (и вообще не видел пока на пару слотов). С другой стороны от Intel есть системные платы для двух серверных Xeon, но у них память ограничена до 128 Gb. И у серверных пока нет AVX-512.
Даж не знаю. Как у большинства (у тех у кого системы не более, чем на двух Xeon)?
sdrg
А не рассматривали AMD Threadripper? Последняя серия годная, инструкций на такт больше, производительность лучшая в секторе, только длинных регистров нет. Под AVX512 собирайте из исходников NWChem, а сорсы Гауссиана ждать бессмысленно, неизвестно, если и когда они будут.
79671933sdrg
А не рассматривали AMD Threadripper? Последняя серия годная, инструкций на такт больше, производительность лучшая в секторе, только длинных регистров нет. Под AVX512 собирайте из исходников NWChem, а сорсы Гауссиана ждать бессмысленно, неизвестно, если и когда они будут.
Не я больше Intel приверженец (хотя бы по надежности, поддержке, охлаждению) - это не лечится Так что лучше для расчетов из Xeon, однопроцессорный Xeon серии workstation на кучу ядер и кучу памяти (до 2Tb), но один или два серверных Xeon на те же параметры и количество ядер в сумме, но с меньшей памятью (у меня на 2Tb все-равно денег нет,
да и тайминги с большой памятью не ясны)?
Были бы для workstation Xeon родные системные платы я бы не думал, а так сомнения по надежности и охлаждению касательно workstation Xeon от 24 ядер. Касательно AVX-512 для Гауссиана. Так там вся математическая оптимизация кода на стороннем спец. компиляторе Fortran (портланд групп, вроде). Вот они пошевелятся сделать на AVX-512 и будет и Гауссиан на AVX-512. В общем от талантов Гауссианщиков в оптимизации это мало зависит.
sdrg
Покупать процессор с AVX512 и использовать Гауссиан без них -- пустая трата денег. Оптимизация кода делается с помощью
Код:
gfortran -O3 -march=native -o test.o test.F
Портланд тут ни при чем (pgfortran оптимизирует по максимуму по умолчанию). Вопрос другой: а где вы собираетесь брать сорсы Гауссиана, если у меня их нет, а покупать дорого? Бинарников под AVX512 не существует (см. пост выше).
79672262sdrg
Покупать процессор с AVX512 и использовать Гауссиан без них -- пустая трата денег. Оптимизация кода делается с помощью
Код:
gfortran -O3 -march=native -o test.o test.F
Портланд тут ни при чем (pgfortran оптимизирует по максимуму по умолчанию). Вопрос другой: а где вы собираетесь брать сорсы Гауссиана, если у меня их нет, а покупать дорого? Бинарников под AVX512 не существует (см. пост выше).
Так не только Гауссиан планируется использовать. Касаемо бинарников под AVX512. Ну сегодня не существует, а через полгода-год засуществуют так же как и под AVX 2 вдруг возникли. Систему-то не на год покупают обычно.
sdrg
А что еще планируется использовать? Просто интересуюсь, что у нас есть под эти инструкции, кроме OpenBLAS и MKL.
Есть догадки, почему Гауссиан AVX2 появился?
79672506sdrg
А что еще планируется использовать? Просто интересуюсь, что у нас есть под эти инструкции, кроме OpenBLAS и MKL.
Есть догадки, почему Гауссиан AVX2 появился?
Я же говорю, на вырост, так как систему чаще 3-х - 5-ти лет такую не покупают. А за год-два, что-нибудь да появится. Я пока на динамические расчеты еще примеряюсь. Ну и чем MKL плох?
sdrg
Не плох. Просто AVX512 мало где используется. А покупать дико дорогое оборудование на перспективу, не зная, будет ли она, -- несколько неразумно, принимая во внимание тот факт, что у компьютерной техники отсутствует верхняя граница стоимости. То есть отказавшись от одних вычислительных блоков процессора, можно высвободить ресурсы для покупки чего-то еще, например, Nvidia Tesla V100 для динамических расчетов.
79672722sdrg
Не плох. Просто AVX512 мало где используется. А покупать дико дорогое оборудование на перспективу, не зная, будет ли она, -- несколько неразумно, принимая во внимание тот факт, что у компьютерной техники отсутствует верхняя граница стоимости. То есть отказавшись от одних вычислительных блоков процессора, можно высвободить ресурсы для покупки чего-то еще, например, Nvidia Tesla V100 для динамических расчетов.
Ну да сомнения у меня есть в нужности AVX512, ибо при одинаковом числе ядер у топовых вариантов серверных Xeon частоты ядер заметно выше; и в паре у них охлаждение лучше (не будут понижать производительность из-за перегрева). Например у 8 ядерного серверного частота 3.7 GHz, а у 16-ти ядерного workstation 3.2GHz.
С другой стороны более 16-ти ядер есть только у workstation версий Xeon (вплоть до 28 ядер при 2.5 GHz), а у серверного максимум 8-м ядер. Кроме этого память для workstation более быстрая поддерживается. Ну AVX512 у всех новых workstation Xeon с хорошей частотой (новее второго квартала 2019) в нагрузку. В общем, однозначного решения пока не вижу, ибо число ядер тоже важно.
Нужно внимательнее на системные платы посмотреть для окончательного решения.
sdrg
Если бы я хотел обновить оборудование, то собрал бы систему на Threadripper 3970X, ибо это бескомпромиссное решение на 32 ядрах с базовой частотой 3.7 ГГц (и возможностью немного подразогнать до ~ 4 по всем).
79673086sdrg
Если бы я хотел обновить оборудование, то собрал бы систему на Threadripper 3970X, ибо это бескомпромиссное решение на 32 ядрах с базовой частотой 3.7 ГГц (и возможностью немного подразогнать до ~ 4 по всем).
Сборка C01 на threadripper 1950x считает Ик частоты примерно на 50% медленнее чем выложенная ранее A03. То есть проигрыш avx против avx2 однозначно есть.
К сожалению на новых epyc второго поколения (ROME) и ryzen 3950X сборка a03 не работает. А вот эта c01 сборка работает. Но если у вас процессор не их самых новых и вам не критичны изменения в версии c01, мое мнение лучше остаться на a03. По поводу ripperов второго поколения сказать не могу.