nbilya,
Цитата:
система (1 комп) имеет 32 процессора (по 2 ядра)
Никогда не работал на подобный системах, но работал с нодами где 32 ядра и 256Гб оперативки. Отличное масштабирование показывает комсол если правильно считать.
Если у вас действительно 32 отдельных процессора, то чтобы распараллелить, нужно использовать distributed-memory parallel operations. Вам уже дали ссылки на базу данных комсола (Solution Number: 1001), и в хелпе есть информация как это использовать. С distributed-memory parallel operations у меня нет опыта, поэтому помочь не могу.
Но если все-же на вашей машине как-то можно считать в режиме shared-memory parallel operations, то рецепты просты: модель должна помещаться полностью в память при счете и не кешироваться на диск. Как только начинает писать на диск - все, сразу ни о каком расспараллеливании не может идти речи поскольку доступ к диску тормозит всю картину.
Узкое место это именно скорость доступа к диску.
Попробуйте начать с простых моделей, которые помещаются в памяти при прямом солвере, посмотрите загрузку процессоров. Постепенно увеличивайте сложность модели. Когда модель станет не помещаться в оперитивке, то можно перейти на итеративные солверы. Но тогда вы сразу столкнетесь с новой проблемой, сходимости и качества сетки. Для некоторых больших 3д моделей иногда итеративный солвер может считать быстрее, а иногда медленнее. Но может и вообще не сойтись.
В общем с итеративными солверами все куда забавнее.
И очень правильно сказали, что надо смотреть как можно упростить задачу. Это я бы сказал основное.
ПС
Отличные новости о выходе 4.4! Ждем лицензию