Есть ли причина, по которой большинство современных процессоров имеют только один FPU на ядро, но несколько ALU?

Question

Есть ли причина, по которой большинство современных процессоров имеют только один FPU на ядро, но несколько ALU?

ФермаКактусов Высший разум (210891), закрыт 10 месяцев назад

Answer 1

Распределение вычислений:
Современные процессоры обладают многопоточностью и многозадачностью. Они хорошо распределяют нагрузку между узлами (другими ядрами с сопроцессорами).
Вместо того чтобы иметь несколько FPU на каждое ядро, процессоры используют специализированные вычислительные блоки, такие как SIMD (Single Instruction, Multiple Data), которые позволяют выполнять целые векторы операций с плавающей запятой за один такт.
Архитектурные решения:
Производители процессоров стремятся к оптимальному балансу между производительностью и энергопотреблением.
Один FPU на ядро обеспечивает достаточную производительность для большинства задач, а использование нескольких FPU увеличивало бы тепловыделение и сложность процессора.
Современные архитектуры, такие как x86 и ARM, предоставляют различные инструкции для работы с векторами данных, что позволяет эффективно использовать ALU для обработки множества данных.
Изменение требований:
С течением времени требования к процессорам меняются. Сегодня большинство задач может быть эффективно распараллелено, и многие программы используют векторные инструкции.
Поэтому производители сконцентрировались на оптимизации ALU и внутренних структур процессоров, чтобы обеспечить высокую производительность в широком спектре задач.

Answer 2

Всё правильно, так производительные, разработчикам виднее!

Answer 3

а что воспринимать за fpu . в разных ядрах в разных частях ? близко к друг другу и прямым каскадом контактов? но програмно же этого всего не существует и всё работает не зависимо в одной части процессора ли оно и соединено ли миллионов окнтактов или несколькикими сотнями .
fpu и alu зависимости были 50 лет назад а сейчас осталось одно только название и не какое положение реальных дел не имет значения .

информация сердств массовых достаточно кривая и даже касается вещей в которых казалось бы ошибку допустить невозможно . скажем 7 нанометров на процах . или то что все процы в мире производят только в тайване или даже большинсво или хотя бы 30 процентов рынка но это не так . это касается мобильных телефонов которых на человека приходится по 200 штук и не как не связана с реальной сферой.

очевидно фпушки бесльны перед задачами которые нельзя паралелить . скажем какой нить дгипер пень в проф задачах того времени обгонит 8320 у которого куда больше фпу ядер .

в современных движках 8320 обгоняет гипер пень даже когда у него на 1 ядро производитеьность ниже . всё потому что код поменялся и паралелить научились очень многие .

само по себе дейсвие увиличить фпу и уменьшать тепло пакет и поставить повыше частоту . либо сделать очень много фпу как на фксе 8320 на уголках кристала так что бы тепло было возможно всё такие такое бешенное отвести от кристала . интелы же такое вообще не когда не делают даже на топовых процах .

однопоточная задача елси важна то делают один фпу . если это проф машина на 100 ядер там миллиард фпу

Answer 4

Распределение вычислений. Современные вычислительные системы хорошо распределяют нагрузку между узлами(другими ядрами с сопроцессорами), да и архитектура х86 подразумевается специальные вычислительные блоки для инструкций вроде AVX, которые позволяют выполить целый вектор операций с плавающей запятой за 1 такт

Answer 5

Что значит несколько alu?
Это в целом арифметическо-логическая часть ядра. Если их "несколько", то это значит только то, что этот блок больше размером, но все равно будет являться арифмитическо-логической частью ядра.