Олеся С@@@@@кова
Высший разум
(322950)
9 месяцев назад
Распределение вычислений:
Современные процессоры обладают многопоточностью и многозадачностью. Они хорошо распределяют нагрузку между узлами (другими ядрами с сопроцессорами).
Вместо того чтобы иметь несколько FPU на каждое ядро, процессоры используют специализированные вычислительные блоки, такие как SIMD (Single Instruction, Multiple Data), которые позволяют выполнять целые векторы операций с плавающей запятой за один такт.
Архитектурные решения:
Производители процессоров стремятся к оптимальному балансу между производительностью и энергопотреблением.
Один FPU на ядро обеспечивает достаточную производительность для большинства задач, а использование нескольких FPU увеличивало бы тепловыделение и сложность процессора.
Современные архитектуры, такие как x86 и ARM, предоставляют различные инструкции для работы с векторами данных, что позволяет эффективно использовать ALU для обработки множества данных.
Изменение требований:
С течением времени требования к процессорам меняются. Сегодня большинство задач может быть эффективно распараллелено, и многие программы используют векторные инструкции.
Поэтому производители сконцентрировались на оптимизации ALU и внутренних структур процессоров, чтобы обеспечить высокую производительность в широком спектре задач.
*ГОНИМ ФУФЫКС* С ОБРЫВА!!!
Оракул
(63726)
10 месяцев назад
а что воспринимать за fpu . в разных ядрах в разных частях ? близко к друг другу и прямым каскадом контактов? но програмно же этого всего не существует и всё работает не зависимо в одной части процессора ли оно и соединено ли миллионов окнтактов или несколькикими сотнями .
fpu и alu зависимости были 50 лет назад а сейчас осталось одно только название и не какое положение реальных дел не имет значения .
информация сердств массовых достаточно кривая и даже касается вещей в которых казалось бы ошибку допустить невозможно . скажем 7 нанометров на процах . или то что все процы в мире производят только в тайване или даже большинсво или хотя бы 30 процентов рынка но это не так . это касается мобильных телефонов которых на человека приходится по 200 штук и не как не связана с реальной сферой.
очевидно фпушки бесльны перед задачами которые нельзя паралелить . скажем какой нить дгипер пень в проф задачах того времени обгонит 8320 у которого куда больше фпу ядер .
в современных движках 8320 обгоняет гипер пень даже когда у него на 1 ядро производитеьность ниже . всё потому что код поменялся и паралелить научились очень многие .
само по себе дейсвие увиличить фпу и уменьшать тепло пакет и поставить повыше частоту . либо сделать очень много фпу как на фксе 8320 на уголках кристала так что бы тепло было возможно всё такие такое бешенное отвести от кристала . интелы же такое вообще не когда не делают даже на топовых процах .
однопоточная задача елси важна то делают один фпу . если это проф машина на 100 ядер там миллиард фпу
Alex_Klab
Мастер
(1267)
10 месяцев назад
Распределение вычислений. Современные вычислительные системы хорошо распределяют нагрузку между узлами(другими ядрами с сопроцессорами), да и архитектура х86 подразумевается специальные вычислительные блоки для инструкций вроде AVX, которые позволяют выполить целый вектор операций с плавающей запятой за 1 такт
Вовчик
Просветленный
(33106)
10 месяцев назад
Что значит несколько alu?
Это в целом арифметическо-логическая часть ядра. Если их "несколько", то это значит только то, что этот блок больше размером, но все равно будет являться арифмитическо-логической частью ядра.