Умножение-сложение
В вычислительной технике, особенно в цифровой обработке сигналов совмещённое умножение-сложение (multiply-accumulate) — распространённая операция, при которой умножаются два числа и складываются с аккумулятором.
Когда операция выполняется над
Назначение
Данная инструкция позволяет более эффективно реализовать операции деления и извлечения
Реализация в процессорах
Операция включена в стандарт
Современные компьютеры могут иметь специализированный блок умножения-сложения или MAC (multiply-accumulate), состоящий из умножителя, реализующего
Появившись на сигнальных процессорах, операция (FMA) включена в системы команд процессоров: IBM
Также операция FMA реализована в процессорах AMD с поддержкой FMA4 (Bulldozer) и FMA3 (Trinity)[2]. Intel реализовала FMA3 в процессорах на ядре Haswell.[3]
Технология присутствует в
Инструкции FMA, реализованные в процессорах Intel Haswell:
- VFMADD
- VFMSUB
- VFNMADD
- VFNMSUB
- VFMADDSUB
- VFMSUBADD
Примечания
- ↑ http://www.pgroup.com/lit/articles/insider/v3n3a4.htm «perform the multiply-add operation in one step thus avoiding the intermediate stage rounding done by earlier processors. … The FMA4 instructions can speed up and improve the accuracy of many computations»
- ↑ Детали об AMD Trinity и Piledriver накануне запуска . Дата обращения: 2 мая 2012. Архивировано 5 мая 2012 года.
- ↑ http://www.reghardware.co.uk/2008/08/19/idf_intel_architecture_roadmap/ Архивная копия от 17 февраля 2012 на Wayback Machine — Intel анонсировал 22nm восьмиядерный 'Haswell', The Register
- ↑ http://www.nvidia.com/content/PDF/fermi_white_papers/NVIDIAFermiComputeArchitectureWhitepaper.pdf Архивная копия от 7 октября 2009 на Wayback Machine Nvidia Fermi Whitepaper
- ↑ http://www.bit-tech.net/hardware/graphics/2009/09/30/ati-radeon-hd-5870-architecture-analysis/8 Архивная копия от 16 апреля 2010 на Wayback Machine — Архитектура ATI Radeon HD 5870 , Bit-Tech.net