SSE3 , потоковые расширения SIMD 3 , также известные под кодовым названием Intel Prescott New Instructions ( PNI ), [1] являются третьей итерацией набора инструкций SSE для архитектуры IA-32 (x86). Intel представила SSE3 в начале 2004 года с ревизией Prescott своего процессора Pentium 4. [1] В апреле 2005 года AMD представила подмножество SSE3 в ревизии E (Venice и San Diego) своих процессоров Athlon 64. [2] Более ранние наборы инструкций SIMD на платформе x86 , от самых старых к самым новым, — это MMX , 3DNow! (разработаны AMD, больше не поддерживаются на новых процессорах), SSE и SSE2 .
SSE3 содержит 13 новых инструкций по сравнению с SSE2 . [3]
Наиболее заметным изменением является возможность работать горизонтально в регистре, в отличие от более или менее строго вертикальной работы всех предыдущих инструкций SSE. А именно, были добавлены инструкции для сложения и вычитания нескольких значений, хранящихся в одном регистре. [4] Эти инструкции могут использоваться для ускорения выполнения ряда операций DSP и 3D . Также есть новая инструкция для преобразования значений с плавающей точкой в целые числа без необходимости изменения глобального режима округления, что позволяет избежать дорогостоящих простоев конвейера . Наконец, расширение добавляет LDDQU
альтернативную невыровненную целочисленную векторную загрузку, которая имеет лучшую производительность на платформах на базе NetBurst для загрузок, пересекающих границы кэш-линий. [5]
ADDSUBPD
ADDSUBPS
HADDPD
HADDPS
HSUBPD
HSUBPS
LDDQU
MOVDDUP
, MOVSHDUP
, MOVSLDUP
[4]FISTTP
FISTP
инструкция x87, но игнорирует настройки режима округления регистра управления с плавающей точкой и вместо этого использует режим «chop» (усечения). [4] Позволяет исключить дорогостоящую загрузку и повторную загрузку регистра управления в таких языках, как C, где преобразование float в int требует поведения усечения по стандарту.MONITOR
,MWAIT
MONITOR
используется для указания адреса памяти для мониторинга, в то время как MWAIT
инструкция переводит процессор в состояние пониженного энергопотребления и ждет события записи по контролируемому адресу. [4]