Streaming SIMD Extensions 4
SSE4 (Streaming SIMD Extensions 4) ist eine x86-Befehlssatzerweiterung von Intel, die ab der Penryn-Variante der Core-2-Prozessoren von Anfang 2008 in 64-Bit-x86-Prozessoren „x64“ enthalten ist. Der zweite Teil, SSE4.2 genannt, wurde mit der Nehalem-Mikroarchitektur Ende 2008 eingeführt und ist damit in allen Prozessoren der Core-i-Serie vorhanden. Bei Prozessoren von AMD wurde SSE4 inklusive SSE4.2 in der Bulldozer-Mikroarchitektur von 2011 übernommen und ist daher u. a. in Prozessoren der FX-Reihe enthalten.
Intel SSE4 besteht aus 54 Befehlen. Der erste Teil von 47 Befehlen erschien unter dem Namen SSE4.1, mit SSE4.2 kamen sieben weitere Befehle hinzu.
AMD fügte anstelle dessen mit der K10-Architektur (2007) vier eigene Befehle zu SSE3 hinzu und veröffentlichte diesen Instruktionssatz unter dem Namen SSE4a. Obwohl auch Intels SSE4 als Überarbeitung von SSE3 angesehen werden kann, haben SSE4 (Intel) und SSE4a (AMD) – trotz der Namensähnlichkeit – nichts miteinander gemein. In den Prozessoren der Bulldozer-Mikroarchitektur, die im Oktober 2011 veröffentlicht wurden, hat AMD SSE4 vollständig (und zusätzlich zu SSE4a) integriert, während x86-Prozessoren von Intel die SSE4a-Befehle nicht übernommen haben.
Intel stellte SSE4 u. a. auf der CES 2008 vor und fasst die x86-Streaming-Befehlssatzerweiterungen – darunter auch SSE4 – unter dem Marketing-Begriff „Intel HD Boost“[1] zusammen.[2][3]
Instruktionen
Im Folgenden eine unvollständige Auflistung der neu eingeführten Befehle und ihrer Einsatzbereiche.
SSE 4.1
- Skalarprodukt bestimmen –
DPPS, DPPD
- z. B. für 3D-Grafiken, Spiele
- Bedingtes Überblenden –
BLENDPS/-D, BLENDVPS/-D, PBLENDVB, PBLENDDW
- z. B. für Bildverarbeitung, Multimedia, Spiele
- Minima bzw. Maxima bestimmen –
PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD
- z. B. für Bildverarbeitung, Multimedia, Spiele
- Integerumwandlung –
PMOVSXBW/-D/-Q, PMOVZXBW/-D/-Q, PMOVSXWD/-Q, PMOVZXWD/-Q, PMOVSXDQ, PMOVZXDQ
- z. B. für Bildverarbeitung, Multimedia, Spiele
SSE 4.2
- Zyklische Redundanzprüfung –
CRC32
- Beschleunigte Prüfsummenberechnung. Implementiert die Castagnoli-Variante (CRC-32C) und ist daher inkompatibel zur in IEEE 802.3 standardisierten CRC32-Variante, welche in Netzwerkprotokollen (wie Ethernet, V.42), SATA, MPEG-2, PNG, und im UNIX-
cksum-Kommando zum Einsatz kommt. CRC-32C kommt unter anderem bei iSCSI und bei dem Linux Dateisystem Btrfs zum Einsatz.
- Erweiterte String-Operationen –
PCMPESTRI, PCMPESTRM, PCMPISTRI, PCMPISTRM
- Leistungssteigerung für Virenscanner, Datenbanken und Textverarbeitung. Da die Operationen, wie in SSE üblich, auch hier auf 128-Bit-Operanden basieren, werden nur Strings bis zu einer maximalen Länge von 16 Bytes, bzw. bis zu 8 UCS-2-Zeichen, verarbeitet. Die möglichen Funktionen sind im Einzelnen
- Vergleiche Zeichenketten
- Finde Zeichen aus einer spezifizierten Menge
- Finde Zeichen aus spezifizierten Intervallen
- Suche, ob eine Zeichenkette in einer anderen enthalten ist
SSE 4.2 ist eine Anforderung für Windows 11 Version 24H2 (Windows 11 2024 Update), umgesetzt wird diese ab dessen Vorabversion Insider Preview Build 26080 – April 2024.[4]
Weblinks
- Extending the World's Most Popular Processor Architecture – Intel-Whitepaper zu SSE4 (PDF, 172 kB, zuletzt aufgerufen am 17. März 2014)
- Intel SSE4 Programming Reference (PDF, 760 kB, zuletzt aufgerufen am 22. September 2025)
Einzelnachweise
- ↑ Intel Centrino 2 Processor Fact Sheet. (PDF; 195 KiB) Intel, 2008, S. 3, abgerufen am 22. September 2025 (englisch): „Intel HD Boost – Significantly improves performance when executing streaming SIMD extension (SSE/SSE2/SSE3/SSE4) instructions, accelerates a broad range of applications, including video, speech and image, photo processing, encryption, financial, engineering and scientific applications.“
- ↑ Thomas Hübner: Intel „Santa Rosa Refresh“ in 45 nm vorgestellt. In: ComputerBase. 7. Januar 2008, abgerufen am 22. September 2025: „Geändert haben sich im Zusammenhang mit den Mobil-Prozessoren lediglich einige Bezeichnungen. So werden die SSE4.1-Instruktionen nun als Intel HD Boost Technologie umworben.“
- ↑ Christof Windeck: Core 2 Duo E8000: Die 45-Nanometer-Generation rollt an. In: c’t. Nr. 3/2008. Verlag Heinz Heise, 10. November 2018, ISSN 0724-8679, S. 24, Sp. rechts, aktuell | Hardware (heise.de [abgerufen am 6. Februar 2022] Paywall: c’t 3/2008, S. 24): „Anlässlich der Consumer Electronics Show … kündigte Intel neben den bereits … vorgestellten Notebook-Versionen auch Dual-Core-Prozessoren mit 45-Nanometer-Innenleben für Desktop-Rechner an. Die Neulinge (Codename: Wolfdale) tragen die Typennummern Core 2 Duo E8190, E8200, E8400 und E8500 und laufen am FSB1333 mit Taktfrequenzen von 2,66, 3,0 und 3,16 GHz. … Die 45-nm-Chips sind aber nicht nur ein bisschen höher getaktet, sondern enthalten auch einen um 50 Prozent auf nun 6 MByte vergrößerten L2-Cache und bringen neue Befehle mit, die Intel unter dem Namen SSE4 beziehungsweise ‚HD Boost‘ vermarktet.“
- ↑ Mark Mantel: Windows 11 24H2 läuft nicht mehr mit Prozessoren ohne SSE4.2. In: Heise online. 25. April 2024. Abgerufen am 10. Mai 2024.