Loop Stream Detector - Core 2 vs. Core i7
Der Loop Stream Detector (LSD) ist in der Lage, Schleifen im Code zu erkennen, was bei der Abarbeitung dieser schon dem Core 2 eine signifikante Leistungssteigerung bescherte. In CPUs der „Nehalem“-Generation wurde der LSD nochmals verbessert und hinter die Decoder-Einheit verlegt.
Im Falle des Core 2 können Schleifen bis zu 18 Instruktionen beinhalten, die maximal 4 Fetch-Instructions á 16 Byte benötigen, sie müssen mindestens 4 Branch-Instructions aufweisen und öfter als 64 mal ausgeführt werden, dann werden sie in der Befehlswarteschlange gehalten, die Branch-Prediction- und Fetch-Einheit übergangen und direkt an die Decoder-Einheit weitergeleitet, was die Abarbeitung erheblich beschleunigt.
Beim Core i7 hingegen werden bis zu 28 bereits dekodierte µOps gehalten. Wird also eine Schleife erkannt – die Erkennung dürfte der des Core 2 gleichen –, werden Branch-Prediction-, Fetch- und Decoder-Einheit übergangen und die µOps direkt an den Re-Order-Buffer geschickt. Core i7 kann also „größere“ Schleifen mit mehr Instruktionen und weniger Aufwand abarbeiten.