Bulldozer, як він є


Якщо закрити очі на кількість обчислювальних ядер, в порівнянні з попередниками процесори FX отримали більш швидку шину Hyper Transport 3.1, підтримку швидкісної пам'яті DDR3 1866 МГц і збільшену до 8 Мбайт кеш-пам'ять 3-го рівня. Крім того, звертаємо вашу увагу на досить високі тактові частоти, які впритул наблизилися, а в окремих випадках навіть подолали позначку в 4000 МГц. Якщо виходити з рекомендованої ціни, чотирьохядерний процесор FX 4100 повинен конкурувати з двоядерним Sandy Bridge і молодшими Phenom II X4; суперниками шестиядерного FX 6100 стануть молодші моделі Core i5 і шестиядерних Phenom II X6. Восьмиядерні моделі FX 8120 і FX 8150 грають у «вищій лізі», де правлять бал старші Core i5 і Core i7, які до сих пір показували чудовий рівень продуктивності. Як видно, позиціонування нових процесорів AMD FX зобов'язує їх триматися на рівні дуже серйозних суперників, так що новачкам доведеться ой як нелегко!


Мікроархітектура Bulldozer: будова і особливості функціонування

Bulldozer, як він є


Нагадаємо основні можливості флагманського чіпсета AMD 990FX. Отже, він дозволяє будувати графічні конфігурації AMD CrossFireX і NVIDIA SLI, завдяки південному мосту SB950 підтримує стандарт SATA 6 Гбіт / с, але позбавлений можливості підключення пристроїв USB 3.0. Що стосується материнських плат Socket AM3, заснованих на наборах системної логіки попередніх поколінь, то після поновлення микрокода прошивки вони теж повинні будуть підтримувати Bulldozer. Але це вже залежить від конкретної моделі.

Отже, в основі всіх центральних процесорів AMD FX лежить напівпровідниковий кристал, що складається з чотирьох обчислювальних модулів, кожен з яких забезпечений власним масивом кеш-пам'яті 2-го рівня, загального кеша 3-го рівня обсягом 8 Мбайт, двоканального контролера пам'яті DDR3, контролерів шини HyperTransport і вбудованого північного мосту.

Bulldozer, як він є


Очевидно, що молодші моделі виходять з повноцінних чіпів шляхом відключення окремих функціональних блоків. Дивлячись на структуру кристала Zambezi мимоволі складається враження, що перед нами звичайний чотирьохядерний процесор. Насправді це не так, і більш за все даний факт демонструє будову обчислювального модуля - структурної одиниці процесорів AMD FX.

До складу обчислювального модуля входять два блоки цілочисельних обчислень (ALU), кожен з яких здатний виконувати до чотирьох інструкцій за такт, забезпечених власної кеш-пам'яттю 1-го рівня для зберігання даних. Всі інші блоки, такі як провісник розгалужень, декодер інструкцій, буферна пам'ять для зберігання інструкцій і масив кеш-пам'яті 2-го рівня розмірів 2 Мбайт, представлені в одиничному екземплярі. Очевидно, розробники вважали, що продуктивності цих блоків досить для обслуговування двох ALU.

Bulldozer, як він є


Крім того, кожен з обчислювальних модулів має блоком обчислень з плаваючою точкою (FPU), який також зазнав значних доопрацювань. Так до стандартних SIMD-розширень додалися набори SSE4.1 і SSE4.2, а також специфічні інструкції XOP, AES і AVX, які дозволяють значно підвищити швидкодію за умови їх підтримки з боку програмного забезпечення. Цікаво виглядає можливість виконання 256-бітних інструкцій AVX, для цього задіюються ресурси відразу двох блоків, кожен з яких здатний обробляти 128-бітові команди FMAC. При цьому блок FPU здатний виконувати дві коротких інструкції AVX одночасно.

Bulldozer, як він є

Як видно, мікроархітектура Bulldozer має дуже просунуті можливості обчислення, особливо в порівнянні з процесорами AMD попередніх поколінь. Однак за таке технологічну перевагу доводиться платити необхідністю ретельної оптимізації програмного коду. В іншому випадку, особливо в старих додатках, рівень швидкодії може бути далеким від очікуваного.

Як видно з короткого опису дизайну ядра, мікроархітектура Bulldozer, незважаючи на всі свої нововведення, не позбавлена ​​деяких недоліків. Все-таки на кожен обчислювальний модуль доводиться тільки один провісник розгалужень, блок вибірки інструкцій і один декодер інструкцій, який, до слова, здатний обробляти не більше чотирьох інструкцій за такт. Подивимося, як поведеться AMD FX в реальних додатках, але інтуїція підказує, що в додатках, які активно використовують FPU, але не мають програмної оптимізації для нових наборів SIMD-інструкцій, новітні процесори будуть демонструвати рівень продуктивності, характерний для чотириядерних моделей.

Крім архітектури змін зазнали і механізми управління енергоспоживання. Незважаючи на більшу кількість транзисторів і високі тактові частоти, навіть старші восьмиядерні AMD FX мають тепловий пакет, що не перевищує 125 Вт. Звичайно, певну роль в цьому зіграв і 32-нм технологічний процес, завдяки якому штатний напруга живлення не перевищує 1,4 В, але основна заслуга все таки належить просунутим механізмам регулювання тактових частот і живлячих напруг. Перше покоління цієї концепції було реалізовано в Phenom II X6, де в разі обчислювального навантаження не більше трьох потоків, частоти трьох активних ядер могли підвищуватися на 400 МГц. Процесори AMD FX пропонують набагато більш гнучкий підхід до управління ключовими параметрами швидкодії. Так, завдяки застосуванню силових вентильних транзисторів диспетчер енергозбереження процесора здатний відключати цілі функціональні блоки. При відсутності навантаження обчислювальний модуль разом з масивом кеш-пам'яті 2-го рівня може повністю відключатися, вивільняючи частина бюджету TDP. У той же час, тактова частота і напруга активних обчислювальних модулів може підвищуватися, причому приріст частоти в режимі Max Turbo досягає солідних 900 МГц. Погодьтеся, настільки агресивний алгоритм роботи автоматичного розгону нам ще не зустрічався. Більш того, при рівномірному навантаженні всіх обчислювальних модулів існує можливість збільшення тактової частоти порядку 300 МГц. Власне, це і є режим роботи Turbo Core, причому він буде активний до тих пір, поки енергоспоживання процесора не виходить за рамки теплового пакету. Іншими словами, саме поняття «штатна тактова частота» для AMD FX втрачає свій первісний зміст.

Bulldozer, як він є


І все було б дуже добре, якби не було так сумно. А справа в тому, що планувальник процесів операційних систем Windows поки недостатньо оптимізований для процесорів AMD FX. Існує ймовірність того, що два потоку однієї програми будуть виконуватися на цілочисельних обчислювальних блоках різних модулів, що не дозволить процесору перейти в режим Max Turbo і зажадає перезавантаження даних і інструкцій в кеш-пам'ять. В ідеальному випадку планувальник операційної системи повинен враховувати архітектурні особливості Bulldozer, в цьому випадку комбінація використання Turbo Core і Max Turbo повинні дати максимальний позитивний ефект.

Bulldozer, як він є


Уже зараз відомо, що планувальник завдань майбутньої Microsoft Windows 8 буде оптимізований для роботи на процесорах Bulldozer. А що стосується дня сьогоднішнього, можливо, буде випущено оновлення для нинішніх операційних систем, або ж програмісти AMD нарешті розроблять «чудо-драйвер» ...

Схожі статті