AMD Bulldozer è l'ultima generazione di processori AMD. "Bulldozer" dai processori AMD e Intel: chi vince

AMD Bulldozer è l'ultima generazione di processori AMD. "Bulldozer" dai processori AMD e Intel: chi vince

Dedicato all'analisi della nuova architettura a microprocessore AMD Bulldozer, incorporata nei modelli FX 8120 e FX 8150 della famiglia Zambezi. Nelle recensioni, i modelli di punta non appaiono sotto la luce più favorevole: consumano molta energia, si surriscaldano e hanno prestazioni significativamente inferiori al livello delle soluzioni concorrenti di Intel. Inoltre, sono posizionati come processori a 8 core, anche se in realtà si tratta di modelli a 4 core con una forma "avanzata" di multithreading, a causa della natura "siamese" dei doppi moduli Bulldozer. Presumibilmente nel tentativo di neutralizzare un'immagine negativa emergente e ripristinare la fiducia nel marchio AMD, l'azienda ha svelato un piano per migliorare l'architettura di Bulldozer entro il 2014 - un obiettivo ambizioso in termini di tempistiche, visto quanto può accadere e quanto imprevedibile la situazione al prima linea del progresso tecnologico può cambiare.

Come risulta dal grafico pubblicato, vari stadi di sviluppo evolutivo, rappresentati dalle architetture Piledriver ("pile driver"), Steamroller ("steam roller") ed Excavator ("escavatore"), entro il 2014 consentiranno, in accordo con il calcolo dati, per fornire un incremento qualitativo del 30-50% (i materiali presentati, ovviamente, possono essere corretti senza preavviso). I nomi di marketing utilizzati trasmettono l'immagine dell'uomo reale, suggerendo ottime prestazioni che porteranno tutti i concorrenti a terra. Pertanto, se le nuove non dovessero competere, le convenzioni utilizzate continueranno a introdurre un elemento di confusione, come avviene attualmente con l'architettura Bulldozer. Poiché i prodotti Intel dimostrano già una superiorità al livello del 20-50% (a seconda del test specifico), sorge la domanda: in che modo questi modesti miglioramenti consentiranno di fornire una concorrenza degna con le soluzioni future di Intel? Alla luce del recente rimpasto di leadership di AMD, possiamo solo sperare che il leader giusto entri per riportare l'azienda sulla buona strada. In caso contrario, non è escluso uno scenario in cui la produzione di prodotti compatibili x86 possa essere interrotta e tutta l'attenzione è focalizzata sulla produzione di soluzioni grafiche.

Il problema principale dell'architettura Bulldozer al momento è che il suo ingresso sul mercato è in ritardo e troppo tardi. I lavori per la creazione di Bulldozer sono iniziati nel 2007, ad es. 4 anni fa sono un tempo molto lungo per l'industria dei processori desktop. Pertanto, AMD, di fatto, ha introdotto un nuovo "vecchio" prodotto. Ci sono due importanti punti a favore dei nuovi prodotti: buona scalabilità in termini di scelta del numero di core richiesti e caratteristiche di alta frequenza, perché gli stessi 8 GHz, dimostrati dall'esempio dei materiali di marketing, non dovrebbero essere scontati. Ciò di cui abbiamo veramente bisogno è un progresso più significativo rispetto a quanto mostrato nella diapositiva demo. Abbiamo bisogno di un aumento qualitativo del 100% o anche di più, che non è un obiettivo così irraggiungibile nei prossimi tre anni. O forse sarebbe più corretto abbandonare la direzione prescelta e ricominciare tutto da capo, avendo fatto una scelta a favore dei core discreti, come nei processori AMD della famiglia Phenom? Forse i recenti cambiamenti nella dirigenza di AMD saranno in grado di apportare modifiche alle attività dell'azienda.

Quindi, anche se AMD riesce a soddisfare e superare i numeri previsti, le consentirà di competere con Intel o Intel farà rotolare il bulldozer stesso con un rullo compressore?

Introduzione Non c'è dubbio che i nuovi processori a microarchitettura Bulldozer di AMD siano tra i prodotti più attesi non solo quest'anno, ma almeno quest'anno. Ci sono diverse ragioni per questo, così come l'esistenza di un enorme esercito di fan per i prodotti AMD. Qualcuno ha ricordi freschi di quei tempi in cui i processori di questa azienda erano migliori di quelli Intel sotto tutti gli aspetti. Alcune persone amano i prodotti AMD per la loro combinazione equilibrata di prezzo e prestazioni. E alcuni sono rimasti colpiti dalle storie emozionanti di AMD sui vantaggi della microarchitettura sviluppata nelle profondità dell'azienda. Tutto ciò è stato sovrapposto ai molti anni di dolorosa attesa per il rilascio dei processori della generazione Bulldozer, ed ecco il risultato: stai leggendo questo articolo con grande attenzione e interesse palese.

Tuttavia, ne vale chiaramente la pena. La situazione del mercato dei processori nei prossimi anni dipende dal successo della microarchitettura Bulldozer. Dopotutto, solo Intel dispone delle risorse di progettazione e produzione per implementare nuove soluzioni di microarchitettura ogni due o tre anni. AMD è costretta a mantenere un ritmo di sviluppo molto più misurato. È spaventoso da ricordare, ma la microarchitettura utilizzata negli odierni processori Phenom II e Athlon II risale al 1999 e da allora AMD ha apportato solo modifiche estetiche. Pertanto, non ci illudiamo nemmeno che il ciclo di sviluppo riprenderà improvvisamente con l'uscita di Bulldozer. È ovvio che Bulldozer sarà al centro dell'offerta di prestazioni di AMD per i prossimi anni.

Sulla versione attuale dei piani aziendali, lo sviluppo di questa microarchitettura è previsto fino al 2014, ma quasi sicuramente proseguirà ulteriormente.

Il fatto che AMD prometta un aumento delle prestazioni del 10-15% ogni anno è più preoccupante che incoraggiante. Molto probabilmente, un tale aumento sarà fornito principalmente da un aumento delle frequenze di clock e solo allora da alcuni nuovi miglioramenti della microarchitettura.

In altre parole, il successo della microarchitettura Bulldozer nella sua forma attuale avrà un'influenza decisiva sulla posizione futura di AMD, sulla competitività dei suoi prodotti e, in definitiva, sulla situazione complessiva del mercato dei processori.

Ovviamente, non si può negare che Bulldozer non sia l'unico prodotto principale per AMD. Questa microarchitettura si rivolge oggi al segmento dei desktop e dei server ad alte prestazioni. Allo stesso tempo, AMD ha altre offerte per altri segmenti di mercato. Ad esempio, i processori a basso costo ed economici con la microarchitettura Bobcat o le APU della famiglia Llano, rilasciati dall'azienda all'inizio di quest'anno, non sono aree meno importanti per l'azienda. E queste proposte, come abbiamo visto dai risultati dei test, sono soluzioni di successo che possono adeguatamente fungere sia come soluzioni per netbook e nettop, sia come base per piattaforme integrate nelle fasce di prezzo di fascia media.

Tuttavia, il successo o il fallimento di Bulldozer è molto più significativo. Innanzitutto, questa microarchitettura si rivolge a segmenti di mercato con margini molto più elevati: server e desktop ad alte prestazioni. Pertanto, è in grado di avere un impatto molto più forte sulla condizione finanziaria di AMD. In secondo luogo, il successo dei processori serie C, E e A di AMD, francamente, non è affatto merito degli ingegneri coinvolti nello sviluppo del design dei microprocessori. I successi di mercato di queste CPU (o APU, se ci si attiene alla terminologia AMD) derivano dalla presenza dei core grafici della famiglia Radeon HD, entrati nei processori AMD grazie al tempestivo acquisto di ATI. Bulldozer, invece, è una sorta di esame di abilitazione per il team di ingegneri, che si occupa proprio della microarchitettura dei core di calcolo. E terzo, Bulldozer alla fine diventerà la spina dorsale dell'intera linea di processori AMD, con l'eccezione delle soluzioni di piattaforma ad alta efficienza energetica. Quindi, alla fine, è questa microarchitettura che arriverà ai segmenti di mercato inferiori, soppiantando il K10 da quasi ovunque, compresi i processori Llano.



In breve, è difficile sopravvalutare l'importanza di un lancio di successo di processori con la microarchitettura Bulldozer. È un prodotto iconico sia a livello emozionale che materialistico. Ed è per questo che voglio davvero che vediamo nella realtà, in senso figurato, il nuovo K7 o K8.

Ma anche prima del test, possiamo dire che le possibilità di una ricorrenza di questo fenomeno sono piccole. L'ultima volta, Intel stessa ha aiutato a prendere il palmo di AMD, cercando di promuovere la microarchitettura NetBurst tutt'altro che ideale. Quindi gli ingegneri Intel si sono concentrati sull'aumento della velocità di clock, che alla fine ha incontrato ostacoli sotto forma di gigantesche correnti di dispersione, e AMD ha offerto una microarchitettura più bilanciata volta a eseguire più istruzioni per clock. Ma dopo che Intel ha rivisto la sua dottrina e introdotto la nuova microarchitettura Core, anch'essa finalizzata all'esecuzione del numero massimo di istruzioni per clock, AMD è tornata alla posizione di ritardo, dov'era fino ad ora.

È ovvio che è molto difficile superare i moderni processori Intel in termini di numero di istruzioni eseguite per ciclo di clock. La microarchitettura Sandy Bridge di oggi è il risultato di almeno tre cicli di ottimizzazione di un design intrinsecamente efficiente, quindi non dovresti aspettarti un'efficienza specifica ancora più elevata dei core computazionali da AMD. Inoltre, gli ingegneri AMD non si sono nemmeno prefissati un simile obiettivo.

L'idea principale di Bulldozer è altrove. I processori basati su questa microarchitettura, come concepiti dagli sviluppatori, dovrebbero mostrare buone prestazioni grazie alle elevate velocità di clock e a un numero maggiore di core rispetto ai loro concorrenti e predecessori. Allo stesso tempo, dovrebbero rimanere abbastanza redditizi nella produzione, cioè non dovrebbero avere un cristallo semiconduttore troppo grande e non dimostrare un rilascio di calore troppo elevato in termini di un singolo nucleo.

I segreti del design multi-core di AMD

È abbastanza chiaro che un aumento del numero di core del processore comporta inevitabilmente un aumento dell'area del cristallo del processore. Di conseguenza, aumentano sia la complessità della produzione che il costo dei prodotti finali. Pertanto, ad esempio, i processori con il numero massimo di core di elaborazione vengono utilizzati oggi solo nel segmento di mercato dei server: i clienti aziendali sborsano molto più volentieri dei singoli utenti. Il corso scelto da AMD per aumentare il numero di core mantenendo un costo accettabile dei processori risultanti dovrebbe essere abbinato alla semplificazione dei core stessi. Tuttavia, d'altra parte, la semplificazione dei core comporta un effetto indesiderato: un calo delle prestazioni nelle applicazioni con un carico debolmente parallelizzato, di cui al momento ne esiste ancora un numero sufficiente.

Quindi gli ingegneri AMD hanno seguito la loro strada. La microarchitettura dei singoli core è diventata più complessa, aumentando il più possibile il numero di istruzioni eseguite per ciclo di clock.



Ma si è deciso di rendere alcune delle risorse solitamente presenti in ogni core, ma con eccessiva efficienza, condivise tra coppie di core computazionali.



Il risultante gruppo dual-core è diventato l'elemento base per i processori Bulldozer. Tale nodo, chiamato modulo nella terminologia AMD, ha due set completi di unità di esecuzione intere. Ma allo stesso tempo, l'unità in virgola mobile, i dispositivi di prelettura e decodifica delle istruzioni e la cache di secondo livello esistono in un'unica istanza per un paio di core e condividono le loro risorse tra di loro. Secondo le stime degli sviluppatori, la potenza di questi elementi è abbastanza per due core, poiché quando si esegue la manutenzione di un singolo core nella vita reale, spesso rimangono inattivi. Inoltre, i ritardi nel loro regolare funzionamento non influiscono seriamente sulle prestazioni risultanti.

Secondo la stessa AMD, un modulo dual-core progettato in questo modo è in grado di fornire fino all'80% delle prestazioni di un processore dual-core a tutti gli effetti. Allo stesso tempo, il risparmio nel budget del transistor (e, di conseguenza, l'area del cristallo semiconduttore) raggiunge il 44%.

Grazie a questa ingegnosa compattazione dei core, AMD è riuscita a incorporare un design a otto core (o quattro moduli) nel design di base del chip semiconduttore Bulldozer.



Inoltre, una parte abbastanza significativa del cristallo è dedicata alla memoria cache. Condivise tra coppie di core all'interno di ciascun modulo del processore, le cache L2 hanno un volume di 2 MB e la memoria cache totale per l'intero processore L3 è di 8 MB. Pertanto, tenendo conto dell'organizzazione esclusiva delle cache, tradizionale per AMD, possiamo dire che il loro volume totale è di 16 MB per un processore a otto core. Allo stesso tempo, l'area del cristallo semiconduttore Bulldozer rimane entro limiti accettabili, in modo che gli sviluppatori AMD abbiano pienamente raggiunto il loro obiettivo.



In numeri assoluti, ciò significa che il Bulldozer a otto core avrà un cristallo semiconduttore più piccolo rispetto, ad esempio, ai processori Thuban a sei core (Phenom II X6) costruiti sulla microarchitettura K10. Tuttavia, va tenuto presente che Bulldozer sarà prodotto secondo una tecnologia di processo più avanzata con standard a 32 nm. Rispetto al moderno Intel Sandy Bridge quad-core, il nuovo AMD a otto core avrà solo il 45% in più di area die.

Tuttavia, i processori Sandy Bridge a quattro core, grazie al supporto della tecnologia Hyper-Threading, così come Bulldozer, possono apparire al sistema operativo come processori a otto core. Questo, di sicuro, darà origine a polemiche sulla legittimità del nome Bulldozer come processori a otto core a tutti gli effetti. Tuttavia, dovrebbe essere chiaro che AMD e Intel sono giunti alla liceità dell'esecuzione simultanea di otto thread computazionali in modi diversi. Gli sviluppatori Intel nella loro microarchitettura hanno fregato funzionalità aggiuntive che consentono a due thread di funzionare all'interno di un core, su un set di dispositivi esecutivi. AMD, d'altra parte, ha ritagliato parti "extra" da due core a tutti gli effetti, ma ci sono solo due serie di dispositivi esecutivi all'interno di ciascun modulo.



Di conseguenza, la tecnologia Hyper-Threading di Intel aumenta le prestazioni multi-thread solo del 15-20% e la soluzione AMD offre un aumento delle prestazioni dell'80% quando si passa da 4 a 8 thread.

Sebbene, ovviamente, il cristallo semiconduttore del Bulldozer a otto core, grazie alla sua struttura modulare, sia davvero molto simile a quello a quattro core.


Più istruzioni per orologio?

L'aumento del numero di core del processore da solo non andrà lontano. Ciò è diventato chiaro anche dopo il rilascio dei processori Phenom II X6 a sei core, che sono generalmente inferiori in termini di prestazioni al Sandy Bridge a quattro core. Pertanto, gli sviluppatori AMD non si sono limitati a modifiche estese al design. La microarchitettura di base di Bulldozer, rispetto al K10, è stata ridisegnata leggermente meno che completamente, il che fa sperare nell'accelerazione dei sistemi sui processori AMD non solo nelle attività multithread, ma anche nelle applicazioni con un basso livello di parallelismo. Inoltre, queste speranze si basano su circostanze del tutto oggettive. Mentre le precedenti microarchitetture AMD erano affilate per l'esecuzione di tre istruzioni per clock (su un core), la microarchitettura Bulldozer assume l'esecuzione di quattro istruzioni per clock e si avvicinava in questa caratteristica ai processori di un concorrente con la microarchitettura Core.

I cambiamenti qualitativi possono essere tracciati a partire dalle primissime fasi della pipeline di esecuzione, dalla fase di prelettura e decodifica delle istruzioni. Queste fasi sono comuni per coppie di core all'interno dello stesso modulo, quindi AMD ha prestato particolare attenzione affinché non diventassero un collo di bottiglia nella microarchitettura. Il recupero delle istruzioni dalla cache L1I per la decodifica viene eseguito in blocchi di 32 byte, due volte più grandi dei processori con microarchitettura Core (seconda generazione). La stessa cache delle istruzioni di primo livello ha una dimensione di 64 KB e un'associatività a due canali. Le istruzioni destinate alla decodifica vengono caricate preventivamente in esso dalla cache L2.

L'unità di previsione del ramo che prende la parte più diretta nel processo di recupero contiene due serie di buffer che tracciano indipendentemente l'attività di diversi core. Pertanto, quando prevede i risultati delle transizioni logiche, Bulldozer non "si confonde" tra i thread. Poiché la nuova microarchitettura mira a operare a velocità di clock elevate, la qualità dell'unità di previsione del ramo è di fondamentale importanza. Pertanto, gli algoritmi utilizzati sono stati completamente ridisegnati e AMD spera che l'efficienza di previsione dei rami in Bulldozer migliori.



Il decodificatore di istruzioni x86 di Bulldozer divide anche le sue risorse in due core ed è in grado di decodificare fino a 4 istruzioni in ingresso per clock. Tuttavia, le sue prestazioni sono limitate dall'emissione di solo quattro istruzioni macro (che sono il risultato della decodifica in termini utilizzati da AMD), mentre le istruzioni x86 possono essere scomposte in 1-2 o anche più istruzioni macro. Quindi, sebbene il decoder abbia aumentato di un terzo le sue prestazioni rispetto alla precedente generazione di microarchitettura, la sua velocità potrebbe non essere sufficiente, dato che gli è affidato il compito di fornire il lavoro di due cluster computazionali interi e uno a valori reali .

Va notato che in Bulldozer ha trovato applicazione anche un certo analogo della tecnologia di fusione delle istruzioni di macrofusione. Diversi gruppi di istruzioni x86 possono essere combinati in un unico insieme e passati attraverso il decoder come un'unica istruzione: AMD chiama questa Branch Fusion.

Le macro istruzioni decodificate sono distribuite in tre cluster computazionali, due dei quali sono i resti di core computazionali completi e uno è un punto mobile, condiviso tra i core. Ciascuno di questi cluster ha la propria logica di riordino delle istruzioni e il proprio scheduler. Questo ovviamente significa che AMD si riserva la possibilità di sostituire o integrare completamente alcuni di questi cluster nei prodotti futuri.

Il riordino delle istruzioni in ciascuno dei cluster si basa sull'uso di un file di registro fisico che conserva i riferimenti al contenuto dei registri ed elimina la necessità di trasferimenti di dati costanti all'interno del processore durante le permutazioni nell'ordine delle istruzioni. Questo approccio ha sostituito il buffer di riordino nel suo post, poiché il file di registro fisico non solo mostra una maggiore efficienza in termini di consumo energetico, ma è anche più favorevole all'aumento della frequenza di clock del processore.

I cluster interi contengono due unità di esecuzione aritmetica (ALU) e due unità di indirizzo di memoria (AGU). Rispetto alla microarchitettura K10, il numero di dispositivi è diminuito di un'ALU e di un'AGU, ma AMD assicura che ciò non ridurrà significativamente le prestazioni, ma l'area centrale risparmierà in modo significativo. Crediamo prontamente che avere più di due ALU e AGU in ogni cluster intero non abbia davvero alcun senso pratico, perché non più di quattro istruzioni macro per clock possono provenire dal decoder per l'esecuzione da parte di entrambi i cluster.



Allo stesso tempo, gli attuatori sono diventati più versatili, praticamente non differiscono nelle loro funzioni.

L'organizzazione del sottosistema della memoria cache è cambiata in modo significativo. La cache L1D è diminuita da 64 a 16 KB ed è diventata comprensiva del write-through. Allo stesso tempo, la sua associatività è aumentata a 4 canali, oltre ai quali è stato aggiunto un "predittore di percorso". La diminuzione delle dimensioni della cache dei dati di primo livello è compensata da un significativo aumento del suo throughput; ora può servire fino a tre operazioni a 128 bit contemporaneamente: due letture e una scrittura.

Ovviamente, i cambiamenti nella larghezza di banda della cache L1D sono in gran parte legati alla necessità di implementare istruzioni AVX a 256 bit nella microarchitettura, il cui supporto è apparso nella FPU condivisa tra i core. Tuttavia, ciò non significa che i dispositivi esecutivi di valore reale siano diventati a 256 bit. In effetti, ci sono due dispositivi a 128 bit nel modulo Bulldozer e le istruzioni AVX vengono decodificate come coppie collegate di istruzioni a 128 bit. Di conseguenza, per eseguirli, vengono combinati dispositivi FMAC (moltiplicazione-accumulazione in virgola mobile) e le prestazioni di un cluster in virgola mobile sono ridotte a un'istruzione AVX per unità di processore per clock.



L'FPU non ha una propria cache di primo livello, quindi il lavoro di questo cluster con i dati avviene tramite dispositivi interi.

Poiché gli ingegneri AMD hanno già intrapreso l'implementazione del supporto per le istruzioni AVX proposte da Intel, altri set rilevanti sono stati aggiunti ai processori Bulldozer: istruzioni SSE4.2 e AESNI volte ad accelerare le operazioni di crittografia. Inoltre, AMD ha implementato alcune delle proprie istruzioni: l'aggiunta di moltiplicazione a tre operandi FMA4 e la propria visione dell'ulteriore sviluppo di AVX - XOP.



La cache L2 di Bulldozer è condivisa all'interno dell'unità processore e condivisa tra i core. La sua capacità è di ben 2 MB e la sua associatività è di 16 canali. Tuttavia, la latenza della cache che opera secondo questo schema è aumentata a 18-20 cicli, mentre la larghezza del bus rimane la stessa di prima: 128 bit. Ciò significa che la cache L2 in Bulldozer, sebbene grande, non è molto veloce, i processori concorrenti e precedenti offrono cache L2 con circa la metà della latenza. Insieme a una piccola cache L1D con una latenza di 4 cicli (che è anche più che nella microarchitettura K10), tutto questo non sembra molto incoraggiante. Tuttavia, AMD afferma che la latenza della cache è stata aumentata esclusivamente per dare a Bulldozer la possibilità di funzionare a velocità di clock più elevate.



Inoltre, gli ingegneri AMD hanno implementato un efficiente blocco di prefetch progettato per caricare in modo proattivo i dati richiesti nella cache del primo e del secondo livello. Si dice che le prestazioni di questi blocchi siano migliorate e ora sono persino in grado di riconoscere strutture di dati irregolari.

In teoria Bulldozer fa una buona impressione. AMD ha completamente rivisto il suo vecchio approccio alla microarchitettura del processore e ha dato vita a un design completamente ridisegnato. Il che, a prima vista, sembra molto promettente, perché la nuova microarchitettura è ottimizzata per l'esecuzione di quattro, non tre, istruzioni per ciclo di clock su un core del processore. Inoltre, supporta la fusione macro di istruzioni durante la decodifica, che aumenta ulteriormente le prestazioni specifiche.

Ma tutto sembra così buono solo finché osserviamo un solo core e non pensiamo che in realtà tali core siano combinati a coppie. E il modulo Bulldozer dual-core ha troppe parti in comune su una coppia di core. In particolare, a causa del fatto che tale modulo dispone di una sola unità di recupero istruzioni e di un decodificatore, il numero massimo di istruzioni eseguite per ciclo di clock rimane pari a quattro per l'intero complesso dual-core. Ciò significa che l'equivalente logico di un core Sandy Bridge in termini di prestazioni teoriche è il modulo, non il core Bulldozer. La possibilità che il modulo esegua due thread in questo caso sembra una risposta abbastanza naturale di AMD alla tecnologia Hyper-Threading.

Naturalmente, i nostri test sui processori reali metteranno tutto al suo posto, ma già nella fase di considerare la microarchitettura, siamo costretti a pensare che posizionare Bulldozer come processori a otto core a tutti gli effetti sia uno stratagemma di marketing. È più affidabile giudicare le capacità computazionali di questi processori dal numero di moduli, che, in termini di prestazioni teoriche, sono perfettamente confrontabili con i core costruiti sulla microarchitettura Intel Core di seconda generazione.

A questo proposito, sorge una domanda del tutto naturale: perché AMD ha persino contattato l'implementazione dell'elaborazione dual-thread all'interno di un singolo modulo del processore? Perché era impossibile combinare dispositivi esecutivi distribuiti su due core in un unico cluster? Ci sono diverse ragioni per questo.

Innanzitutto, per il caricamento simultaneo di un gran numero di dispositivi esecutivi con il lavoro, nel caso generale è necessaria una logica avanzata del processore interno. AMD, d'altro canto, non era ovviamente in grado di implementare unità di predizione dei rami e di istruzione e prelettura dei dati altamente efficienti nella microarchitettura Bulldozer. Pertanto, il compito di parallelizzare il lavoro e un uso più ottimale dei dispositivi esecutivi viene trasferito ai produttori di software, che devono fornire prodotti con supporto multithreading per Bulldozer.

In secondo luogo, aumentare il numero di thread in esecuzione contemporaneamente non è una cosa negativa. Mentre per gli utenti desktop, e in particolare i giocatori, otto core Bulldozer abbastanza semplici non sono di buon auspicio, nelle applicazioni server una tale microarchitettura dovrebbe essere accolta molto favorevolmente. Quindi, è del tutto possibile che l'obiettivo principale nello sviluppo di Bulldozer non fosse soddisfare le aspirazioni degli appassionati, ma ripristinare la posizione di AMD nel mercato dei server.

Turbo Core ancora più Turbo

L'efficienza energetica è una delle caratteristiche più importanti dei moderni processori. Ad esempio, nel loro microarchitetture future Intel presta attenzione alla riduzione del consumo energetico quasi prima di tutto. AMD non è ancora arrivata a questo, gli ingegneri di questa azienda, prima di tutto, stanno ancora lottando per le prestazioni. Ma questo non significa che agli sviluppatori non frega niente delle caratteristiche termiche ed energetiche di Bulldozer. Al contrario, dopo Llano, nei processori Bulldozer hanno trovato posto nuovi approcci all'aumento dell'efficienza energetica. Tuttavia, in questo caso, gli ingegneri hanno utilizzato il potenziale rilasciato non tanto per risparmiare denaro quanto per ottenere prestazioni aggiuntive attraverso un aumento delle frequenze di clock.

Certo, alcuni miglioramenti in termini di consumo energetico e dissipazione del calore sono stati apportati dalla nuova tecnologia di produzione. Bulldozer utilizza un processo a 32 nm utilizzando mezzi ad alto dielettrico, transistor a gate metallico e tecnologia SOI. In altre parole, questo è lo stesso processo tecnico di GLOBALFOUNDRIES per cui vengono utilizzati i processori Llano. Grazie alla nuova tecnologia a 32 nm, i processori della serie a 8 core di Bulldozer hanno una tensione operativa di 1,4 V.

Tuttavia, la principale innovazione che è passata da Llano a Bulldozer sono i transistor a valvola di potenza, progettati per scollegare l'alimentazione da alcune parti del processore. In Bulldozer, consentono ai moduli dual-core separati e alla memoria cache di essere diseccitati in modo indipendente.



Quando entrambi i core di calcolo in un modulo entrano nello stato di risparmio energetico C6, il modulo viene diseccitato. Sfortunatamente, questa tecnologia non può essere applicata ai core del processore, poiché semplicemente non ci sono core dedicati all'interno di Bulldozer: condividono alcune delle risorse con i loro moduli vicini.

Gli stati di risparmio energetico dei core C6 vengono eseguiti nella tecnologia Bulldozer e Turbo Core. In quei momenti in cui almeno la metà dei moduli del processore di Bulldozer è nello stato di risparmio energetico disabilitato, aumenta la sua tensione di alimentazione e la frequenza di clock. Questa modalità boost è chiamata Max Turbo Boost.

Tuttavia, non c'è nulla di nuovo in Max Turbo Boost, un simile auto-overclocking è stato introdotto da AMD nei processori Thuban basati sulla microarchitettura K10. La vera novità è la modalità All Core Boost, in cui la velocità di clock può aumentare oltre il valore nominale anche quando tutti i core del processore sono attivi. La versione migliorata di Turbo Core implementata in Bulldozer consente al processore di giudicare il suo consumo energetico pratico e la dissipazione del calore con una buona precisione, sulla base delle informazioni sul carico di lavoro di determinati blocchi. Di conseguenza, se, secondo questa stima, l'attuale dissipazione di calore e il consumo di energia sono significativamente al di sotto del limite, il processore può aumentare la sua tensione di alimentazione e la frequenza di clock anche se nessun core è in uno stato passivo.



Pertanto, la frequenza operativa dei processori con la microarchitettura Bulldozer è un valore estremamente variabile. A seconda della "gravità" degli algoritmi in esecuzione e del numero di core coinvolti, può variare dinamicamente su un range molto ampio, arrivando a 900 MHz.

Piattaforma desktop aggiornata

Con l'introduzione della nuova microarchitettura, AMD non solo non ha cambiato il design della piattaforma, ma ha anche mantenuto i processori Bulldozer compatibili con l'infrastruttura esistente. Di conseguenza, proprio come i loro predecessori, i nuovi processori contengono un North Bridge integrato, che include una cache L3, un controller di memoria e un controller del bus Hyper-Transport. Allo stesso tempo, nonostante il fatto che in tutti i processori AMD e Intel appena rilasciati sia integrato un controller del bus grafico PCI Express, Bulldozer no.



Così come nei processori basati sulla microarchitettura K10, il Northbridge integrato in Bulldozer utilizza la propria frequenza di clock, che per diversi modelli è impostata su 2.0-2.2 GHz. Nota che questa frequenza in un certo modo influisce sulle prestazioni, poiché influenza direttamente la velocità della cache L3. Che nella versione attuale dei processori ha un volume aumentato fino a 8 MB e ha un'associatività a 64 canali. In risposta ai desideri degli utenti aziendali, i dati memorizzati in questa cache sono protetti dal codice di correzione degli errori ECC.

Il controller di memoria integrato in Bulldozer non ha funzionalità fondamentalmente nuove. Come prima, supporta DDR3 SDRAM, utilizza un design a doppio canale e, di fatto, è costituito da due controller indipendenti a canale singolo che possono funzionare in modalità tandem o non collegata. AMD ha aggiunto solo il supporto per i tipi di memoria ad alta velocità, dichiarando la compatibilità con DDR3-1867, e si è occupata della compatibilità con i moduli ad alta efficienza energetica con tensioni operative di 1,25 e 1,35 V.

Parlando della modifica desktop di Bulldozer, che ha un proprio nome in codice Zambezi, va notato che è rivolto alla nuova piattaforma Socket AM3+, conosciuta anche con il nome in codice Scorpius. Il socket del processore Socket AM3 + ha 942 pin, uno in più rispetto al Socket AM3. Ma nonostante questo, la compatibilità di Zambezi con le vecchie schede Socket AM3 è preservata. Quando si installano nuovi processori su vecchie schede madri, infatti, si perdono solo alcune funzioni di gestione dell'alimentazione. Quindi, la velocità delle frequenze di commutazione viene ridotta quando le tecnologie Turbo Core e Cool "n" Quiet funzionano e Vdrop non funziona.

Tuttavia, per il rilascio di Zambezi, AMD e i produttori di schede madri hanno preparato una galassia di nuovi prodotti basati sui nuovi chipset della novecentesima serie. La struttura di un tipico sistema basato sul processore Zambezi e costruito su un nuovo chipset è mostrata nello schema a blocchi sottostante.


Le differenze tra il nuovo chipset AMD 990FX (e le sue versioni semplificate AMD 990X e AMD 970) stanno esclusivamente nel supportare le proprietà elettriche specifiche del Socket AM3+ e non portano con sé alcuna nuova interfaccia. Come nei chipset della serie ottocentesima, il nuovo south bridge dispone di sei porte SATA 6 Gb/s e quattordici porte USB 2.0. Non importa quanto vorremmo vedere il supporto per la specifica PCI Express 3.0 o, nel peggiore dei casi, per le porte USB 3.0 nei nuovi chipset, non c'è niente del genere neanche questa volta. Questo, tra l'altro, è piuttosto strano, perché il supporto USB 3.0 è stato introdotto nei chipset per la piattaforma Socket FM1 di livello inferiore.

Le differenze tra le modifiche della nuova serie di chipset sono esclusivamente nel supporto di varie configurazioni multi-GPU.


Gamma di processori Zambesi

Il rilascio dei processori Zambezi completa il rinnovamento della lineup offerta da AMD. I processori desktop basati sulla microarchitettura Bulldozer diventeranno la nuova offerta di punta di questo produttore e sostituiranno rapidamente tutte le possibili modifiche del Phenom II dal mercato.

Per evidenziare l'innovatività della nuova microarchitettura, AMD utilizzerà un nuovo nome commerciale per i suoi processori desktop Zambezi, FX. Da un lato, si adatta perfettamente alla nuova nomenclatura, che implica l'etichettatura dei processori con lettere, e dall'altro è un riferimento ai leggendari processori Athlon 64 FX, che erano le CPU desktop più veloci sei o sette anni fa. Tuttavia, quei giorni sono irrimediabilmente finiti, quindi vediamo cosa AMD è pronta a offrirci ora.

Nel prossimo futuro, la gamma di processori della serie FX includerà quattro modelli.



Nonostante il fatto che la differenza tra i modelli dei processori Zambezi non risieda solo nelle frequenze di clock, ma anche nel numero di core di elaborazione attivi, saranno tutti basati sullo stesso cristallo semiconduttore unificato. Questo:



Per ottenere processori con meno di otto core, AMD ne disabiliterà alcuni su un die a semiconduttore. La possibilità del loro sblocco inverso, come era possibile con i processori con la microarchitettura K10, è ancora in discussione. Tuttavia, nel BIOS delle schede madri basate su kit logici della novecentesima serie che sono passati attraverso il nostro laboratorio, sono presenti le opzioni corrispondenti, quindi c'è speranza per una soluzione favorevole a questo problema.

La disabilitazione dei core per ottenere modifiche ai processori a sei core e quad-core verrà eseguita in modo "modulare". Cioè, sono gli interi moduli dual-core che verranno bloccati, e non i "secondi" core al loro interno, anche se una tale tattica sarebbe molto più vantaggiosa in termini di prestazioni. Tuttavia, il rilascio di six-core e quad-core costruiti sulla microarchitettura Bulldozer è spiegato non tanto da considerazioni di marketing quanto dalla necessità di implementare il rigetto, che, date le dimensioni dei cristalli piuttosto grandi e il nuovo processo tecnologico, sarà abbastanza Un sacco.

Nonostante AMD abbia affinato la nuova microarchitettura per il funzionamento a velocità di clock elevate, finora non possiamo definire i valori raggiunti una svolta impressionante. Il limite dei quattro gigahertz rimane imbattuto e la frequenza nominale del vecchio processore FX è persino inferiore rispetto, ad esempio, al Phenom II X4 980. Si spera che, con il miglioramento della tecnologia di produzione, le frequenze dello Zambesi aumentino rapidamente. Sebbene, secondo l'attuale versione dei piani di AMD, l'accelerazione della linea avverrà non prima del primo trimestre del 2012.

Non ci sono innovazioni in termini di dissipazione del calore e consumo di energia. AMD ha parlato a lungo del fatto che la microarchitettura Bulldozer sarà più efficiente dal punto di vista energetico, ma in realtà i vecchi modelli a otto core hanno lo stesso livello di TDP dei vecchi Phenom II. Tuttavia, dopo un po' l'azienda dovrebbe aggiungere alla sua offerta una versione da 95 watt dell'FX-8120 e un processore FX-8100 con la stessa dissipazione del calore calcolata.

Ma i prezzi dei nuovi processori della serie FX sembrano più che attraenti. AMD non vuole deviare dal corso che ha intrapreso per offrire piattaforme a un prezzo più favorevole rispetto al suo concorrente, quindi i vecchi modelli Zambezi a otto core si oppongono ai vecchi processori Intel Core i5. Nel complesso, AMD prevede di aderire al seguente schema di posizionamento per i suoi prodotti:



In altre parole, AMD non intende affatto puntare a competere con Intel a sei core e la promettente piattaforma LGA2011, ma vuole puntare alla conquista del segmento di prezzo medio.

Una piacevole notizia per gli appassionati sarà il fatto che nessun moltiplicatore sarà bloccato in tutti i processori della serie FX. Tutti gli Zambezi possono non solo essere facilmente overcloccati semplicemente cambiando il moltiplicatore di base, ma anche riconfigurare la tecnologia Turbo Core allo stesso modo. Inoltre, è disponibile l'overclocking del sottosistema di memoria e la frequenza del ponte nord integrato nel processore.

Processore di prova: AMD FX-8150

AMD ha inviato alla nostra redazione il processore senior della famiglia Zambezi, l'FX-8150.



Ha una frequenza di clock nominale di 3,6 GHz e maggiori informazioni sulle sue caratteristiche possono essere ottenute dallo screenshot sopra di CPU-Z.



Si noti che il processore si basa sullo stepping B2 - e questo è lontano dalla prima versione. Le modifiche precedenti del cristallo a semiconduttore sono state respinte dal produttore perché non potevano funzionare alle velocità di clock originariamente previste. Questo è ciò che ha causato un certo ritardo nell'annuncio, inizialmente previsto in primavera, poi in estate, ma di fatto è avvenuto a metà ottobre.

Tuttavia, la frequenza di 3,6 GHz raggiunta oggi non sembra troppo impressionante. Sia AMD che Intel hanno prodotti più veloci. Tuttavia, l'FX-8150 dispone di una tecnologia Turbo Core molto promettente, che, a basso carico, può aumentare automaticamente la frequenza del processore fino a 4,2 GHz.



È interessante notare che la frequenza di 3,9 GHz può essere raggiunta anche se il carico grava su tutti i core computazionali, ma allo stesso tempo lascia spazio all'auto-overclocking senza andare oltre i limiti di consumo energetico e dissipazione del calore.



Quando è inattivo, la tecnologia Cool "n" Quiet riduce l'FX-8150 fino a 1,4 GHz. In questo caso la tensione di alimentazione scende a 0,85 V.


Come abbiamo testato

Abbiamo confrontato il nuovo processore AMD FX-8150 a otto core, costruito sulla microarchitettura Bulldozer, con uno dei suoi predecessori, il Phenom II X6 a sei core, e le offerte Intel concorrenti (per il prezzo) - il Core i5-2500 a quattro core e processori Core i7-2600. Inoltre, per maggiore chiarezza, i risultati includono gli indicatori di prestazione del processore Core i7-990X a sei core.

Di conseguenza, la composizione dei sistemi di test includeva i seguenti componenti software e hardware:

Processori:

AMD FX-8150 (Zambesi, 8 core, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 core, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 core, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 core, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extreme Edition (Gulftown, 6 core, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

Dispositivo di raffreddamento della CPU: NZXT Havik 140;
Schede Madri:

Gigabyte 990FXA-UD5 (socket AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Memoria:

2 x 2 GB, SDRAM DDR3-1600, 9-9-9-27 (Kingston KHX1600C8D3K2 / 4GX);
3 x 2 GB, SDRAM DDR3-1600, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Scheda grafica: AMD Radeon HD 6970.
Disco rigido: Kingston SNVP325-S2/128 GB.
Alimentazione: Tagan TG880-U33II (880 W).
Sistema operativo: Microsoft Windows 7 SP1 Ultimate x64.
Autisti:

Driver del chipset Intel 9.2.0.1030;
Driver del motore di gestione Intel 7.1.10.1065;
Tecnologia Intel Rapid Storage 10.6.0.1022;
Driver di visualizzazione AMD Catalyst 11.10.

Si noti che i test sono stati eseguiti con la versione corrente del sistema operativo Windows 7, ma AMD indica che il task manager di questo sistema operativo non distribuisce i thread di elaborazione nel modo più ottimale. Windows 7 preferisce principalmente instradare i thread ai core situati in moduli diversi. E questo fornisce davvero prestazioni specifiche più elevate, poiché riduce il carico sui blocchi condivisi all'interno del modulo. Tuttavia, questa strategia impedisce l'inclusione di modalità turbo, che potrebbero essere utilizzate dal processore se alcuni dei moduli dual-core fossero in stato di risparmio energetico.

Il promettente sistema operativo Windows 8 seguirà una tattica diversa e i thread verranno assegnati prima ai core all'interno dello stesso modulo. Di conseguenza, come promette AMD, in alcune applicazioni le prestazioni dei sistemi basati su Zambezi potranno aumentare fino al 10%.

Prestazione

Valutazione preliminare dell'efficacia della microarchitettura Bulldozer

Prima di iniziare il test "reale" dei processori, abbiamo deciso di capire cosa ci si può aspettare in linea di principio dalla microarchitettura Bulldozer. Per fare questo, abbiamo fatto un piccolo confronto del processore con questa microarchitettura con altre CPU con le microarchitetture K10 e Sandy Bridge in condizioni uguali create artificialmente: alla stessa frequenza di clock e con lo stesso numero di core attivati.

Più specificamente, abbiamo confrontato AMD FX-8150, Phenom II X6 1100T e Core i7-2600 a 3,6 GHz con solo due core di elaborazione attivati. Per la purezza dell'esperimento, tutte le tecnologie di risparmio energetico e di autoaccelerazione sono state naturalmente disattivate. Come strumento di test è stato scelto un insieme di semplici benchmark sintetici inclusi nell'utility SiSoft Sandra 2011 in cui abbiamo forzatamente disabilitato tutti i set di istruzioni precedenti a SSE3, poiché non sono supportati nella microarchitettura K10.



I numeri nella tabella parlano meglio di qualsiasi parola. Le prestazioni della microarchitettura Bulldozer sono molto inferiori a quelle dei suoi predecessori. La combinazione di coppie di core in un modulo con risorse condivise e la relativa semplificazione della microarchitettura hanno portato al fatto che alla stessa frequenza le prestazioni specifiche di Bulldozer per core sono diminuite del 25-40% rispetto alla microarchitettura AMD della generazione precedente . Di conseguenza, i kernel Bulldozer sono quasi due volte più lenti dei kernel Sandy Bridge. Inoltre, la velocità del modulo processore Bulldozer, che include due core, risulta essere addirittura inferiore alla velocità di un singolo core Sandy Bridge con Hyper-Threading abilitato. Dovremmo aspettarci record di prestazioni da un processore basato su una tale microarchitettura? La domanda è retorica.

Lungo la strada, diamo un'occhiata alle caratteristiche pratiche delle cache e del sottosistema di memoria. Per valutare la velocità di questi nodi funzionali, abbiamo eseguito dei test nell'utility Cachemem del pacchetto Aida64. In tutti i casi, abbiamo utilizzato la memoria DDR3-1600 con latenze 9-9-9-27-1T. Come nel caso precedente, le frequenze del processore sono rimaste allineate a 3.6 GHz.



In Zambezi, rispetto ai processori Phenom II, sono cresciute le latenze pratiche di tutte le cache e del sottosistema di memoria. Ne abbiamo parlato anche considerando la microarchitettura Bulldozer. Tuttavia, a causa del cambiamento nell'organizzazione logica della memoria cache, la sua larghezza di banda è aumentata in quasi tutti i casi.

Tuttavia, il controller di memoria dual-channel più veloce e il sottosistema di cache più veloce sono implementati in Sandy Bridge. Sebbene, ovviamente, in termini di cache, il processore Intel sia leggermente inferiore ai supporti della microarchitettura Bulldozer.

Prestazioni complessive

Per valutare le prestazioni dei processori in attività comuni, utilizziamo tradizionalmente il test Bapco SYSmark 2012, che simula il lavoro dell'utente nei comuni programmi e applicazioni per ufficio moderni per la creazione e l'elaborazione di contenuti digitali. L'idea del test è molto semplice: produce un'unica metrica che caratterizza la velocità media ponderata di un computer nelle applicazioni comuni.

Ricordiamo che qualche tempo fa AMD ha provato a trollare SYSmark, diffondendo affermazioni sui suoi pregiudizi dovuti all'uso del set "sbagliato" di applicazioni reali. Tuttavia, a nostro avviso, tale giudizio non è giustificato, poiché sono programmi comuni e molto popolari che vengono utilizzati per valutare le prestazioni, il contributo di ciascuno dei quali al risultato finale è mostrato nel seguente diagramma:



Pertanto, non abbiamo abbandonato l'uso di SYSmark 2012 e continuiamo a utilizzare le sue metriche per valutare le prestazioni comunemente utilizzate.



Il primissimo test - e una tale delusione. Il risultato dell'FX-8150 a otto core è solo del 10% migliore rispetto alle prestazioni del Phenom II X6 1100T a sei core e, naturalmente, non raggiunge affatto la velocità dei processori Intel a quattro core. Quindi la tattica scelta da AMD per implementare un gran numero di core con prestazioni specifiche basse nel processore invece di un numero moderato di quelli complessi, in generale, non dà un risultato positivo.

Una comprensione più approfondita dei risultati di SYSmark 2012 può fornire informazioni sulle stime delle prestazioni ottenute in vari casi d'uso del sistema.

Lo script Office Productivity simula il tipico lavoro d'ufficio: preparazione di testi, elaborazione di fogli di calcolo, utilizzo della posta elettronica e navigazione in Internet. Lo script utilizza il seguente set di applicazioni: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 e WinZip Pro 14.5.



Lo scenario Media Creation simula la creazione di uno spot utilizzando immagini e video digitali pre-scattati. A tale scopo vengono utilizzati i pacchetti popolari di Adobe: Photoshop CS5 Extended, Premiere Pro CS5 e After Effects CS5.



Lo Sviluppo Web è uno scenario all'interno del quale si modella la creazione di un sito web. Applicazioni utilizzate: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 e Microsoft Internet Explorer 9.



Lo scenario di analisi dati/finanziaria è dedicato all'analisi statistica e alla previsione delle tendenze di mercato che vengono eseguite in Microsoft Excel 2010.



Lo script di modellazione 3D riguarda la creazione di oggetti 3D e il rendering di scene statiche e dinamiche utilizzando Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 e Google SketchUp Pro 8.



Nell'ultimo scenario, Gestione del sistema, crei backup e installi software e aggiornamenti. Sono coinvolte diverse versioni di Mozilla Firefox Installer e WinZip Pro 14.5.



Il processore con la microarchitettura Bulldozer mostra risultati fondamentalmente diversi in diversi modelli di utilizzo. In alcuni casi risulta essere anche più lento del Phenom II X6, ma ci sono anche situazioni opposte. In generale, la regola generale è questa: il vantaggio dell'FX-8150 diventa particolarmente evidente dove il carico di lavoro è multithread e ben parallelizzato, ma allo stesso tempo non complicato in termini di calcoli.

Tuttavia, anche nelle situazioni più favorevoli, l'FX-8150 è in ritardo rispetto al Core i5-2500. L'unico scenario in cui questi processori sono paragonabili in termini di velocità è il rendering 3D. In media, l'offerta di Intel supera il nuovo prodotto di AMD di un impressionante 25%. Purtroppo.

Prestazioni di gioco

Come sapete, le prestazioni delle piattaforme dotate di processori ad alte prestazioni nella stragrande maggioranza dei giochi moderni sono determinate dalla potenza del sottosistema grafico. Ecco perché, quando testiamo i processori, cerchiamo di condurre test in modo tale da rimuovere il carico dalla scheda video, se possibile: vengono selezionati i giochi più dipendenti dal processore e i test vengono eseguiti senza abilitare l'anti-aliasing e con impostazioni lontane dalle risoluzioni più elevate. Cioè, i risultati ottenuti consentono di valutare non tanto il livello di fps ottenibile nei sistemi con schede video moderne, ma quanto bene si comportano in linea di massima i processori con un carico di gioco. Pertanto, sulla base dei risultati di cui sopra, è del tutto possibile speculare su come si comporteranno i processori in futuro, quando sul mercato appariranno versioni più veloci di acceleratori grafici.


















I giochi non appartengono alla categoria delle attività che generano un carico di lavoro multithread in parallelo. Pertanto, per le applicazioni di gioco odierne, i processori con quattro core sono più adatti, piuttosto che i mostri multi-core offerti da AMD. Vediamo una vivida illustrazione di questa affermazione nei diagrammi seguenti. Il nuovo FX-8150 a otto core non è più veloce del suo predecessore a sei core, il Phenom II X6.

Per quanto riguarda il rapporto tra le prestazioni di gioco tra Zambezi e Sandy Bridge, AMD è ancora molto più pessimista per il nuovo prodotto. L'attuale microarchitettura dei processori Intel gestisce molto meglio il carico tipico generato dai giochi 3D e non c'è speranza che AMD possa mai raggiungere i processori concorrenti in questa categoria di compiti. In altre parole, ha senso utilizzare Bulldozer nei sistemi di gioco solo quando si ha fiducia nella sufficienza delle prestazioni di un particolare processore per un particolare sottosistema video in un particolare set di giochi. Tuttavia, anche in questo caso, devi essere consapevole che con il prossimo aggiornamento dell'acceleratore video potresti rimanere in grave perdita rispetto a quegli utenti che inizialmente preferivano la piattaforma e i moderni processori Intel.

Oltre ai test di gioco, presenteremo anche i risultati del benchmark sintetico Futuremark 3DMark 11, lanciato con il profilo Extreme.



Lo scopo dell'aggiunta di questi risultati era quello di mostrare la situazione ideale per l'FX-8150, quando il sottosistema video non consente di rivelare la piena potenza di elaborazione. Qui il carico principale ricade sulla scheda video e il processore svolge solo un ruolo ausiliario in background. In questi casi, possiamo parlare dell'uguaglianza della velocità dei processori Bulldozer e Sandy Bridge, anche se, ovviamente, questo non è del tutto vero.



Tuttavia, l'FX-8150 sembra buono anche (sullo sfondo dei risultati precedenti) nel test fisico 3DMark 11. Nel calcolo multi-thread del modello fisico di gioco, il nuovo processore AMD a otto core funziona a una velocità paragonabile a quella del il Core i5-2500 a quattro core.

Test in-app

Nel complesso, la media ponderata e le prestazioni di gioco di Bulldozer sul desktop sono state ben al di sotto delle nostre aspettative. Tuttavia, non disperiamo e cerchiamo di scovare quei casi in cui la nuova microarchitettura AMD riesce a mostrare i suoi punti di forza.

Per misurare la velocità dei processori durante la compressione delle informazioni, utilizziamo l'archiviatore WinRAR, con il quale archiviamo una cartella con vari file con una dimensione totale di 1,4 GB con il rapporto di compressione massimo.



Il risultato dell'FX-8150 è vicino al Core i5-2500. WinRAR non è una delle applicazioni in grado di parallelizzare i suoi calcoli su tutti e otto i core Bulldozer, ma la cache gigante sembra salvare la situazione.

Un secondo test simile della velocità di archiviazione viene eseguito in un programma a 7 zip utilizzando l'algoritmo di compressione LZMA2.



In 7-zip, le prestazioni dell'FX-8150 sono encomiabili. Questo processore a otto core riesce ad avvicinarsi alla velocità del Core i7-2600 a quattro core, che include il supporto per Hyper-Threading e che, come Bulldozer, può eseguire otto thread contemporaneamente.

Le prestazioni di crittografia sono misurate da un benchmark integrato della popolare utility crittografica TrueCrypt. Va notato che non solo è in grado di caricare in modo efficiente un numero qualsiasi di core con lavoro, ma supporta anche un set specializzato di istruzioni AES.



Algoritmi interi semplici e ben parallelizzabili sono ciò di cui hai bisogno per la microarchitettura Bulldozer. In questi casi, come si vede, si possono ottenere prestazioni davvero eccezionali. In particolare, nella crittografia, l'FX-8150 è in ritardo solo rispetto al Core i7-990X a sei core ed è davanti a tutti i processori per la piattaforma LGA1155.

Quando si testa la velocità di transcodifica audio, viene utilizzata l'utilità Apple iTunes, con l'aiuto della quale i contenuti di un disco CD vengono convertiti in formato AAC. Si noti che una caratteristica di questo programma è la possibilità di utilizzare solo un paio di core del processore.



I programmi che generano un piccolo numero di thread computazionali è meglio tenerli lontani da Bulldozer. I singoli core di questa CPU sono troppo deboli per mostrare risultati decenti in questi casi.

Misuriamo le prestazioni in Adobe Photoshop utilizzando il nostro benchmark, che è una rielaborazione creativa Ritocca Artisti Photoshop Speed ​​Test compresa l'elaborazione tipica di quattro immagini da 10 megapixel scattate con una fotocamera digitale.



In Photoshop, le prestazioni dell'FX-8150 non sono disastrose come quelle dei processori con la microarchitettura K10, ma sono comunque inferiori al Core i5-2500. Ovviamente, un buon aiuto per la microarchitettura Bulldozer in questo caso è una memoria cache spaziosa, ma questo da solo non ti porterà lontano. L'efficienza e le prestazioni specifiche dei core di elaborazione sono ancora di fondamentale importanza.

Abbiamo anche condotto dei test in Adobe Photoshop Lightroom 3. Lo scenario di test include la post-elaborazione e l'esportazione in formato JPEG di cento immagini da 12 megapixel in formato RAW.



Lightroom è in grado di parallelizzare l'elaborazione delle foto su qualsiasi numero di core, e quindi l'FX-8150 a otto core mostra un buon risultato qui. Tuttavia, "non male" è un termine relativo in questo caso, infatti, le sue prestazioni sono paragonabili a quelle del solo Core i5-2500. Ciò significa che due core Bulldozer equivalgono a un core Sandy Bridge senza supporto Hyper-Threading.

Le prestazioni in Adobe Premiere Pro vengono testate misurando il tempo di rendering in H.264 di un progetto Blu-Ray contenente filmati HDV 1080p25 con vari effetti di sovrapposizione.



Anche i processori AMD della generazione precedente hanno gestito bene la transcodifica video. La microarchitettura Bulldozer ha consentito alcuni miglioramenti delle prestazioni in applicazioni di questa natura e, di conseguenza, l'FX-8150 è persino più veloce del Core i5-2500.

La velocità dell'editing video utilizzando Adobe After Effects è stata stimata misurando il tempo di esecuzione di un set predefinito di filtri ed effetti, tra cui sfocatura, creazione di rigonfiamenti, fusione di fotogrammi, creazione di bagliori, aggiunta di sfocatura durante lo spostamento, ombreggiatura, manipolazioni 2D e 3D, inversione , eccetera.



Nonostante il carico sia altamente parallelizzabile, l'FX-8150 è in ritardo rispetto ai concorrenti di Intel in After Effects.

Per misurare la velocità di transcodifica video in formato H.264, viene utilizzato il test x264 HD, che si basa sulla misurazione del tempo di elaborazione del video originale in formato MPEG-2, registrato con una risoluzione di 720p con un flusso di 4 Mbps. Va notato che i risultati di questo test sono di grande importanza pratica, poiché il codec x264 utilizzato in esso è alla base di numerose utility di transcodifica popolari, ad esempio HandBrake, MeGUI, VirtualDub, ecc.






Durante la transcodifica video con il codec x264, i processori AMD hanno sempre mostrato buone prestazioni. Con il rilascio della microarchitettura a otto core, i loro risultati sono ulteriormente aumentati e ora l'FX-8150 supera persino il Core i7-2600 nel secondo passaggio di codifica più dispendioso in termini di risorse. Quindi, con notevole difficoltà, abbiamo finalmente trovato una seconda, oltre a TrueCrypt, applicazione in cui le prestazioni del processore con la microarchitettura Bulldozer meritano recensioni lusinghiere.

Misuriamo le prestazioni di calcolo e la velocità di rendering in Autodesk 3ds max 2011 utilizzando il benchmark specializzato SPECapc. A partire da questo test, iniziamo a utilizzare la nuova versione professionale di SPECapc per 3ds Max 2011.






Il rendering è anche una delle attività che possono essere ottimizzate per le microarchitetture multicore. Nonostante ciò, l'FX-8150 è ancora più lento del Core i5-2500 e del Core i7-2600, per non parlare del Core i7-990X. D'altra parte, non c'è una situazione vergognosa quando un nuovo processore AMD perde rispetto al suo predecessore.

Facendo la media dei risultati ottenuti nelle singole applicazioni, possiamo dire che sulla nostra suite di applicazioni l'FX-8150 è circa il 14% più veloce del Phenom II X6 1100T. E questo gli ha permesso in poco meno della metà dei casi di funzionare non peggio del Core i5-2500. Tuttavia, il divario con il prossimo modello Sandy Bridge, Core i7-2600, rimane significativo e supera il 10%.

Consumo energetico

Nonostante il fatto che siamo riusciti a trovare una serie di compiti in cui le prestazioni di Bulldozer possono essere definite accettabili, i processori sulla nuova microarchitettura non sembrano affatto rivoluzionari. L'unica speranza rimane per il consumo energetico, perché i precedenti processori AMD erano inferiori in questo parametro ai loro concorrenti in modo più che significativo. Ora, se dobbiamo credere alle promesse degli sviluppatori, la microarchitettura è diventata più focalizzata sull'efficienza energetica e il nuovo processo tecnologico a 32 nm avrebbe dovuto contribuire a migliorare le prestazioni elettriche. Quindi diamo un'occhiata all'FX-8150 attraverso un obiettivo prestazioni per watt.

Se non diversamente specificato, i grafici seguenti mostrano il consumo totale del sistema (escluso monitor) misurato "dopo" l'alimentazione, che è la somma dei consumi energetici di tutti i componenti coinvolti nel sistema. L'efficienza dell'alimentatore stesso non viene presa in considerazione in questo caso. Durante le misurazioni, il carico sui processori è stato creato dalla versione a 64 bit dell'utility LinX 0.6.4. Inoltre, per stimare correttamente i consumi in idle, abbiamo attivato tutte le tecnologie di risparmio energetico disponibili: C1E, C6, AMD Cool "n" Quiet e Enhanced Intel SpeedStep.



In stato di inattività, il consumo di sistemi con processori basati sulla microarchitettura Bulldozer è diventato inferiore a quello di sistemi simili con CPU della famiglia Phenom II. Tuttavia, i moderni sistemi Intel LGA1155 consumano molto meno in modalità inattiva.



Nel caso in cui il carico computazionale sia di natura single-thread, il consumo dei sistemi Socket AM3+ aumenta nettamente, ovviamente, per via dell'elevata aggressività della tecnologia Turbo Core. Con i sistemi basati su processori Intel, questo non è il caso e vantano ancora una volta un'efficienza energetica significativamente maggiore.



A pieno carico multi-thread, la situazione non è molto diversa. È solo il sistema con il processore LGA1366 Core i7-990X "è andato in testa". Altrimenti è tutto uguale. In termini di consumo energetico, l'FX-8150 non può vantare alcun successo particolare. Ha iniziato a consumare un po' meno del Phenom II X6 1100T, ma i processori Sandy Bridge sono almeno una volta e mezzo più economici.

Tutta l'efficienza energetica guadagnata dall'introduzione di una nuova microarchitettura AMD utilizzata per aumentare le frequenze di clock. Di conseguenza, non vediamo né un nuovo livello di efficienza, né prestazioni sostanzialmente migliorate. Di conseguenza, in termini di prestazioni per watt, Bulldozer, come i suoi predecessori, è seriamente inferiore alle microarchitetture concorrenti di Intel.

Per riferimento, ecco il consumo a pieno carico, misurato separatamente nei circuiti di alimentazione del processore e della scheda madre.






Il consumo "netto" dell'otto core FX-8150 è circa il doppio di quello dei processori Sandy Bridge. Considerando che entrambi i processori sono realizzati secondo il processo tecnologico con gli stessi standard e inoltre hanno una tensione di core simile, diventa follemente interessante ciò che AMD aveva in mente quando parlava dell'efficienza energetica della sua microarchitettura Bulldozer.

Overclock

La piattaforma Socket AM3+ e i processori della serie FX sono inizialmente posizionati come overclocker. Ciò è dimostrato sia dallo sblocco completo di tutti i moltiplicatori che dagli esperimenti condotti sotto l'egida di AMD, in cui è stato stabilito un record mondiale di overclock utilizzando uno dei processori FX-8150. Anche gli annunci della società secondo cui la nuova microarchitettura è ottimizzata per velocità di clock elevate sono promettenti. Riusciremo ad ottenere un nuovo miracolo di overclock dalle mani di AMD? Controlliamo.

È molto facile overcloccare qualsiasi processore FX, non per niente "Unlocked" è scritto direttamente sul loro logo. La frequenza del processore può essere modificata da un moltiplicatore tramite BIOS Setup o tramite utility specializzate fornite sia dalla stessa AMD (Overdrive Utility) che dai produttori di schede madri. Allo stesso modo, nei sistemi Socket AM3 +, è possibile overcloccare il North Bridge e la memoria incorporati nel processore.

Durante i nostri test, siamo riusciti a far funzionare il nostro FX-8150 senza problemi a 4,6 GHz. Per garantire la stabilità in questo stato, la tensione del processore doveva essere aumentata a 1,475 V e, inoltre, doveva essere abilitata la funzione di calibrazione della linea di carico. Durante i test di stabilità, la temperatura del processore che opera a questa frequenza non ha superato gli 85 gradi secondo il sensore della presa secondaria o 75 gradi secondo il sensore integrato nel processore. Per rimuovere il calore, abbiamo utilizzato l'efficiente raffreddatore ad aria NZXT Havik 140.



Attenzione, in parallelo abbiamo provato a overcloccare il north bridge integrato nella CPU, perché un aumento della sua frequenza ha un effetto positivo sulla velocità della cache L3 e del controller di memoria. Tuttavia, sfortunatamente, l'overclocking significativo di questa unità di processore si è imbattuto in un ostacolo invisibile e la frequenza superiore a 2,4 GHz non si è sottoposta ad esso, anche se abbiamo cercato di aumentare la sua tensione di alimentazione in parallelo.

In ogni caso, l'overclocking dell'FX-8150 a 4,6 GHz non è un cattivo risultato, soprattutto considerando che i processori AMD della famiglia Phenom II raramente si overcloccano in aria oltre i 4,0 GHz. In altre parole, la microarchitettura Bulldozer ha davvero permesso di spingere leggermente verso l'alto il limite di frequenza.

Tuttavia, l'overclocking dei processori FX dovrebbe essere confrontato, prima di tutto, non con il vecchio Phenom II, ma con i processori Core i5 e Core i7 concorrenti per i sistemi LGA1155. Ma chiaramente non sono peggio overcloccati. Ad esempio, un overclock abbastanza tipico per un Core i5-2500K con un aumento di tensione di 0,15 V sopra il valore nominale e utilizzando un dispositivo di raffreddamento ad aria è di 4,7 GHz. In questo contesto, il risultato dell'FX-8150 non sembra più così brillante.

L'impressione di overclocking Zambezi peggiora ancora di più se confrontiamo le prestazioni dell'FX-8150 overcloccato e del Core i5-2500K overcloccato (tra parentesi, è indicato l'aumento delle prestazioni rispetto alla modalità nominale):



In generale, l'overclocking non modifica l'equilibrio qualitativo dei risultati. Ma dove l'FX-8150 era più veloce in modalità nominale, il divario si è ridotto. E dove il Core i5-2500 era in testa, ha consolidato il suo vantaggio. Non è sorprendente: la frequenza dell'FX-8150 è aumentata del 28% durante l'overclock, mentre l'aumento della frequenza del Core i5-2500K è del 42%. E in generale, come si può giudicare dall'entità del guadagno di prestazioni dall'overclocking, la microarchitettura Sandy Bridge reagisce in modo più sensibile a un aumento della frequenza. In altre parole, anche se teniamo presente l'overclocking, i processori con la microarchitettura Bulldozer, anche se overcloccano abbastanza bene, non sembrano più potenti dei concorrenti di Intel.

conclusioni

Fortuna o fallimento? Sicuramente molti di voi vogliono vedere un verdetto chiaro alla fine dell'articolo. Tuttavia, in questo caso, tutto è molto ambiguo e AMD ha messo i revisori in una posizione molto difficile con il suo Bulldozer.

Il fatto è che AMD ha dimostrato un approccio completamente non standard allo sviluppo della microarchitettura. Considerando che le prestazioni del processore sono costituite da tre componenti: il numero di istruzioni eseguite nel core del processore per ciclo di clock, la frequenza e il numero di core, gli sviluppatori hanno spostato le loro priorità sul numero di core. Allo stesso tempo, le prestazioni specifiche dei singoli core sono state ridotte, ma il design risultante ha aperto la strada alla creazione di processori a otto core economici o anche più complessi. Questa è una mossa molto forte per il mercato dei server, dove i carichi di lavoro multi-thread regnano sovrani e i processori con un gran numero di core sono molto richiesti. Quindi, è molto probabile che la nuova microarchitettura Bulldozer consentirà ad AMD di migliorare significativamente la propria posizione nel mercato dei server ad alte prestazioni.

Tuttavia, oggi ci viene presentato un processore FX costruito su questa microarchitettura, ma rivolto ai computer desktop. Ed è stato qui che la discrepanza tra le capacità hardware di Bulldozer e i tipici carichi desktop si è manifestata appieno. È particolarmente deludente che la campagna di marketing sia stata strutturata in modo tale che molti credessero in Bulldozer come una stella nascente nel mercato dei desktop. Tuttavia, queste speranze non erano destinate a avverarsi.


I processori FX, basati sulla microarchitettura Bulldozer, sono stati in grado di dimostrare i loro punti di forza solo in un piccolo sottoinsieme di compiti risolti da utenti ordinari. Tra le tipiche applicazioni comuni, non ci sono così tanti esempi che generano un semplice carico multi-threaded intero, e le elevate prestazioni di Bulldozer si rivelano solo in questo caso. Di conseguenza, in alcuni casi Bulldozer non era solo più lento delle soluzioni concorrenti di Intel, ma anche peggio del processore Phenom II X6, costruito sulla microarchitettura della generazione precedente. E questo significa che AMD non aveva un processore desktop rivoluzionario.

In effetti, FX è solo il prossimo Phenom, che sembra essere abbastanza buono da solo, specialmente se confrontato con i suoi predecessori. In generale, i processori FX sono più veloci del Phenom II, overclock significativamente migliore e hanno un consumo energetico leggermente inferiore, quindi possono essere considerati un buon sostituto per i portatori dell'obsoleta microarchitettura K10.

Ricordiamo però che AMD è in guerra non solo con se stessa, ma anche con Intel. Pertanto, siamo ancora costretti a esprimere la deludente conclusione che ha davvero senso utilizzare i processori FX solo in quei desktop che si concentrano sull'elaborazione video e sulla transcodifica. In altri casi, sullo sfondo dei processori Sandy Bridge, le loro prestazioni raramente sembrano promettenti. Lo stesso si può dire del consumo energetico e dell'overclocking. Separatamente, va aggiunto che i processori AMD FX, come previsto, si sono rivelati una cattiva opzione per i sistemi di gioco, poiché i moderni giochi 3D praticamente non utilizzano algoritmi veramente multi-thread. Tuttavia, gli aderenti ai prodotti AMD, di sicuro, saranno in grado di sopportarlo, dato che il numero di fotogrammi al secondo nei giochi spesso si basa sulla grafica e non sul processore.

In altre parole, le prospettive di mercato per i processori FX dipenderanno da due fattori: quanto è grande l'esercito di adepti AMD; e con quanta abilità il produttore gestirà la leva del prezzo. Tuttavia, l'ampia popolarità dei processori desktop con la microarchitettura Bulldozer chiaramente non brilla.

Il recente annuncio degli ultimi processori AMD è stato uno dei momenti salienti dell'anno. Un'intensa attesa, alimentata da numerosi leak e diapositive segrete, non ha lasciato in pace non solo i tifosi del campo biancoverde, ma anche gli aderenti ai prodotti dell'azienda rivale. I dati sulle prestazioni andavano dal vantaggio competitivo schiacciante al fallimento completo. Nessuno discuterà con l'affermazione che la microarchitettura Stars, che è alla base di tutte le attuali soluzioni desktop AMD, è obsoleta oggi. Le capacità degli eredi dei leggendari processori K8, AMD Phenom II e Athlon II, non soddisfano più le realtà moderne. Ecco perché il lancio sul mercato di processori basati sull'innovativa architettura Bulldozer era imperativo. Ciò consentirebbe di eguagliare o addirittura superare le soluzioni della concorrenza in termini di prestazioni ed efficienza energetica. Il vantaggio in termini di velocità dovrebbe essere fornito da un'architettura a otto core fondamentalmente nuova e l'introduzione di un processo tecnologico sottile a 32 nm insieme a capacità "avanzate" per il controllo di tensioni e frequenze dei singoli blocchi funzionali promettono una significativa riduzione del consumo energetico rispetto alle soluzioni di la generazione precedente.

Infine, il 12 ottobre, il velo di segretezza è stato strappato: è stato allora che ha avuto luogo il tanto atteso annuncio dei processori AMD FX, basati sulla microarchitettura Bulldozer. Il produttore di chip ha presentato un'intera linea di CPU, portatori di questa microarchitettura, che include modelli a quattro, sei e otto core. Tra le altre cose, AMD ha rianimato il marchio "FX", che un tempo era il nome dato ai prodotti degli appassionati. In effetti, tutti i processori AMD FX di ultima generazione hanno un moltiplicatore sbloccato, che, in teoria, dovrebbe renderli interessanti per gli appassionati di overclock. Variando in modo flessibile il numero di blocchi funzionali e le frequenze operative, AMD è riuscita a riempire quasi tutte le principali nicchie di mercato, dai sistemi di gioco a basso costo alle offerte per configurazioni nella fascia di prezzo superiore. La gamma completa degli ultimi processori AMD rispetto ai Phenom II a quattro e sei core si presenta così:

FX 8150 FX 8120 FX 6100 FX 4100 Fenomeno II X6 Fenomeno II X4
Nucleo Zambesi Zambesi Zambesi Zambesi Thuban Deneb
Connettore Presa AM3 / AM3 + Presa AM3 / AM3 + Presa AM3 / AM3 + Presa AM3 / AM3 + Presa AM2 + / AM3 Presa AM2 + / AM3
Processo tecnico della CPU, nm 32 32 32 32 45 45
Numero di transistor, mln. 2000 2000 2000 2000 904 758
Zona Cristallo, mq. mm 315 315 315 315 346 243
Numero di core 8 8 6 4 6 4
Frequenza nominale, MHz 3600 3100 3600 3100 2600 — 3300 3200 — 3700
Frequenza Turbo Core, MHz 3900/4200* 3400/4000* 3300/3900* 3600/3800* 3100 — 3700
NB frequenza, MHz 2200 2200 2200 2200 2000 2000/1800
Dimensione cache L1, KB 16x8 + 64x4 16x8 + 64x4 16x6 + 64x3
16x4 + 64x2 128 x 6 128 x 4
Dimensione cache L2, KB 2048 x 4
2048 x 4
2048 x 4
2048 x 4
512 x 6
512 x 4
Dimensione cache L3, MB 8 8 8 8 6 6
Fattore 18 15,5 16,5 18 13 — 16,5 16 — 18,5
Canali di memoria 2 2 2 2 2 2
Tipo di memoria supportato DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR2 800/1066, DDR3 1333/1600
Bus di comunicazione chipset Iper trasporto 3.1 Iper trasporto 3.1 Iper trasporto 3.1 Iper trasporto 3.1 Hyper Transport 3.0 Hyper Transport 3.0
Frequenza di trasporto iper, MHz 5200 5200 5200 5200 4000 4000
Tensione di lavoro, V 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4
TDP, W 125 125 95 95 125 125
Costo consigliato, $ 245 205 165 115 165 — 205 117 — 185

Se chiudiamo gli occhi sul numero di core di elaborazione, rispetto ai loro predecessori, i processori FX hanno ricevuto un bus Hyper Transport 3.1 più veloce, supporto per la memoria DDR3 1866 MHz ad alta velocità e sono aumentati a 8 MByte di livello 3 di cache. Inoltre, vorremmo attirare la vostra attenzione sulle frequenze di clock piuttosto elevate, che si sono avvicinate molto e in alcuni casi hanno persino superato la linea dei 4000 MHz. Basato sul prezzo consigliato, il quad-core FX 4100 dovrebbe competere con il dual-core Sandy Bridge e i Phenom II X4 di fascia bassa; rivali dell'FX 6100 a sei core saranno i modelli Core i5 più giovani e il Phenom II X6 a sei core. I modelli a otto core FX 8120 e FX 8150 giocano nella "grande lega", dove i senior Core i5 e Core i7 dominano la palla, che finora hanno mostrato livelli di prestazioni eccellenti. Come puoi vedere, il posizionamento dei nuovi processori AMD FX li obbliga a mantenersi al livello di rivali molto seri, quindi sarà difficile per i principianti!

Microarchitettura bulldozer: struttura e caratteristiche di funzionamento

Prima di tutto, va notato che AMD FX sono processori centrali di razza pura e non includono un core grafico. Naturalmente, a questo proposito, AMD può essere accusata di incoerenza, perché la promozione dell'APU (Accelerated Processing Unit) sul mercato è una delle principali iniziative strategiche dell'azienda. In cambio dell'adattatore video integrato, gli utenti ottengono la piena compatibilità AMD FX con la piattaforma produttiva Socket AM3 / AM3 +, per la quale viene offerta una varietà di eccellenti schede madri e sono supportate tutte le ultime opzioni di espansione. AMD ha rilasciato la nona serie aggiornata di chipset appositamente per i processori FX.


Ricordiamo le caratteristiche principali del chipset AMD 990FX di punta. Quindi, permette di costruire configurazioni grafiche AMD CrossFireX e NVIDIA SLI, grazie al South Bridge SB950 supporta lo standard SATA 6 Gb/s, ma manca la possibilità di collegare dispositivi USB 3.0. Per quanto riguarda le schede madri Socket AM3 basate su generazioni precedenti di set logici di sistema, dopo un aggiornamento del firmware dovranno supportare anche Bulldozer. Ma questo dipende già dal modello specifico.

Una delle caratteristiche chiave dei processori basati sulla microarchitettura Bulldozer è il passaggio al processo litografico a 32 nm, che è stato utilizzato con successo dal suo principale concorrente - Intel per quasi due anni. Oltre a ridurre potenzialmente il consumo energetico e migliorare il potenziale di overclocking, questo fatto ha un effetto positivo sul costo di produzione dei cristalli semiconduttori. AMD non è più una nuova arrivata nello sviluppo della tecnologia di processo a 32 nm: è con questo livello di dettaglio che vengono prodotte APU Llano di grande successo, che, sebbene non abbiano ottenuto il riconoscimento tra gli appassionati, sono eccellenti per costruire PC universali economici e compatti . Grazie all'utilizzo delle moderne tecnologie di produzione, il chip (nonostante contenga quasi 2000 milioni di transistor) è risultato molto compatto. L'AMD FX 8150 a otto core ha un'area centrale di soli 315 mm², che è inferiore all'ammiraglia della generazione precedente - il Phenom II X6, il cui die è di ben 346 mm². Tuttavia, i processori AMD FX sono ancora lontani dalle prestazioni dei processori quad-core Sandy Bridge, poiché il chip del primo, nonostante la presenza di un acceleratore grafico integrato, occupa solo 216 mm².

Le principali innovazioni apportate alla microarchitettura Bulldozer hanno riguardato l'algoritmo per l'esecuzione di calcoli multithread. Per molto tempo, i processori centrali sono stati in grado di eseguire un singolo thread di calcolo alla volta. Il cosiddetto funzionamento simultaneo di più programmi è stato eseguito utilizzando un gestore di interrupt, ovvero le attività computazionali di diverse applicazioni a loro volta hanno ricevuto un accesso a breve termine alle risorse del processore. È grazie a questo che il lavoro dei sistemi operativi multitasking è diventato possibile. Inutile dire che la velocità operativa in questa modalità non era elevata. Allo stesso tempo, gli sviluppatori di CPU hanno iniziato a notare che nel carico, diversi blocchi funzionali del processore possono essere inattivi mentre altri sono impegnati nell'elaborazione del thread di calcolo. Questo è ciò che li ha spinti a condividere le stesse risorse del processore per elaborare più thread di calcolo. Intel ha introdotto questa funzionalità, chiamata Hyper-Threading, nei suoi processori nel 2002. Questo principio fornisce un certo vantaggio in un certo tipo di problema. Allo stesso tempo, l'approccio di AMD all'implementazione del multithreading è rimasto invariato per molto tempo: ogni thread deve essere eseguito su un core separato. Ora, dopo aver ottimizzato le prestazioni dei singoli nodi del processore e aver analizzato a fondo il carico, gli sviluppatori AMD hanno deciso che la velocità di alcuni nodi è abbastanza per servire due thread di elaborazione indipendenti contemporaneamente. Questo approccio ci ha permesso di ridurre notevolmente il numero di transistor, ma di mantenere un'elevata produttività. Ora, alla luce dei crescenti requisiti di prestazioni pur mantenendo parametri di consumo energetico accettabili, gli sviluppatori sono costretti a cercare modi per aumentare il numero di istruzioni eseguite per ciclo di clock.

Quindi, al centro di tutti i processori centrali AMD FX c'è un cristallo semiconduttore composto da quattro moduli di calcolo, ognuno dei quali è dotato di un proprio array di cache L2, una cache L3 condivisa da 8 MB, un controller di memoria DDR3 a doppio canale, controller del bus HyperTransport e Northbridge integrato.


È ovvio che i modelli junior sono ottenuti da chip a tutti gli effetti disabilitando i singoli blocchi funzionali. Guardando la struttura del cristallo Zambesi, si dà involontariamente l'impressione di avere a che fare con un normale processore quad-core. In realtà, questo non è il caso e, soprattutto, questo fatto dimostra la struttura del modulo computazionale, un'unità strutturale dei processori AMD FX.

L'unità di calcolo include due unità di calcolo intero (ALU), ciascuna in grado di eseguire fino a quattro istruzioni per ciclo di clock, ciascuna con la propria cache L1 per l'archiviazione dei dati. Tutti gli altri blocchi, come il predittore di ramo, il decodificatore di istruzioni, la memoria buffer per la memorizzazione delle istruzioni e un array di cache L2 da 2 MB, sono rappresentati in una singola istanza. Ovviamente, gli sviluppatori hanno ritenuto che le prestazioni di queste unità siano sufficienti per servire due ALU.


Inoltre, ciascuno dei moduli di calcolo ha un'unità in virgola mobile (FPU), anch'essa sottoposta a significativi miglioramenti. Pertanto, i set SSE4.1 e SSE4.2 sono stati aggiunti alle estensioni SIMD standard, nonché istruzioni XOP, AES e AVX specifiche, che possono aumentare significativamente le prestazioni se supportate dal software. Sembra interessante la possibilità di eseguire istruzioni AVX a 256 bit; per questo, vengono utilizzate le risorse di due blocchi contemporaneamente, ognuno dei quali è in grado di elaborare istruzioni FMAC a 128 bit. Tuttavia, l'FPU è in grado di eseguire due brevi istruzioni AVX contemporaneamente.

Come puoi vedere, la microarchitettura Bulldozer ha capacità di calcolo molto avanzate, soprattutto se confrontata con le precedenti generazioni di processori AMD. Tuttavia, questo vantaggio tecnologico viene a scapito di un'attenta ottimizzazione del codice. In caso contrario, specialmente nelle applicazioni meno recenti, il livello di prestazioni potrebbe essere lontano dal previsto.

Qualche parola dovrebbe essere detta sull'organizzazione della memoria interna di AMD FX, che è diventata campione non solo nel numero di core, ma anche nella dimensione totale della cache. Come abbiamo già detto, ciascuna delle unità di calcolo degli interi ha un buffer per la memorizzazione dei dati di 16 KB, mentre entrambi i buffer possono essere utilizzati per far funzionare la FPU. Ogni modulo di calcolo ha una cache L1 da 64 KB separata per memorizzare le istruzioni, mentre i dati intermedi vengono archiviati in un'impressionante cache L2 da 2 MB. L'array di cache di 3° livello, comune a tutte e quattro le unità computazionali, ha un volume di 8 MB e ha un'associatività di 64 righe per ogni modulo. Grazie all'utilizzo dell'organizzazione esclusiva delle cache di 2° e 3° livello, possiamo parlare del loro volume totale di 16 MB. Non sorprende che il cristallo Bulldozer si sia rivelato così complesso, la parte del leone del budget del transistor è dedicata all'organizzazione della memoria interna del processore. Si noti che la frequenza operativa della memoria cache L3 può essere 2000 MHz o 2200 MHz a seconda del modello di processore.

Come puoi vedere dalla breve descrizione del design del kernel, la microarchitettura Bulldozer, nonostante tutte le sue innovazioni, non è esente da alcuni inconvenienti. Tuttavia, per ogni modulo di calcolo c'è solo un predittore di ramo, un'unità di recupero delle istruzioni e un decodificatore di istruzioni, che, tra l'altro, è in grado di elaborare non più di quattro istruzioni per ciclo di clock. Vediamo come si comporterà AMD FX nelle applicazioni reali, ma l'intuizione suggerisce che nelle applicazioni che utilizzano attivamente FPU, ma non dispongono di ottimizzazione software per nuovi set di istruzioni SIMD, gli ultimi processori dimostreranno il livello di prestazioni tipico dei modelli quad-core.

Oltre all'architettura, anche i meccanismi di gestione dell'energia hanno subito dei cambiamenti. Nonostante il maggior numero di transistor e le elevate velocità di clock, anche i vecchi AMD FX a otto core hanno un pacchetto termico non superiore a 125 W. Naturalmente, il processo tecnologico a 32 nm ha svolto un certo ruolo in questo, grazie al quale la tensione di alimentazione nominale non supera 1,4 V, ma il merito principale appartiene ancora ai meccanismi avanzati per la regolazione delle frequenze di clock e delle tensioni di alimentazione. La prima generazione di questo concetto è stata implementata nel Phenom II X6, dove nel caso di un carico computazionale di non più di tre thread, le frequenze di tre core attivi potrebbero essere aumentate di 400 MHz. I processori AMD FX offrono un approccio molto più flessibile ai parametri chiave delle prestazioni. Quindi, grazie all'uso di transistor di gate di alimentazione, il gestore del risparmio energetico del processore è in grado di disattivare interi blocchi funzionali. In assenza di carico, il modulo di calcolo, insieme all'array di cache L2, può essere completamente spento, liberando parte del budget TDP. Allo stesso tempo, la frequenza di clock e la tensione dei moduli computazionali attivi possono aumentare e l'aumento della frequenza in modalità Max Turbo raggiunge un solido 900 MHz. D'accordo, non abbiamo mai visto un algoritmo di overclock automatico così aggressivo. Inoltre, con un carico uniforme di tutti i moduli computazionali, esiste la possibilità di aumentare la frequenza di clock dell'ordine di 300 MHz. In realtà, questa è la modalità operativa Turbo Core e sarà attiva finché il consumo energetico del processore non va oltre il pacchetto termico. In altre parole, il concetto stesso di "velocità di clock nominale" per AMD FX perde il suo significato originale.


E tutto sarebbe molto bello se non fosse così triste. Ma il fatto è che lo scheduler dei processi dei sistemi operativi Windows non è ancora sufficientemente ottimizzato per i processori AMD FX. È possibile che due thread della stessa applicazione vengano eseguiti su unità computazionali intere di moduli diversi, il che impedirà al processore di passare alla modalità Max Turbo e richiederà il ricaricamento di dati e istruzioni nella memoria cache. Idealmente, lo scheduler del sistema operativo dovrebbe tenere conto delle caratteristiche architetturali di Bulldozer, nel qual caso la combinazione di Turbo Core e Max Turbo dovrebbe dare il massimo effetto positivo.


È già noto che l'utilità di pianificazione del futuro Microsoft Windows 8 sarà ottimizzato per l'esecuzione su processori Bulldozer. Per quanto riguarda oggi, forse verrà rilasciato un aggiornamento per i sistemi operativi attuali, oppure i programmatori AMD svilupperanno finalmente un "driver miracoloso"...

I processori AMD con un'architettura Bulldozer fondamentalmente nuova sono francamente stanchi di aspettare non solo i fan dei prodotti dell'azienda, ma anche molti utenti che seguono i progressi IT. Negli ultimi anni, offrendo soluzioni interessanti in termini di rapporto prezzo/prestazioni, AMD si è concentrata principalmente su dispositivi entry-level e di fascia media. Rilanciando la linea FX, è chiaro che l'azienda si aspetta di attirare l'attenzione degli appassionati più esigenti, pronti a sperimentare e che richiedono la massima velocità. Studieremo le capacità della nuova famiglia usando l'esempio del primo processore a otto core per desktop al mondo: AMD FX-8150. Vediamo se il produttore riesce a soddisfare le aspettative dei suoi fan.

A differenza del principale concorrente, che può permettersi di seguire il principio del pendolo dello sviluppo della CPU, cambiando ogni anno architetture e processi tecnologici, AMD non fissa un lasso di tempo specifico per i suoi progetti, facendo affidamento sul senso del mercato e sul proprio potenziale tecnologico. La storia con l'architettura Bulldozer è iniziata molto tempo fa. Doveva essere presentato nel 2009, ma a causa di varie circostanze, l'implementazione pratica di soluzioni ingegneristiche audaci nel silicio è diventata possibile solo ora.

Bulldozer per AMD è serio e duraturo. Questa microarchitettura per i prossimi anni diventerà la base per i futuri processori di vari segmenti: server, desktop e mobile. Questo vale sia per le CPU discrete che per quelle ibride: anche le APU dovrebbero essere trasformate nel tempo per Bulldozer. Solo per i sistemi compatti, AMD utilizzerà i chip sull'economico Bobcat e sulle sue versioni aggiornate. Con l'annuncio di Bulldozer, l'azienda ha deciso di far rivivere la serie leggendaria introducendo i processori AMD FX, che hanno ricevuto una nuova architettura e sono prodotti utilizzando la più avanzata tecnologia di processo a 32 nm.

Caratteristiche dell'architettura

I chip Bulldozer sono basati su moduli con due unità di calcolo x86. Allo stesso tempo, questi ultimi non sono completamente autonomi: alcune risorse sono comuni a entrambi i core. In particolare, l'unità di prelettura, il decodificatore delle istruzioni, l'FPU e la cache L2. Il modulo dual-core monolitico consente l'esecuzione simultanea di due thread, ma con alcuni avvertimenti. Secondo i calcoli del produttore, questo approccio è pienamente giustificato e consente di ottenere circa l'80% dell'efficienza dei nuclei fisici a tutti gli effetti. Tuttavia, ciò riduce significativamente il numero di transistor e, di conseguenza, l'area del cristallo e il suo consumo energetico.

Tenendo conto della nuova struttura, l'architettura interna è stata molto seriamente ridisegnata, che ha interessato di fatto tutti i blocchi esecutivi. Non ci sono praticamente somiglianze con il K10, che è stato utilizzato per i chip Phenom II e Athlon II. AMD ha implementato il supporto per le istruzioni AVX, SSE 4.2 e AES-NI e ha aggiunto i propri kit FMA4 e XOP.

Come i processori Phenom di fascia alta, i chip FX hanno un sistema di cache a tre livelli. Tuttavia, la sua organizzazione è anche notevolmente diversa da quella dei suoi predecessori. La cache dei dati L1 è diminuita da 64 KB a 16 KB, allo stesso tempo il suo throughput è aumentato in modo significativo. L2 di 2 MB è condivisa da entrambi i core di ciascun modulo. A seconda del numero di questi ultimi, la capacità totale della cache L2 nel processore AMD FX può variare da 4 a 8 MB. La sua latenza è leggermente aumentata - pagamento per l'ottimizzazione per il funzionamento a frequenze più elevate. I chip con architettura Bulldozer sono inoltre dotati di cache L3 da 8 MB. Considerando l'esclusivo schema di lavoro, la dimensione totale del buffer è piuttosto impressionante per i modelli desktop. L'algoritmo di prelettura migliorato fa sperare che la velocità del sottosistema di memoria venga aumentata. Per quanto riguarda la RAM stessa, CPU FX supporta i moduli DDR3-1866 in modalità dual channel.

AMD FX utilizza un processo SOI a 32 nm simile all'APU Llano. I chip sono prodotti negli stabilimenti della consociata GlobalFoundries. Il cuore della CPU è un cristallo a otto core con un'area di 315 mm2. Secondo la topologia, la maggior parte è allocata per la memoria cache, quindi non sorprende che il numero totale di transistor in questo caso sia di ben 2 miliardi.Per fare un confronto: il Phenom II X6 (Thuban) a sei core include "solo ” 904 milioni di transistor, ma a causa della tecnologia di processo a 45 nanometri, l'area del cristallo è di 346 mm2. Considerando la differenza di area, si può presumere che il costo principale dei chip FX sia inferiore a quello dei loro predecessori. Passare a 32 nm, tuttavia, non è facile per GlobalFoundries. AMD ha già segnalato difficoltà con il rilascio di spazi vuoti adatti, a causa delle quali l'azienda non può soddisfare completamente la domanda di Llano ibrido. Si spera che ciò non influisca in alcun modo sulla disponibilità di FX e che tutti possano acquistarli.

Per i modelli a quattro e sei core verrà utilizzato lo stesso cristallo, che consentirà di smaltire in modo più efficiente i chip che presentano determinati difetti. Nel frattempo, è probabile che anche per la produzione di queste CPU verranno utilizzati cristalli perfettamente funzionanti con moduli disattivati. E in questo caso, puoi contare sulla prossima lotteria con lo sblocco dei core disabilitati. Sarebbe un ottimo modo per suscitare interesse nei processori AMD FX.

Specifiche del processore
Modello FX-8150 Fenomeno II X6 1075T Fenomeno II X4 975 Core i7-2600K Core i5-2500K
Nome in codice Bulldozer Thuban Deneb ponte sabbioso ponte sabbioso
Numero di anime / fili, pz. 8/8 6/6 4/4 4/8 4/4
Frequenza di clock di base, GHz 3,6 3 3,6 3,4 3,3
Frequenza di clock dopo l'overclock automatico, GHz 3,9/4,2 3,5 3,8 3,7
Memoria cache L2/L3, MB 8/8 6 × 0,5 / 6 4 × 0,5 / 6 4 × 0,25 / 8 4 × 0,25 / 6
Tecnologia di produzione, nm 32 45 45 32 32
Presa CPU AM3 + AM3 AM3 LGA1155 LGA1155
Consumo energetico (TDP), W 125 125 125 95 95
Prezzo consigliato, $ 245 181(162*) 175 (160*) 317 (315*) 216 (225*)
* Secondo il catalogo Hotline.ua.

Turbo Core

La tecnologia Turbo Core Dynamic Frequency Boost è stata precedentemente utilizzata da AMD per le APU Thuban e Llano a sei core. I processori FX hanno un nuovo meccanismo e algoritmo per questa funzione. Nel caso in cui il consumo energetico del chip sia entro i limiti del suo TDP sotto carico e la temperatura non superi il valore specificato, la frequenza può aumentare automaticamente (100-300 MHz) anche in una situazione in cui tutti i core sono attivi (Tutti i Core Boost). Se almeno la metà dei moduli è inattiva, AMD FX può entrare in modalità Max Turbo Boost, aumentando la tensione di alimentazione e una frequenza di clock molto significativa delle unità di lavoro (fino a 900 MHz).

AMD è anche preoccupata per il miglioramento dell'efficienza dei nuovi chip. Data la crescita del numero di core di elaborazione, è impossibile fare affidamento solo sull'effetto dell'utilizzo di un processo tecnico più fine. Quando non c'è carico su entrambi i core del processore all'interno di un modulo e la loro transizione allo stato di risparmio energetico C6, i transistor di potenza consentono di scollegare l'alimentazione da questo nodo, riducendo il consumo complessivo della CPU.

Supporto logico

Come la precedente piattaforma desktop AMD, il controller del bus PCI Express 2.0 è rimasto prerogativa del north bridge del chipset, e non si è spostato sotto il coperchio del processore. È il numero di linee supportate di questa interfaccia e, di conseguenza, la capacità di creare configurazioni con diverse schede video che sono diventate le differenze che definiscono i nuovi set di logica per i chip Zambezi. L'AMD 990FX di fascia alta ha 42 collegamenti a sua disposizione che possono essere configurati per esigenze grafiche come 2x16x o 4x8x. AMD 990X ha 26 linee e consente solo a due schede video di essere amiche in modalità CrossFireX o SLI in una configurazione 2 × 8x. Bene, AMD 970 con lo stesso numero di collegamenti PCI-E offre di accontentarsi di un adattatore. In tutti i casi le periferiche sono servite dal South Bridge SB950, che non porta con sé novità interessanti: sei porte SATA 6 Gb/s con possibilità di creare RAID (0,1,5,10), fino a 14 USB 2.0 connettori, lavorare con PCI. Purtroppo, a differenza del chipset AMD A75 per la piattaforma FM1, non c'è supporto per il bus USB 3.0 ad alta velocità.

AM3 + piattaforma

Per lavorare con i processori della serie FX, è necessaria una scheda madre con un socket AM3+. Può essere sia un modello basato sul "nuovo" chipset AMD 9xx, sia un prodotto con la logica delle generazioni precedenti. La compatibilità AM3 è teoricamente possibile, ma non è garantita né da AMD né dal produttore della scheda madre. È possibile che questi ultimi rilascino firmware per le loro soluzioni di fascia alta, ma si tratta di casi piuttosto isolati. E anche in tali situazioni, i chip FX funzioneranno a una velocità ridotta di passaggio tra gli stati Turbo Boost e Cool'n'Quiet. In questo caso, tutti i possibili problemi con il funzionamento del sistema ricadranno sulle spalle degli utenti. Pertanto, in questo caso, non è necessario contare su un aggiornamento senza problemi.

Le schede con AM3+ si distinguono facilmente per il colore nero dello zoccolo del processore, mentre il connettore AM3 è bianco. Fortunatamente, il design degli elementi di montaggio CO non è cambiato, quindi qualsiasi dispositivo di raffreddamento compatibile con AM2 / AM2 + / AM3 funzionerà per il raffreddamento AMD FX.

La scaletta

Punteggio CPU 3DMark 11 (Fisica)
3DMark Vantage, punti
PC Mark 7, test di calcolo, punti
CineBench 11.5, punti
x264 HD Benchmark 4.0, fotogrammi/sec
7-Zip 9.20, MIPS
Far Cry 2, 1920 × 1080, DX10, alta qualità, fotogrammi/sec
Hard reset, 1920 × 1080, modalità alta, fotogrammi/sec
Metro 2033, 1920 × 1080, DX11, PhysX, alta qualità, fps
Colin McRae: DiRT 3, 1920 × 1080, alta qualità, fps
Lost Planet 2, 1920 × 1080, DX11, alta qualità, test B, fps
Crysis 2, 1920 × 1080, DX9, alta qualità, test Downtown, fps
Consumo energetico del sistema, W

A causa della struttura modulare dei processori dell'azienda, non è difficile costruire la sua gamma, offrendo dispositivi con un diverso numero di unità di calcolo e frequenze di clock. All'inizio, la linea di chip desktop, soprannominata Zambezi, include quattro CPU. Il fiore all'occhiello è l'FX-8150 a otto core con una formula di frequenza di 3,6 / 3,9 / 4,2 GHz. 8 MB di cache L2 e L3 e TDP a 125 W. L'apparecchiatura è simile all'FX-8120, l'unica differenza è nella modalità di funzionamento della frequenza: 3,1 / 3,4 / 4,0 GHz. L'FX-6100 a sei core ha 6 MB di cache L2 e gli stessi 8 MB L3, ma il suo pacchetto termico è di 95 W. La versione più economica con due moduli e quattro unità di calcolo x86, l'FX-4100 opera a 3,6 / 3,7 / 3,8 GHz, si accontenta di 4 MB L2, un capiente L3 (8 MB) e un TDP di 95 W. Per quanto riguarda il costo dei dispositivi, i prezzi all'ingrosso consigliati per i modelli elencati sono rispettivamente di $ 245/205/165/115.

Overclock

La capacità di overclockare i processori è uno dei parametri chiave dei chip FX. AMD pone un'enfasi separata su questa caratteristica. Il moltiplicatore gratuito è disponibile per tutti i modelli della linea, e la possibilità di cambiarlo sarà presente su qualsiasi scheda con AM3+.

L'architettura FX è stata progettata da zero per funzionare a velocità di clock elevate. Gli artigiani armati di contenitori di azoto liquido sono stati in grado di ottenere uno screenshot della CPU-Z in una situazione in cui il processore funzionava a quasi 8,5 GHz. Allo stesso tempo, però, è stato necessario lasciare attivo un solo modulo su quattro. Tutti gli otto core sono stati progettati per funzionare a 8,1 GHz. In precedenza, solo le versioni Intel Celeron più leggere per LGA775 raggiungevano tali frequenze. Ora gli appassionati avranno a disposizione un oggetto molto più interessante per gli esperimenti di overclock.

Nel caso di un sistema di raffreddamento ad aria, dovrai accontentarti di risultati più modesti. Quando la tensione di alimentazione è stata aumentata a 1,45 V, la CPU ha funzionato stabilmente a 4,6 GHz. Non così impressionante, ma il potenziale è chiaramente migliore dei chip Phenom II a 45 nm.

Risultati

I risultati del test delle prestazioni sono presentati nei diagrammi. L'immagine è abbastanza indicativa per formare un'opinione generale sulle possibilità del nuovo sviluppo di AMD. Ci si aspetta che i processori FX abbiano ricevuto un aumento delle prestazioni nelle attività multi-thread: archiviazione, codifica video HD, rendering. Qui, il chip a otto core è abbastanza in grado di competere sia con il Core i5-2500K che con il più costoso Core i7-2600K. Tuttavia, non appena si tratta di applicazioni con ottimizzazione non importante per l'esecuzione parallela del codice, AMD FX perde posizioni: le prestazioni specifiche delle loro unità x86 sono persino leggermente inferiori a quelle dei prodotti con architettura K10. Nei giochi che utilizzano al massimo 3-4 thread, i processori Intel hanno un notevole vantaggio. Se si utilizzano le impostazioni di massima qualità grafica, dove la scheda video diventa il limitatore, le prestazioni del sistema si livellano, ma è impossibile valutare il reale potenziale della CPU in tali condizioni.

Il passaggio a una tecnologia di processo a 32 nanometri, invece, ha permesso di mantenere il consumo energetico allo stesso livello con prestazioni migliorate. Probabilmente, la priorità in questo caso erano proprio le prestazioni, e non il miglioramento dell'efficienza della CPU.

Anche a giudicare dal costo di AMD FX, è ovvio che l'azienda progetta principalmente di prendere piede nella categoria di prezzo medio, dando deliberatamente a Intel il segmento delle soluzioni costose di fascia alta. Nelle condizioni attuali, oggettivamente, il produttore non può ora esibirsi adeguatamente nel campionato dei "supermassimi". Avendo fatto affidamento sull'elaborazione multi-core, ottenere risultati eccezionali in un software scarsamente ottimizzato è molto problematico. Allo stesso tempo, solo cinque anni fa, siamo rimasti sinceramente sorpresi di sapere che potrebbe aver bisogno di un processore quad-core su un desktop e di come utilizzare in modo efficiente le risorse di una tale CPU. Oggi è un luogo comune e i vantaggi dei chip con così tante unità di calcolo non sollevano più dubbi. Forse, qualche tempo dopo, anche i modelli a otto core riceveranno tale riconoscimento.

Fortunatamente, AMD non si vergognerà di vedere quale destino è toccato ai suoi processori. I piani annunciati per un ulteriore sviluppo ispirano, sebbene contenuti, ma ancora ottimismo. L'azienda continuerà a perfezionare attivamente l'architettura attuale, migliorando sia l'efficienza energetica che le prestazioni della CPU, ma il tasso indicato - 10-15% all'anno - non è molto impressionante. Con tali indicatori, si può contare su un cambiamento radicale della situazione solo se Intel rallenta lo sviluppo dei suoi prodotti, ma non ci sono prerequisiti per questo: il meccanismo del "tick-tock" non è ancora fallito. Già nella primavera del 2012 verranno presentati i chip Ivy Bridge, realizzati con tecnologia a 22 nanometri e utilizzando transistor 3D.

La valutazione finale dell'architettura considerata e del processore AMD FX-8150 basato su di essa è ambigua, e questo suggerisce già che la rivoluzione non è avvenuta. Almeno in questa fase, è invisibile all'utente finale. Un salto di qualità nelle prestazioni si verifica in applicazioni ben parallelizzate, mentre nelle attività a thread singolo non vi è alcun guadagno significativo. Le grandi aspettative per Bulldozer sono state soddisfatte solo in parte. AMD ha ancora molto lavoro da fare per offrire soluzioni interessanti e competere per un posto nel cuore degli appassionati più esigenti.

amministratore di sistema(è in inglese amministratore di sistema, amministratore di sistema) - il nome abbreviato della professione, il cui nome completo in russo suona come Amministratore di sistema... Questa professione è recentemente diventata molto popolare per la maggior parte dei giovani, e non molto persone, la addestrano, ci lavorano, guadagnano bene per essa. Ciò è dovuto al rapido sviluppo di varie tecnologie informatiche e alla loro penetrazione in tutte le sfere della vita umana. La parola sysadmin è spesso usata nel discorso colloquiale, nei posti vacanti e riprende quando si cerca un lavoro, in una parola - ovunque. Di seguito parleremo di quale sia la professione di amministratore di sistema.

Nelle realtà moderne, un amministratore di sistema può essere chiamato praticamente qualsiasi persona che si occupa della manutenzione e del supporto di una determinata rete di computer, inclusi tutti i suoi componenti hardware e/o software, che possono includere:

  • Personal computer, sia workstation che server;
  • Apparecchiature di rete come switch, router, firewall e altro;
  • Server Web, server di posta, server di database e altri.

Inoltre, in alcuni casi, le responsabilità di garantire un'adeguata sicurezza delle informazioni possono ricadere sulle spalle dell'amministratore di sistema.

A seconda della sua specializzazione, l'amministratore di sistema può svolgere le seguenti attività:

  • L'amministratore di workstation e server più spesso ripara sia l'hardware (schede madri guaste, alimentatori bruciati) che il software (Windows non si carica, le virgole non vengono stampate in Word "e ...).
  • Amministratore di una rete aziendale basata su un dominio Active Directory. Un'attività molto popolare, data la prevalenza dei sistemi operativi Windows, nonché la necessità di controllarli in qualche modo centralmente. Tale specialista dovrebbe essere in grado di creare, distribuire in gruppi, modificare utenti, concedere loro i diritti appropriati nel dominio AD, nonché essere in grado di gestire criteri di gruppo per utenti, computer e gruppi a cui appartengono tutti.
  • Amministrazione di reti e apparati di rete. Le sue responsabilità includono la conoscenza della topologia di rete, la capacità di lavorare con apparecchiature di rete sia non configurabili che configurabili, la pianificazione di una rete locale, nonché la capacità di combinare diversi luoghi di lavoro remoti in un'unica rete impostando NAT e VPN ". Non dimenticare anche il controllo degli accessi all'interno di questa rete e al di fuori di essa: l'impostazione di un proxy.
  • Un amministratore di server Web che dovrebbe almeno essere in grado di installare, configurare e mantenere uno dei seguenti server Web: Apache, IIS, Nginx, monitorare l'hosting (che può essere posizionato sia all'interno della rete dell'organizzazione che al di fuori di essa). Inoltre, un buon amministratore dovrebbe essere in grado di configurare la normale allocazione delle risorse con carichi elevati, clustering e molte altre cose specifiche.
  • Anche l'amministrazione di un server di posta è un'attività comune per un amministratore di sistema, i suoi compiti includono il lavoro con soluzioni popolari come Exim, Microsoft Exchange, Postfix, Sendmail o soluzioni di posta aziendale di Google o, ad esempio, Yandex. Oltre all'ovvio controllo sugli account (creazione, eliminazione, configurazione), è anche indispensabile poter configurare il sistema antispam e così via.
  • Amministratore del sito. Queste responsabilità possono includere solo una sorta di riempimento con il contenuto del sito, ma poiché stiamo parlando di un amministratore di sistema, allora in teoria dovrebbe essere in grado di configurare hosting (incluso un server web, come detto sopra), installare e configurare il sito desiderato, ad esempio un sistema di gestione dei contenuti (CMS).
  • Molto raramente, il compito di creare o mantenere un sistema di videosorveglianza può rientrare nelle responsabilità di un amministratore di sistema. Le attività includono l'installazione e la configurazione delle telecamere, la risposta a vari eventi, il salvataggio e la riproduzione delle registrazioni. Riguarda debolmente l'amministrazione del sistema e spesso rientra nei suoi doveri in concomitanza con altri compiti.

Al di fuori delle attività dell'amministratore di sistema sopra descritte, c'erano cose possibili come l'amministrazione del database (Microsoft SQL, MySQL e i suoi molteplici rami, Oracle, ecc.), l'amministrazione 1C (da non confondere con "programmatore 1C"), PBX e molto di più...

 

 

È interessante: