AMD Bulldozer è l'ultima generazione di processori AMD. "Bulldozer" dei processori AMD e Intel: chi vince

AMD Bulldozer è l'ultima generazione di processori AMD. "Bulldozer" dei processori AMD e Intel: chi vince

Dedicato all'analisi della nuova microarchitettura del processore AMD Bulldozer, incorporata nei modelli FX 8120 e FX 8150 della famiglia Zambezi. Nelle recensioni, i modelli di punta non sono presentati nella luce più favorevole: consumano molta energia, si surriscaldano e hanno prestazioni significativamente inferiori a quelle delle soluzioni concorrenti di Intel. Inoltre, sono posizionati come processori a 8 core, anche se in realtà si tratta di modelli a 4 core con una forma "avanzata" di multi-threading a causa della natura "siamese" dei doppi moduli Bulldozer. Probabilmente nel tentativo di neutralizzare gli emergenti immagine negativa e ripristinare la fiducia nel marchio AMD, l'azienda ha presentato al grande pubblico un piano per migliorare l'architettura Bulldozer entro il 2014: un obiettivo ambizioso in termini di tempi di implementazione, considerando quanto può accadere durante questo periodo e quanto imprevedibile la situazione sul mercato il mercato può cambiare bordo tagliente progresso tecnologico.

Come segue dal calendario pubblicato, le varie tappe sviluppo evolutivo, rappresentato dalle architetture Piledriver, Steamroller ed Excavator, entro il 2014, secondo i dati calcolati, consentirà un incremento qualitativo del 30-50% (i materiali presentati, ovviamente, potranno essere modificati senza preavviso). I nomi commerciali utilizzati trasmettono l'immagine di un vero uomo, suggerendo ottime prestazioni che metteranno a terra tutti i concorrenti. Pertanto, se i nuovi non riescono a competere, le convenzioni utilizzate continueranno a introdurre un elemento di confusione, come avviene attualmente con l’architettura Bulldozer. Con Intel che offre già una superiorità del 20-50% (a seconda del test specifico), la domanda è: come potranno questi modesti miglioramenti competere con i futuri prodotti Intel? Alla luce dei recenti cambiamenti nel management di AMD, si può solo sperare che arrivi il leader giusto e diriga le attività dell'azienda nella giusta direzione. Altrimenti non si può escludere uno scenario in cui la produzione di quelli compatibili con x86 potrebbe essere interrotta e tutta l'attenzione si concentrerebbe sulla produzione di soluzioni grafiche.

Il problema principale relativo all'architettura Bulldozer a partire da questo momento Il problema è che il suo ingresso sul mercato è ritardato, e lo è notevolmente. I lavori per la creazione di Bulldozer sono iniziati nel 2007, ad es. 4 anni fa sono un tempo molto lungo per gli standard del settore dei processori desktop. Pertanto, AMD, infatti, ha introdotto un nuovo "vecchio" prodotto. Due punti importanti testimoniano a favore dei nuovi prodotti: buona scalabilità in termini di scelta del numero di core richiesto e caratteristiche ad alta frequenza, perché gli stessi 8 GHz dimostrati nei materiali di marketing non dovrebbero essere scontati. Ciò di cui abbiamo veramente bisogno è un progresso più significativo di quello mostrato nella diapositiva demo. È necessario un aumento qualitativo del 100% o anche più, che non è un obiettivo così irraggiungibile nei prossimi tre anni. O forse sarebbe più corretto abbandonare la direzione scelta e ricominciare tutto da capo, optando per nuclei discreti, ad esempio Processori AMD Famiglia di fenomeni? Forse i recenti cambiamenti nel top management di AMD saranno in grado di apportare modifiche alle attività dell'azienda.

Quindi, anche se AMD riuscisse a soddisfare e superare le sue previsioni, ciò le consentirà di competere con Intel o sarà Intel stessa a far rotolare il bulldozer?

Introduzione Non c'è dubbio che i nuovi processori AMD, basati sulla microarchitettura Bulldozer, siano tra i prodotti più attesi non solo di quest'anno, ma almeno dell'attuale quinquennio. Ci sono diverse ragioni per questo, così come per l'esistenza di un enorme esercito di fan per i prodotti AMD. Alcune persone hanno ricordi freschi dei tempi in cui i processori di questa azienda erano migliori di quelli di Intel sotto tutti gli aspetti. Alcune persone amano i prodotti AMD per la loro combinazione equilibrata di prezzo e prestazioni. E alcuni sono rimasti colpiti dalle emozionanti storie di AMD sui vantaggi della microarchitettura sviluppata all’interno dell’azienda. Tutto ciò si è aggiunto a molti anni di noiosa attesa per il rilascio dei processori della generazione Bulldozer, ed ecco il risultato: stai leggendo questo articolo con grande attenzione e palese interesse.

Tuttavia, ne vale chiaramente la pena. La situazione sul mercato dei processori nei prossimi anni dipende dal successo della microarchitettura Bulldozer. Dopotutto, solo Intel dispone delle risorse ingegneristiche e produttive per implementare nuove soluzioni microarchitettoniche ogni due o tre anni. AMD è costretta ad aderire a un ritmo molto più misurato nello sviluppo. È spaventoso da ricordare, ma la microarchitettura utilizzata negli odierni processori Phenom II e Athlon II risale al 1999 e da allora AMD ha apportato solo modifiche estetiche. Pertanto, non abbiamo particolari illusioni sul fatto che il ciclo di sviluppo diventerà improvvisamente più attivo con il rilascio di Bulldozer. È ovvio che Bulldozer sarà al centro dell'offerta di prestazioni di AMD per i prossimi anni.

L'attuale versione dei piani dell'azienda prevede lo sviluppo di questa microarchitettura fino al 2014, ma quasi sicuramente continuerà oltre.

Il fatto che AMD prometta un aumento delle prestazioni del 10-15% ogni anno è più un sintomo allarmante che incoraggiante. Molto probabilmente, tale aumento sarà fornito principalmente da un aumento delle frequenze di clock e solo successivamente da alcuni nuovi miglioramenti microarchitettonici.

In altre parole, il successo della microarchitettura Bulldozer nella sua forma attuale avrà un impatto decisivo sulla posizione futura di AMD, sulla competitività dei suoi prodotti e, in definitiva, sulla situazione complessiva nel mercato dei processori.

Naturalmente non si può negare che Bulldozer per AMD non sia l'unico prodotto chiave. Questa microarchitettura è oggi rivolta al segmento desktop e server ad alte prestazioni. Allo stesso tempo, AMD ha altre proposte per altri segmenti di mercato. Ad esempio, i processori economici ed economici con la microarchitettura Bobcat o le APU della famiglia Llano, rilasciati dall'azienda all'inizio di quest'anno, non sono aree meno importanti per l'azienda. E queste proposte, come abbiamo visto dai risultati dei test, sono soluzioni di successo che possono fungere adeguatamente sia come soluzioni per netbook e nettop, sia come base per piattaforme integrate nella fascia di prezzo media.

Tuttavia, il successo o il fallimento di Bulldozer ha implicazioni molto più significative. Innanzitutto, questa microarchitettura si rivolge a segmenti di mercato con margini di profitto molto più elevati: server e sistemi di produttività desktop. Pertanto, è in grado di avere un impatto molto più forte sulla situazione finanziaria di AMD. In secondo luogo, il successo dei processori AMD delle serie C, E e A, francamente, non è affatto merito degli ingegneri coinvolti nello sviluppo della progettazione del microprocessore. Il successo di mercato di queste CPU (o APU, se ci atteniamo alla terminologia AMD) deriva dalla presenza in esse di core grafici della famiglia Radeon HD, che sono entrati nei processori AMD grazie al tempestivo acquisto di ATI. Bulldozer è una sorta di esame di qualificazione per un team di ingegneri che lavora specificamente sulla microarchitettura dei core informatici. E in terzo luogo, Bulldozer diventerà alla fine la base dell'intera linea di processori AMD, ad eccezione delle soluzioni per piattaforme ad alta efficienza energetica. Quindi, alla fine, è questa microarchitettura che arriverà ai segmenti di mercato più bassi, sostituendo K10 quasi ovunque, compresi i processori Llano.



In breve, difficilmente è possibile sopravvalutare l'importanza di un lancio di successo di processori con la microarchitettura Bulldozer. Questo è un prodotto iconico sia a livello emotivo che materialistico. E quindi voglio davvero che vediamo, in senso figurato, un nuovo K7 o K8 nella realtà.

Ma anche prima dei test, possiamo dire che le possibilità che un simile fenomeno si ripeta sono piccole. Intel stessa ha aiutato AMD a conquistare la palma l'ultima volta, cercando di promuovere la microarchitettura NetBurst, tutt'altro che ideale. Successivamente gli ingegneri Intel si sono concentrati sull'aumento della velocità di clock, che alla fine ha incontrato ostacoli sotto forma di gigantesche correnti di dispersione, mentre AMD ha offerto una microarchitettura più equilibrata mirata all'esecuzione di più istruzioni per ciclo di clock. Ma dopo che Intel ha rivisto la sua dottrina e introdotto una nuova microarchitettura Core, anch'essa mirata ad eseguire il numero massimo di istruzioni per ciclo di clock, AMD è ricaduta nella posizione di ritardatario, dove era stata fino ad ora.

Ovviamente supera il moderno Processori Intel in termini di numero di istruzioni eseguite per ciclo di clock è molto difficile. La microarchitettura Sandy Bridge di oggi è il risultato di almeno tre cicli di ottimizzazione di un design intrinsecamente efficiente, quindi non possiamo aspettarci un'efficienza specifica del core ancora più elevata da AMD. Inoltre, gli ingegneri AMD non si sono nemmeno prefissati un obiettivo del genere.

L’idea principale di Bulldozer risiede altrove. Secondo gli sviluppatori, i processori basati su questa microarchitettura dovrebbero mostrare buone prestazioni grazie alle elevate velocità di clock e al maggior numero di core di calcolo rispetto ai loro concorrenti e predecessori. Allo stesso tempo, dovrebbero rimanere abbastanza redditizi nella produzione, cioè non dovrebbero avere un cristallo semiconduttore troppo grande e non dovrebbero dimostrare una dissipazione del calore troppo elevata in termini di singolo nucleo.

Segreti del design multi-core AMD

È abbastanza chiaro che un aumento del numero di core del processore comporta inevitabilmente un aumento dell'area del chip del processore. Di conseguenza, aumentano sia la complessità della produzione che il costo dei prodotti finali. Pertanto, ad esempio, i processori con il numero massimo di core di calcolo vengono utilizzati oggi solo nel segmento di mercato dei server: i clienti aziendali sono molto più disposti a sborsare denaro rispetto ai singoli utenti. La strada scelta da AMD per aumentare il numero di core mantenendo un costo accettabile dei processori risultanti deve essere accompagnata da una semplificazione dei core stessi. Tuttavia, d'altra parte, la semplificazione dei kernel comporta un effetto indesiderato: un calo delle prestazioni nelle applicazioni con carichi debolmente parallelizzati, di cui al momento esiste ancora un numero sufficiente.

Pertanto, gli ingegneri AMD hanno seguito la propria strada. La microarchitettura dei singoli core è diventata più complessa, aumentando quando possibile il numero di istruzioni eseguite per clock.



Ma si è deciso di rendere parte delle risorse solitamente presenti in ciascun core, ma allo stesso tempo eccessivamente efficienti, condivise tra coppie di core di calcolo.



L'assemblaggio dual-core risultante è diventato l'elemento base per i processori Bulldozer. Tale nodo, chiamato modulo nella terminologia AMD, ha due set completi di attuatori interi. Ma allo stesso tempo, l'unità in virgola mobile, i dispositivi di prelettura e decodifica delle istruzioni, nonché la cache di secondo livello esistono in un'unica copia per una coppia di core e condividono le loro risorse tra di loro. Secondo gli sviluppatori, la potenza di questi elementi è sufficiente per due core, poiché durante la manutenzione di un singolo core vita reale sono inattivi abbastanza spesso. Inoltre, i ritardi nel loro funzionamento ininterrotto non hanno un impatto serio sulle prestazioni risultanti.

Secondo la stessa AMD, un modulo dual-core progettato nel modo descritto è in grado di fornire fino all'80% delle prestazioni di un processore dual-core a tutti gli effetti. Allo stesso tempo, il risparmio nel budget dei transistor (e, di conseguenza, nell'area del cristallo semiconduttore) raggiunge il 44%.

Grazie a questa ingegnosa compattazione del core, AMD è stata in grado di incorporare un design a otto core (o quad-module) nel design di base del die del semiconduttore Bulldozer.



Inoltre, una parte abbastanza significativa del cristallo è dedicata alla memoria cache. Le cache di secondo livello, condivise tra coppie di core all'interno di ciascun modulo processore, hanno una capacità di 2 MB e la memoria cache L3 totale per l'intero processore è di 8 MB. Pertanto, tenendo conto della tradizionale organizzazione esclusiva delle cache AMD, possiamo dire che il loro volume totale è di 16 MB per processore a otto core. Allo stesso tempo, l'area del cristallo del semiconduttore Bulldozer rimane entro limiti accettabili, quindi gli sviluppatori AMD hanno pienamente raggiunto il loro obiettivo.



In numeri assoluti, ciò significa che i bulldozer a otto core avranno un die semiconduttore più piccolo rispetto, ad esempio, ai processori Thuban a sei core (Phenom II X6), costruiti sulla microarchitettura K10. Tuttavia, va tenuto presente che Bulldozer sarà prodotto utilizzando un processo tecnico più avanzato con standard a 32 nm. Rispetto ai moderni Intel Sandy Bridge quad-core, i nuovi processori AMD a otto core avranno solo il 45% in più di area del die.

Tuttavia, i processori quad-core Sandy Bridge, grazie al supporto della tecnologia Hyper-Threading, proprio come Bulldozer, possono essere presentati al sistema operativo come processori a otto core. Ciò darà sicuramente luogo a polemiche sulla legalità di chiamare Bulldozer processori a otto core a tutti gli effetti. Tuttavia, dovrebbe essere chiaro che AMD e Intel sono arrivate all'ammissibilità dell'esecuzione simultanea di otto thread di elaborazione in modi diversi. Gli sviluppatori Intel hanno avvitato la loro microarchitettura caratteristiche aggiuntive, consentendo l'esecuzione di due thread all'interno di un core, su un set di dispositivi di esecuzione. AMD, al contrario, ha ritagliato parti "extra" da due core a tutti gli effetti, ma all'interno di ciascun modulo c'erano solo due set di attuatori.



Di conseguenza, la tecnologia Hyper-Threading di Intel aumenta le prestazioni multi-thread solo del 15-20%, mentre la soluzione di AMD fornisce un aumento delle prestazioni dell'80% quando si passa da 4 a 8 thread.

Anche se, ovviamente, il cristallo semiconduttore del Bulldozer a otto core, grazie alla sua struttura modulare, è davvero molto simile a quello quad-core.


Più istruzioni per ciclo?

Il solo aumento del numero di core del processore non ti porterà lontano. Ciò è diventato chiaro anche dopo il rilascio dei processori Phenom II X6 a sei core, che sono generalmente inferiori in termini di prestazioni al Sandy Bridge quad-core. Pertanto, gli sviluppatori AMD non si sono limitati a modifiche estese al design. La microarchitettura di base del Bulldozer, rispetto al K10, è stata ridisegnata leggermente meno che completamente, il che fa sperare di accelerare il funzionamento dei sistemi su processori AMD non solo in attività multi-thread, ma anche in applicazioni con un basso livello di parallelismo. Inoltre, queste speranze si basano su circostanze del tutto oggettive. Mentre le precedenti microarchitetture AMD erano progettate per eseguire tre istruzioni per clock (su un core), la microarchitettura Bulldozer presuppone l'esecuzione di quattro istruzioni per clock ed è più vicina in questa caratteristica ai processori concorrenti con microarchitettura Core.

I cambiamenti qualitativi possono essere tracciati a partire dalle primissime fasi della pipeline di esecuzione, dalla fase di precaricamento e decodifica delle istruzioni. Queste fasi sono comuni a coppie di core all'interno di un singolo modulo, quindi AMD ha prestato particolare attenzione a garantire che non diventino un collo di bottiglia della microarchitettura. Le istruzioni vengono recuperate dalla cache L1I per la decodifica in blocchi di 32 byte, due volte più grandi rispetto ai processori con microarchitettura Core (seconda generazione). La stessa cache delle istruzioni di primo livello ha una capacità di 64 KB e associatività a due canali. Le istruzioni destinate alla decodifica vengono caricate in anticipo dalla cache di secondo livello.

Il blocco di previsione dei rami, che è coinvolto più direttamente nel processo di campionamento, contiene due serie di buffer che monitorano in modo indipendente l'attività di diversi core. Pertanto, quando si prevedono i risultati dei rami logici, Bulldozer non si confonde tra i thread. Poiché la nuova microarchitettura mira a funzionare a velocità di clock elevate, la qualità dell'unità di previsione delle diramazioni è della massima importanza. Pertanto, gli algoritmi utilizzati sono stati completamente riprogettati e AMD spera che l'efficienza della previsione dei rami di Bulldozer migliorerà.



Anche il decodificatore di istruzioni x86 di Bulldozer divide le sue risorse su due core ed è in grado di decodificare fino a 4 istruzioni in entrata per ciclo di clock. Tuttavia, le sue prestazioni sono limitate all'emissione di sole quattro istruzioni macro (risultanti dalla decodifica in termini AMD), mentre le istruzioni x86 possono essere suddivise in 1-2 o anche più istruzioni macro. Pertanto, sebbene il decoder abbia aumentato le sue prestazioni di un terzo rispetto alla precedente generazione di microarchitettura, la sua velocità potrebbe non essere sufficiente, dato che ha il compito di supportare due cluster di calcolo con numeri interi e uno con numeri reali.

Va notato che in Bulldozer è stato utilizzato anche un certo analogo della tecnologia di fusione delle istruzioni di macrofusione. Alcuni gruppi di istruzioni x86 possono essere combinati in un unico insieme e passati attraverso il decodificatore come un'unica istruzione: AMD chiama questa operazione Branch Fusion.

Le macroistruzioni decodificate sono distribuite in tre cluster di calcolo, due dei quali sono i resti di nuclei di calcolo a tutti gli effetti e uno è numerato reale, condiviso tra i nuclei. Ciascuno di questi cluster ha la propria logica di riordino delle istruzioni e il proprio scheduler. Ciò ovviamente significa che AMD conserva la capacità di sostituire o integrare completamente alcuni di questi cluster nei prodotti futuri.

Il riordino delle istruzioni in ciascuno dei cluster si basa sull'uso di un file di registro fisico, che memorizza i riferimenti al contenuto dei registri ed elimina la necessità di continui trasferimenti di dati all'interno del processore quando si riorganizza l'ordine delle istruzioni. Questo approccio ha sostituito al suo posto il buffer di riordino, poiché il file di registro fisico non solo è più efficiente in termini di consumo energetico, ma è anche più favorevole all'aumento della velocità di clock del processore.

I cluster di interi contengono due unità di esecuzione aritmetica (ALU) e due unità di indirizzo di memoria (AGU). Rispetto alla microarchitettura K10, il numero di dispositivi è diminuito di una ALU e di una AGU, ma AMD assicura che ciò non ridurrà significativamente le prestazioni, ma l'area centrale risparmierà in modo significativo. Siamo prontamente convinti che avere più di due ALU e AGU in ciascun cluster di interi non abbia davvero senso dal punto di vista pratico, perché non più di quattro macro istruzioni per ciclo di clock possono arrivare dal decodificatore per essere eseguite da entrambi i cluster.



Allo stesso tempo, gli attuatori sono diventati più universali, praticamente non differiscono nelle loro funzioni.

L'organizzazione del sottosistema della memoria cache è cambiata seriamente. La cache L1D è stata ridotta da 64 a 16 KB ed è diventata comprensiva di write-through. Allo stesso tempo, la sua associatività è aumentata a 4 canali, oltre ai quali è stato aggiunto un "predittore di percorso". La riduzione delle dimensioni della cache dati di primo livello è compensata da un significativo aumento del throughput; ora può gestire fino a tre operazioni a 128 bit contemporaneamente: due letture e una scrittura.

Ovviamente, i cambiamenti nella larghezza di banda della cache L1D sono in gran parte legati alla necessità di implementare istruzioni AVX a 256 bit nella microarchitettura, il cui supporto è apparso nell'unità FPU condivisa tra i core. Tuttavia, ciò non significa che gli attuatori di numeri reali siano diventati a 256 bit. In effetti, il modulo Bulldozer ha due dispositivi a 128 bit e le istruzioni AVX vengono decodificate come coppie collegate di istruzioni a 128 bit. Di conseguenza, per eseguirli, i dispositivi FMAC (moltiplicazione-accumulo in virgola mobile) vengono combinati e le prestazioni di un cluster con numero reale vengono ridotte a un comando AVX per modulo processore per ciclo di clock.



La FPU non dispone di una propria cache di primo livello, quindi questo cluster funziona con i dati tramite dispositivi interi.

Da quando gli ingegneri AMD si sono già impegnati a implementare il supporto per le istruzioni AVX proposte da Intel, ai processori Bulldozer sono stati aggiunti altri set rilevanti: istruzioni SSE4.2 e AESNI volte ad accelerare le operazioni di crittografia. Inoltre, AMD ha introdotto alcuni dei propri comandi: la moltiplicazione-addizione di tre operandi FMA4 e la propria visione dell'ulteriore sviluppo di AVX - XOP.



La cache L2 in Bulldozer è condivisa all'interno del modulo del processore e condivisa tra i core. La sua capacità è di ben 2 MB e la sua associatività è di 16 canali. Tuttavia, la latenza della cache che funziona secondo questo schema è aumentata a 18-20 cicli, nonostante il fatto che la larghezza del bus sia rimasta la stessa di prima: 128 bit. Ciò significa che la cache L2 in Bulldozer, sebbene grande, non è molto veloce; i processori concorrenti e precedenti offrono cache L2 con circa la metà della latenza. Insieme a una piccola cache L1D con una latenza di 4 cicli (che è anche superiore a quella della microarchitettura K10), tutto ciò non sembra molto incoraggiante. Tuttavia, AMD afferma che la latenza della cache è stata aumentata esclusivamente per dare a Bulldozer la capacità di operare a velocità di clock elevate.



Inoltre, gli ingegneri AMD hanno implementato un'efficiente unità di prefetch, progettata per caricare in anticipo i dati necessari nelle cache di primo e secondo livello. Si dice che le prestazioni di questi blocchi siano migliorate e che ora siano in grado di riconoscere anche strutture di dati irregolari.

In teoria Bulldozer fa una buona impressione. AMD ha completamente rivisto il suo vecchio approccio alla microarchitettura del processore e ha implementato un design completamente riprogettato. Il che, a prima vista, sembra molto promettente, perché la nuova microarchitettura è ottimizzata per l'esecuzione di quattro, anziché tre, istruzioni per ciclo di clock su un core del processore. Inoltre, supporta la fusione macro di istruzioni durante il processo di decodifica, aumentando ulteriormente le prestazioni specifiche.

Ma tutto sembra così bello solo finché guardiamo un solo nucleo e non pensiamo al fatto che in realtà tali nuclei sono combinati in coppia. E il modulo Bulldozer dual-core ha troppe parti comuni per un paio di core. In particolare, poiché tale modulo dispone di una sola unità di fetch delle istruzioni e di un decodificatore, il numero massimo di istruzioni eseguite per ciclo di clock rimane pari a quattro per l'intero complesso dual-core. Ciò significa che l'equivalente logico di un singolo core Sandy Bridge in termini di prestazioni teoriche è il modulo e non il core Bulldozer. La capacità del modulo di eseguire due thread in questo caso sembra una risposta del tutto logica da parte di AMD alla tecnologia Hyper-Threading.

Naturalmente, i nostri test sui processori reali metteranno tutto al suo posto, ma già nella fase di considerazione della microarchitettura siamo costretti a pensare che posizionare Bulldozer come processori a otto core a tutti gli effetti sia uno stratagemma di marketing. Una valutazione più affidabile delle capacità di calcolo di questi processori dovrebbe basarsi sul numero di moduli che, in termini di prestazioni teoriche, sono perfettamente paragonabili ai core costruiti sulla microarchitettura Intel Core di seconda generazione.

A questo proposito, sorge una domanda del tutto logica: perché AMD si è preoccupata anche dell'implementazione dell'elaborazione a doppio thread all'interno di un singolo modulo processore? Perché non è possibile combinare attuatori distribuiti su due core in un unico cluster? Ci sono diverse ragioni per questo.

In primo luogo, per caricare contemporaneamente un gran numero di attuatori con lavoro, nel caso generale è necessaria una logica intraprocessore avanzata. AMD, ovviamente, non è stata in grado di implementare unità altamente efficienti di previsione dei rami, istruzioni e precaricamento dei dati nella microarchitettura Bulldozer. Pertanto, il compito di parallelizzare il lavoro e di utilizzare in modo più ottimale gli attuatori è stato trasferito ai produttori Software, che dovrebbe fornire prodotti multi-threading per Bulldozer.

In secondo luogo, aumentare il numero di thread eseguiti contemporaneamente non è poi così negativo. Se per gli utenti desktop, e in particolare per i giocatori, otto core Bulldozer abbastanza semplici non promettono vantaggi particolari, nelle applicazioni server tale microarchitettura dovrebbe essere soddisfatta in modo molto favorevole. Quindi, è del tutto possibile che l'obiettivo principale nello sviluppo di Bulldozer non fosse quello di soddisfare le aspirazioni degli appassionati, ma di ripristinare la posizione di AMD nel mercato dei server.

Turbo Core ancora più Turbo

L'efficienza energetica è una delle caratteristiche più importanti dei moderni processori. Ad esempio, nel loro future microarchitetture Intel presta attenzione alla riduzione del consumo energetico quasi in primo luogo. AMD non ha ancora raggiunto questo punto; gli ingegneri di questa azienda lottano principalmente per le prestazioni. Ma questo non significa che gli sviluppatori non si preoccupassero affatto delle caratteristiche termiche ed energetiche di Bulldozer. Al contrario, seguendo Llano, approcci fondamentalmente nuovi per aumentare l’efficienza energetica hanno trovato la loro strada nei processori Bulldozer. Tuttavia, in questo caso, gli ingegneri hanno utilizzato il potenziale liberato non tanto per risparmiare denaro, ma per ottenere prestazioni aggiuntive aumentando le frequenze di clock.

Naturalmente, la nuova tecnologia di produzione ha apportato alcuni miglioramenti in termini di consumo energetico e dissipazione del calore. Bulldozer utilizza una tecnologia di processo a 32 nm che utilizza materiale ad alto dielettrico, transistor con gate metallico e tecnologia SOI. In altre parole, questo è lo stesso processo tecnico GlobalFoundries che produce i processori Llano. Grazie alla nuova tecnologia con standard a 32 nm, le tensioni di alimentazione operative dei processori Bulldozer seriali a otto core non superano 1,4 V.

Tuttavia, la principale innovazione passata da Llano a Bulldozer sono i transistor power gate, progettati per interrompere l'alimentazione da alcune parti del processore. In Bulldozer consentono di scaricare in modo indipendente la tensione dai singoli moduli dual-core e dalla memoria cache.



Quando entrambi i core di calcolo del modulo entrano nello stato di risparmio energetico C6, il modulo viene diseccitato. Sfortunatamente, questa tecnologia non può essere applicata ai core del processore, poiché semplicemente non ci sono core dedicati all'interno di Bulldozer: condividono alcune risorse con i moduli vicini.

Gli stati di risparmio energetico dei cores C6 sono controllati dalle tecnologie Bulldozer e Turbo Core. Nei momenti in cui almeno la metà dei moduli processore Bulldozer sono in modalità di risparmio energetico, aumenta la tensione di alimentazione e la frequenza di clock. Questa modalità operativa forzata si chiama Max Turbo Boost.

Tuttavia, Max Turbo Boost non è una novità; tale auto-overclocking è stato introdotto da AMD nei processori Thuban basati sulla microarchitettura K10. La vera novità è la modalità All Core Boost, in cui la velocità clock può aumentare oltre il valore nominale anche quando tutti i cores del processore sono attivi. La versione migliorata del Turbo Core implementata in Bulldozer consente al processore di valutare con buona precisione il consumo pratico di energia e la dissipazione del calore, in base alle informazioni sul carico di lavoro di determinati blocchi. Di conseguenza, se secondo questa valutazione l'attuale dissipazione del calore e il consumo energetico sono significativamente al di sotto del limite, il processore può aumentare la tensione di alimentazione e la frequenza di clock anche se nessun core è in stato passivo.



Pertanto, la frequenza operativa dei processori con la microarchitettura Bulldozer è un valore estremamente variabile. A seconda della “gravità” degli algoritmi eseguiti e del numero di core coinvolti, può cambiare dinamicamente in un intervallo molto ampio, raggiungendo i 900 MHz.

Piattaforma desktop aggiornata

Con l'introduzione della nuova microarchitettura, AMD non solo non ha modificato il design della piattaforma, ma ha anche mantenuto la compatibilità dei processori Bulldozer con l'infrastruttura esistente. Di conseguenza, proprio come i loro predecessori, i nuovi processori contengono un north bridge integrato, inclusa una cache di terzo livello, un controller di memoria ed un controller del bus Hyper-Transport. Allo stesso tempo, nonostante tutti i processori AMD e Intel appena rilasciati abbiano anche un controller del bus grafico PCI Express integrato, Bulldozer non ce l'ha.



Proprio come nei processori basati sulla microarchitettura K10, il northbridge integrato in Bulldozer utilizza la propria frequenza di clock, che è impostata su 2,0-2,2 GHz per diversi modelli. Tieni presente che questa frequenza ha un certo impatto sulle prestazioni, poiché influisce direttamente sulla velocità della cache L3. Che nella versione attuale dei processori ha un volume aumentato a 8 MB e ha un'associatività a 64 canali. Soddisfacendo i desideri degli utenti aziendali, i dati archiviati in questa cache sono protetti dal codice di correzione errori ECC.

Il controller di memoria integrato in Bulldozer non ha funzionalità fondamentalmente nuove. Come prima, supporta DDR3 SDRAM, utilizza un design a doppio canale e, di fatto, è costituito da due controller indipendenti a canale singolo che possono funzionare in modalità accoppiata o disaccoppiata. AMD ha aggiunto il supporto solo per tipi di memoria più veloci, dichiarando la compatibilità con DDR3-1867, e si è occupata della compatibilità con moduli ad alta efficienza energetica con tensioni operative di 1,25 e 1,35 V.

Parlando della modifica desktop di Bulldozer, che ha il proprio nome in codice Zambezi, va notato che si rivolge alla nuova piattaforma Socket AM3+, conosciuta anche con il nome in codice Scorpius. Il socket del processore Socket AM3+ ha 942 pin, un pin in più rispetto al Socket AM3. Ma nonostante ciò, Zambezi rimane compatibile con le vecchie schede Socket AM3. Quando si installano nuovi processori su vecchie schede madri, infatti, si perdono solo alcune funzioni di risparmio energetico. Pertanto, la velocità di commutazione della frequenza diminuisce quando sono in esecuzione le tecnologie Turbo Core e Cool"n"Quiet e Vdrop non funziona.

Tuttavia, per il rilascio di Zambezi, AMD e i produttori di schede madri hanno preparato una galassia di nuovi prodotti basati sui nuovi set logici della serie 900. La struttura di un tipico sistema basato sul processore Zambezi e costruito sul nuovo chipset è mostrata nello schema a blocchi sottostante.


Le differenze tra il nuovo chipset AMD 990FX (e le sue versioni semplificate AMD 990X e AMD 970) risiedono esclusivamente nel supporto delle proprietà elettriche specifiche del Socket AM3+ e non portano con sé alcuna nuova interfaccia. Come i chipset della serie 800, il nuovo South Bridge presenta sei porte SATA 6 Gbps e quattordici porte USB 2.0. Non importa quanto vorremmo vedere il supporto per la specifica PCI Express 3.0 o, nel peggiore dei casi, per le porte USB 3.0 nei nuovi set logici di sistema, anche questa volta non c'è niente del genere in essi. Questo, tra l'altro, è molto strano, perché il supporto USB 3.0 è stato introdotto nei chipset per la piattaforma Socket FM1 di livello inferiore.

Le differenze tra le modifiche della nuova serie di set logici di sistema consistono esclusivamente nel supporto di varie configurazioni multi-GPU.


Gamma di processori Zambezi

Il rilascio dei processori Zambezi completa l'aggiornamento della gamma di modelli offerta da AMD. I processori desktop basati sulla microarchitettura Bulldozer diventeranno la nuova offerta di punta di questo produttore e sostituiranno rapidamente tutti i tipi di modifiche Phenom II dal mercato.

Sottolineando l'innovazione della nuova microarchitettura, AMD utilizzerà un nuovo nome commerciale per i processori desktop Zambezi: FX. Da un lato si adatta perfettamente alla nuova nomenclatura, che prevede di contrassegnare i processori con lettere, e dall'altro è un riferimento ai leggendari processori Athlon 64 FX, che sei o sette anni fa erano le CPU desktop più veloci. Tuttavia, quei giorni sono irrimediabilmente passati, quindi vediamo cosa AMD è pronta a offrirci adesso.

Nel prossimo futuro la gamma di processori della serie FX comprenderà quattro modelli.



Nonostante la differenza tra i modelli di processori Zambezi non sia solo nella velocità di clock, ma anche nel numero di core di elaborazione attivi, saranno tutti basati sullo stesso chip a semiconduttore unificato. Ecco qui:



Per ottenere processori con meno di otto core, AMD ne disabiliterà alcuni sul chip a semiconduttore. La possibilità di sbloccarli nuovamente, come era possibile con i processori con microarchitettura K10, è ancora in discussione. Tuttavia, nel BIOS delle schede madri basate sui set logici della serie 900 che sono passate attraverso il nostro laboratorio, sono presenti le opzioni corrispondenti, quindi c'è speranza per una soluzione favorevole a questo problema.

La disabilitazione dei core per ottenere modifiche ai processori six-core e quad-core avverrà "modulo per modulo". Cioè, saranno gli interi moduli dual-core a essere bloccati, e non i “secondi” core al loro interno, anche se tale tattica sarebbe molto più vantaggiosa in termini di prestazioni. Tuttavia, il rilascio di processori six-core e quad-core basati sulla microarchitettura Bulldozer è spiegato non tanto da considerazioni di marketing quanto dalla necessità di implementare il rifiuto, che, date le dimensioni piuttosto grandi del chip e il nuovo processo tecnologico, sarà parecchio.

Nonostante AMD abbia perfezionato la nuova microarchitettura per funzionare a frequenze di clock elevate, non possiamo ancora definire i valori raggiunti una svolta impressionante. La barriera dei quattro gigahertz rimane insuperata e la frequenza nominale del vecchio processore FX è addirittura inferiore a quella, ad esempio, del Phenom II X4 980. Ci auguriamo che con il miglioramento della tecnologia di produzione, le frequenze dello Zambesi salgano rapidamente . Tuttavia, se si crede all'attuale versione dei piani di AMD, la linea verrà accelerata non prima del primo trimestre del 2012.

Non vi è alcun progresso in termini di rilascio di calore e consumo di energia. AMD ha parlato a lungo di come la microarchitettura Bulldozer sarà più efficiente dal punto di vista energetico, ma in realtà i vecchi modelli a otto core hanno lo stesso livello TDP del vecchio Phenom II. È vero, dopo un po' l'azienda dovrebbe aggiungere alla sua offerta una versione da 95 watt dell'FX-8120 e un processore FX-8100 con la stessa dissipazione del calore calcolata.

Ma i prezzi dei nuovi processori della serie FX sembrano più che interessanti. AMD non vuole deviare dalla sua linea di offerta di piattaforme ad un prezzo più favorevole rispetto ai suoi concorrenti, quindi i vecchi modelli Zambezi a otto core si oppongono ai vecchi processori Intel Core i5. In generale, AMD prevede di aderire al seguente schema di posizionamento per i suoi prodotti:



In altre parole, AMD non intende competere con i processori Intel a sei core e con la promettente piattaforma LGA2011, ma vuole concentrarsi sulla conquista del segmento di prezzo medio.

Una buona notizia per gli appassionati sarà il fatto che in tutti i processori della serie FX nessun moltiplicatore sarà bloccato. Tutti gli Zambezi non solo possono essere facilmente overcloccati semplicemente modificando il moltiplicatore di base, ma possono anche essere riconfigurati in modo simile con la tecnologia Turbo Core. Inoltre, è disponibile l'overclocking del sottosistema di memoria e la frequenza del North Bridge integrato nel processore.

Processore di prova: AMD FX-8150

AMD ha inviato ai nostri redattori il processore senior della famiglia Zambezi, FX-8150.



Ha una velocità di clock nominale di 3,6 GHz e informazioni più dettagliate sulle sue caratteristiche possono essere ottenute dallo screenshot fornito di CPU-Z.



Tieni presente che il processore si basa sullo stepping B2 – e questa non è la prima versione. Le precedenti modifiche al cristallo semiconduttore sono state rifiutate dal produttore perché non potevano funzionare alle frequenze di clock originariamente previste. Questo è ciò che ha causato un certo ritardo nell'annuncio, inizialmente previsto in primavera, poi in estate, ma di fatto avvenuto a metà ottobre.

Tuttavia, la frequenza di 3,6 GHz raggiunta oggi non sembra troppo impressionante. Sia la stessa AMD che Intel hanno prodotti che funzionano a velocità più elevate. Tuttavia, l'FX-8150 dispone di una tecnologia Turbo Core molto promettente, che, sotto carico basso, può aumentare automaticamente la frequenza del processore fino a 4,2 GHz.



È interessante notare che la frequenza di 3,9 GHz può essere raggiunta anche se il carico è su tutti i core di calcolo, ma allo stesso tempo lascia spazio all'overclock automatico senza andare oltre i limiti del consumo energetico e della dissipazione del calore.



Quando è inattivo, la tecnologia Cool"n"Quiet riduce la frequenza dell'FX-8150 a 1,4 GHz. La tensione di alimentazione scende a 0,85 V.


Come abbiamo testato

Abbiamo confrontato il nuovo processore AMD FX-8150 a otto core, costruito sulla microarchitettura Bulldozer, con uno dei suoi predecessori, il Phenom II X6 a sei core, e con le offerte concorrenti (di prezzo) di Intel: il Core i5-2500 quad-core. e processori Core i7-2600. Inoltre, per maggiore chiarezza, ai risultati sono stati aggiunti gli indicatori di prestazione del processore Core i7-990X a sei core.

Di conseguenza, i sistemi di test includevano i seguenti componenti software e hardware:

Processori:

AMD FX-8150 (Zambesi, 8 core, 3,6 GHz, 8 MB L2 + 8 MB L3);
AMD Phenom II X6 1100T (Thuban, 6 core, 3,3 GHz, 3 MB L2 + 6 MB L3);
Intel Core i7-2600K (Sandy Bridge, 4 core, 3,4 GHz, 1 MB L2 + 8 MB L3);
Intel Core i5-2500K (Sandy Bridge, 4 core, 3,3 GHz, 1 MB L2 + 6 MB L3);
Intel Core i7-990X Extreme Edition (Gulftown, 6 core, 3,46 GHz, 1,5 MB L2 + 12 MB L3).

Dispositivo di raffreddamento della CPU: NZXT Havik 140;
Schede madri:

Gigabyte 990FXA-UD5 (Presa AM3+, AMD 990FX + SB950);
ASUS P8Z68-V PRO (LGA1155, Intel Z68 Express);
Gigabyte X58A-UD5 (LGA1366, Intel X58 Express).

Memoria:

2x2 GB, SDRAM DDR3-1600, 9-9-9-27 (Kingston KHX1600C8D3K2/4GX);
3 x 2 GB, SDRAM DDR3-1600, 9-9-9-27 (Crucial BL3KIT25664TG1608).

Scheda grafica: AMD Radeon HD 6970.
Disco rigido: Kingston SNVP325-S2/128 GB.
Alimentazione: Tagan TG880-U33II (880 W).
Sistema operativo: Microsoft Windows 7 SP1 Ultimate x64.
Autisti:

Driver del chipset Intel 9.2.0.1030;
Driver del motore di gestione Intel 7.1.10.1065;
Tecnologia Intel Rapid Storage 10.6.0.1022;
Driver video AMD Catalyst 11.10.

Tieni presente che i test sono stati eseguiti con la versione attuale del sistema operativo Windows 7, ma AMD indica che il task manager di questo sistema operativo non distribuisce i thread di elaborazione nel modo ottimale. Windows 7 preferisce principalmente indirizzare i thread ai kernel situati in moduli diversi. E questo garantisce prestazioni specifiche davvero più elevate, poiché riduce il carico sui blocchi suddivisi all'interno del modulo. Tuttavia, questa strategia impedisce l'inclusione della modalità turbo, che potrebbe essere utilizzata dal processore se alcuni dei moduli dual-core fossero in modalità di risparmio energetico.

Il prossimo sistema operativo Windows 8 seguirà una tattica diversa e i thread verranno assegnati prima ai core all'interno dello stesso modulo. Di conseguenza, AMD promette che in una serie di applicazioni le prestazioni dei sistemi basati su Zambesi potranno aumentare fino al 10%.

Prestazione

Valutazione preliminare dell'efficacia della microarchitettura Bulldozer

Prima di iniziare i test "reali" dei processori, abbiamo deciso di capire cosa potevamo aspettarci in linea di principio dalla microarchitettura Bulldozer. Per fare ciò, abbiamo condotto un piccolo confronto tra un processore con questa microarchitettura e altre CPU con microarchitetture K10 e Sandy Bridge in condizioni uguali create artificialmente: alla stessa frequenza di clock e con lo stesso numero di core attivati.

Più specificamente, abbiamo confrontato l'AMD FX-8150, il Phenom II X6 1100T ed il Core i7-2600 a 3,6 GHz con solo due core di elaborazione abilitati. Per la purezza dell'esperimento, tutte le tecnologie di risparmio energetico e overclocking automatico sono state naturalmente disattivate. Come strumento di test, abbiamo scelto una serie di semplici benchmark sintetici inclusi nell'utility SiSoft Sandra 2011, in cui abbiamo disabilitato forzatamente tutti i set di istruzioni precedenti a SSE3, poiché non sono supportati nella microarchitettura K10.



I numeri nella tabella parlano più di qualsiasi parola. Le prestazioni della microarchitettura Bulldozer sono diventate molto inferiori a quelle dei processori precedenti. La combinazione di coppie di core in un modulo con risorse condivise e la conseguente semplificazione della microarchitettura hanno portato al fatto che alla stessa frequenza, le prestazioni specifiche di Bulldozer per core sono diminuite del 25-40% rispetto alla microarchitettura AMD della generazione precedente. Di conseguenza, i core Bulldozer sono quasi la metà più lenti dei core Sandy Bridge. Inoltre, le prestazioni del modulo processore Bulldozer, che include due core, sono addirittura inferiori alla velocità di un singolo core Sandy Bridge con tecnologia Hyper-Threading abilitata. Dovremmo aspettarci record di prestazioni da un processore costruito su una microarchitettura di questo tipo? La domanda è retorica.

Lungo il percorso, diamo un'occhiata alle caratteristiche pratiche delle cache e del sottosistema di memoria. Per valutare la velocità di funzionamento di queste unità funzionali, abbiamo condotto test nell'utilità Cachemem dal pacchetto Aida64. In tutti i casi è stata utilizzata la memoria DDR3-1600 con latenze di 9-9-9-27-1T. Proprio come nel caso precedente, le frequenze del processore sono rimaste allineate a 3,6 GHz.



Nello Zambezi, rispetto ai processori Phenom II, le latenze pratiche sia di tutte le cache che del sottosistema di memoria sono aumentate. Ne abbiamo parlato considerando la microarchitettura Bulldozer. Tuttavia, modificando l'organizzazione logica della memoria cache, il suo rendimento è aumentato in quasi tutti i casi.

Allo stesso tempo, in Sandy Bridge sono implementati il ​​controller di memoria a doppio canale più veloce e il sottosistema cache più veloce. Sebbene, ovviamente, in termini di capacità della cache, il processore Intel sia leggermente inferiore alla microarchitettura multimediale Bulldozer.

Prestazioni complessive

Per valutare le prestazioni del processore nelle attività comuni, utilizziamo tradizionalmente il test Bapco SYSmark 2012, che simula il lavoro dell'utente nei comuni programmi e applicazioni per ufficio moderni per la creazione e l'elaborazione di contenuti digitali. L'idea del test è molto semplice: produce un'unica metrica che caratterizza la velocità media ponderata del computer nelle applicazioni comuni.

Ricordiamo che qualche tempo fa AMD ha provato a trollare SYSmark, diffondendo accuse secondo cui era parziale a causa dell'utilizzo di un set “sbagliato” di applicazioni reali. Tuttavia, a nostro avviso, un simile giudizio non è giustificato, poiché per valutare le prestazioni vengono utilizzati programmi comuni e molto popolari, il cui contributo al risultato finale è mostrato nel seguente diagramma:



Pertanto, non abbiamo abbandonato l'uso di SYSmark 2012 e continuiamo a utilizzare i suoi parametri per valutare le prestazioni comuni.



Il primo test è una vera delusione. Il risultato dell'FX-8150 a otto core è migliore solo del 10% rispetto alle prestazioni del Phenom II X6 1100T a sei core e, naturalmente, non raggiunge affatto le prestazioni dei processori Intel quad-core. Quindi la tattica scelta da AMD di implementare nel processore un gran numero di core con basse prestazioni specifiche invece di un numero moderato di core complessi, in generale, non dà un risultato positivo.

Una comprensione più approfondita dei risultati di SYSmark 2012 può fornire informazioni dettagliate sui punteggi prestazionali ottenuti in vari scenari di utilizzo del sistema.

Lo scenario Produttività in ufficio simula il tipico lavoro d'ufficio: scrivere testi, elaborare fogli di calcolo, lavorare con la posta elettronica e navigare in Internet. Lo script utilizza il seguente set di applicazioni: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 e WinZip Pro 14.5.



Lo scenario Creazione multimediale simula la creazione di uno spot pubblicitario utilizzando immagini e video digitali pre-girati. A questo scopo vengono utilizzati i popolari pacchetti Adobe: Photoshop CS5 Extended, Premiere Pro CS5 e After Effects CS5.



Il Web Development è uno scenario all'interno del quale si modella la creazione di un sito web. Applicazioni utilizzate: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 e Microsoft Internet Explorer 9.



Lo scenario Analisi dati/finanziaria è dedicato all'analisi statistica e alla previsione delle tendenze di mercato, eseguita in Microsoft Excel 2010.



Lo script di modellazione 3D riguarda la creazione di oggetti tridimensionali e il rendering di scene statiche e dinamiche utilizzando Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 e Google SketchUp Pro 8.



L'ultimo scenario, Gestione del sistema, prevede la creazione di backup e l'installazione di software e aggiornamenti. Qui vengono utilizzate diverse versioni di Mozilla Firefox Installer e WinZip Pro 14.5.



A vari modelli L'utilizzo di un processore con la microarchitettura Bulldozer dimostra risultati fondamentalmente diversi. In alcuni casi risulta essere addirittura più lento del Phenom II X6, ma ci sono anche situazioni opposte. In generale, la regola generale è questa: il vantaggio dell'FX-8150 diventa particolarmente evidente dove il carico di lavoro è multi-thread e ben parallelizzato, ma non computazionalmente complesso.

Tuttavia, anche nelle situazioni più favorevoli, l'FX-8150 resta indietro rispetto al Core i5-2500. L'unico scenario in cui questi processori sono paragonabili in termini di velocità è il rendering 3D. In media, l'offerta di Intel supera il nuovo prodotto di AMD di un impressionante 25%. Purtroppo.

Prestazioni di gioco

Come sapete, le prestazioni delle piattaforme dotate di processori ad alte prestazioni nella stragrande maggioranza dei giochi moderni sono determinate dalla potenza del sottosistema grafico. Ecco perché, quando testiamo i processori, proviamo a condurre test in modo tale da rimuovere il più possibile il carico dalla scheda video: vengono selezionati i giochi più dipendenti dal processore e i test vengono eseguiti senza attivare l'anti- aliasing e con impostazioni che non sono alle risoluzioni più elevate. Cioè, i risultati ottenuti consentono di valutare non tanto il livello di fps ottenibile nei sistemi con schede video moderne, ma quanto bene si comportano i processori con un carico di gioco in linea di principio. Pertanto, sulla base dei risultati presentati, è del tutto possibile speculare su come si comporteranno i processori in futuro, quando sul mercato appariranno opzioni più veloci per gli acceleratori grafici.


















I giochi non appartengono alla categoria delle attività che generano un carico multi-thread parallelizzato. Pertanto, per le applicazioni di gioco di oggi, i processori a quattro core sono più adatti e non quei mostri multi-core offerti da AMD. Vediamo una chiara illustrazione di questa affermazione nei diagrammi seguenti. Il nuovo FX-8150 a otto core non è più veloce del suo predecessore a sei core, il Phenom II X6.

Per quanto riguarda il rapporto tra le prestazioni di gioco tra Zambezi e Sandy Bridge, AMD è ancora molto più pessimista per il nuovo prodotto. L'attuale microarchitettura dei processori Intel gestisce molto meglio il tipico carico di lavoro generato dai giochi 3D, e non c'è speranza che AMD riesca mai a raggiungere i processori della concorrenza in questa categoria di compiti. In altre parole, l'utilizzo di Bulldozer nei sistemi di gioco può avere senso solo quando si ha la certezza che le prestazioni di un determinato processore siano sufficienti per uno specifico sottosistema video in uno specifico set di giochi. Tuttavia, anche in questo caso, devi renderti conto che con il prossimo aggiornamento dell'acceleratore video potresti rimanere in grave svantaggio rispetto a quegli utenti che inizialmente preferivano la piattaforma e i moderni processori Intel.

Oltre ai test gaming, presenteremo anche i risultati del benchmark sintetico Futuremark 3DMark 11, lanciato con il profilo Extreme.



Lo scopo di aggiungere questi risultati era quello di mostrare la situazione ideale per l'FX-8150, quando il sottosistema video non consente di sfruttare appieno la potenza del processore. Qui il carico principale ricade sulla scheda video e il processore svolge solo un ruolo di supporto. In questi casi, possiamo parlare di pari prestazioni dei processori Bulldozer e Sandy Bridge, anche se, ovviamente, questo non è del tutto vero.



Tuttavia, l'FX-8150 sembra buono (rispetto ai risultati precedenti) anche nel test fisico 3DMark 11. Quando si calcola un modello fisico di gioco in modalità multi-thread, il nuovo processore AMD a otto core funziona ad una velocità paragonabile alle prestazioni di un quad-core Core i5-2500.

Test nelle applicazioni

Nel complesso, la media ponderata di Bulldozer e le prestazioni di gioco su desktop sono state ben al di sotto delle nostre aspettative. Tuttavia, non disperiamo e proviamo a trovare quei casi in cui la nuova microarchitettura AMD è in grado di mostrare i suoi punti di forza.

Per misurare la velocità dei processori durante la compressione delle informazioni, utilizziamo l'archiviatore WinRAR, con il quale archiviamo una cartella con vari file con un volume totale di 1,4 GB con il rapporto di compressione massimo.



Il risultato dell'FX-8150 è vicino al Core i5-2500. WinRAR non è una delle applicazioni in grado di parallelizzare i suoi calcoli su tutti gli otto core Bulldozer, ma la gigantesca memoria cache sembra salvare la situazione.

Il secondo test simile per la velocità di archiviazione viene eseguito nel programma 7-zip, utilizzando l'algoritmo di compressione LZMA2.



In 7-zip, le prestazioni dell'FX-8150 sono encomiabili. Questo processore a otto core riesce ad avvicinarsi alla velocità del quad-core Core i7-2600, che include il supporto per Hyper-Threading e che, come Bulldozer, può eseguire otto thread contemporaneamente.

Le prestazioni di crittografia dei processori sono misurate dal benchmark integrato della popolare utility crittografica TrueCrypt. Va notato che non solo è in grado di caricare in modo efficiente un numero qualsiasi di core con lavoro, ma supporta anche un set specializzato di istruzioni AES.



Algoritmi interi semplici e ben parallelizzati sono ciò di cui ha bisogno la microarchitettura Bulldozer. In questi casi, come vediamo, si possono ottenere prestazioni davvero eccezionali. In particolare, per quanto riguarda la crittografia, l'FX-8150 è dietro solo al Core i7-990X a sei core ed è davanti a tutti i processori per la piattaforma LGA1155.

Quando si testa la velocità della transcodifica audio, viene utilizzata l'utilità Apple iTunes, che converte il contenuto di un CD in formato AAC. notare che tratto caratteristico Questo programma è in grado di utilizzare solo un paio di core del processore.



È meglio tenere lontani da Bulldozer i programmi che generano un numero limitato di thread computazionali. Alcuni core di questa CPU sono troppo deboli per mostrare risultati decenti in questi casi.

Misuriamo le prestazioni in Adobe Photoshop utilizzando il nostro test, che è stato rielaborato in modo creativo Test di velocità di Photoshop per ritocchi artisti, che prevede l'elaborazione tipica di quattro immagini da 10 megapixel scattate con una fotocamera digitale.



In Photoshop, le prestazioni dell'FX-8150 non sono così disastrose come quelle dei processori con microarchitettura K10, ma sono comunque molto inferiori a quelle del Core i5-2500. Ovviamente, una grande memoria cache è di grande aiuto per la microarchitettura Bulldozer in questo caso, ma questo da solo non ti porterà lontano. L'efficienza e le prestazioni specifiche dei core di calcolo sono ancora di fondamentale importanza.

L'abbiamo testato anche in Adobe Photoshop Lightroom 3. Lo scenario di prova prevedeva la post-elaborazione e l'esportazione in JPEG di cento immagini da 12 megapixel in formato RAW.



Lightroom può parallelizzare l'elaborazione delle foto su qualsiasi numero di core, e quindi l'FX-8150 a otto core mostra buoni risultati qui. Tuttavia, "non male" è un concetto relativo in questo caso; infatti, le sue prestazioni sono paragonabili solo a quelle del Core i5-2500. Ciò significa che due core Bulldozer equivalgono ad un core Sandy Bridge senza supporto Hyper-Threading.

Le prestazioni in Adobe Premiere Pro vengono testate misurando il tempo di rendering nel formato Blu-Ray H.264 di un progetto contenente video HDV 1080p25 con vari effetti applicati.



Anche i processori AMD della generazione precedente gestivano bene la transcodifica video. La microarchitettura Bulldozer ha consentito un leggero aumento delle prestazioni in applicazioni di questo tipo e, di conseguenza, l'FX-8150 è persino più veloce del Core i5-2500.

La velocità dell'editing video utilizzando Adobe After Effects è stata valutata misurando il tempo di esecuzione di un set predefinito di filtri ed effetti, tra cui sfocatura, creazione di rilievi, fusione di fotogrammi, creazione di bagliori, aggiunta di motion defocus, ombreggiatura, manipolazione 2D e 3D, inversione, eccetera.



Nonostante il carico sia ben parallelizzato, l'FX-8150 resta indietro rispetto ai concorrenti Intel in After Effects.

Per misurare la velocità di transcodifica video nel formato H.264 viene utilizzato il test x264 HD, basato sulla misurazione del tempo di elaborazione del video sorgente in formato MPEG-2, registrato con una risoluzione di 720p con un flusso di 4 Mbit/sec. Va notato che i risultati di questo test sono di grande importanza pratica, poiché il codec x264 utilizzato è alla base di numerose utilità di transcodifica popolari, ad esempio HandBrake, MeGUI, VirtualDub, ecc.






Durante la transcodifica video con il codec x264, i processori AMD hanno sempre mostrato buone prestazioni. Con il rilascio della microarchitettura a otto core, i risultati sono ulteriormente aumentati e ora l'FX-8150 supera anche il Core i7-2600 nel secondo passaggio di codifica, più dispendioso in termini di risorse. Quindi, con notevole difficoltà, abbiamo finalmente trovato una seconda applicazione, oltre a TrueCrypt, dove le prestazioni del processore con microarchitettura Bulldozer meritano recensioni lusinghiere.

Misuriamo le prestazioni di elaborazione e la velocità di rendering in Autodesk 3ds max 2011 utilizzando il test specializzato SPECapc. A partire da questi test stiamo iniziando a utilizzare la nuova versione professionale di SPECapc per 3ds Max 2011.






Il rendering è anche uno dei compiti soggetti a ottimizzazione per le microarchitetture multi-core. Ma nonostante ciò, l'FX-8150 è ancora più lento del Core i5-2500 e del Core i7-2600, per non parlare del Core i7-990X. D'altra parte, non esiste una situazione vergognosa in cui un nuovo processore AMD perde rispetto al suo predecessore.

Facendo la media dei risultati tra le singole applicazioni, l'FX-8150 è stato circa il 14% più veloce del Phenom II X6 1100T sul nostro set di applicazioni. E questo gli ha permesso di ottenere prestazioni non peggiori del Core i5-2500 in poco meno della metà dei casi. Tuttavia, il divario con il prossimo modello Sandy Bridge, Core i7-2600, rimane significativo e ammonta a oltre il 10%.

Consumo di energia

Nonostante siamo riusciti a trovare una serie di attività in cui le prestazioni di Bulldozer possono essere definite accettabili, i processori basati sulla nuova microarchitettura non sembrano affatto rivoluzionari. L'unica speranza rimane per il consumo energetico, perché in precedenza i processori AMD erano più che significativamente inferiori ai loro concorrenti in questo parametro. Ora, se si crede alle promesse degli sviluppatori, la microarchitettura si è concentrata maggiormente sull'efficienza energetica e il nuovo processo tecnologico a 32 nm avrebbe dovuto contribuire a migliorare le caratteristiche elettriche. Diamo quindi un'occhiata all'FX-8150 attraverso la lente delle prestazioni per watt.

I grafici seguenti, se non diversamente specificato, mostrano il consumo totale del sistema (senza monitor), misurato “dopo” l'alimentazione e rappresenta la somma dei consumi di tutti i componenti coinvolti nel sistema. In questo caso non viene presa in considerazione l'efficienza dell'alimentatore stesso. Durante le misurazioni, il carico sui processori è stato creato dalla versione a 64 bit dell'utility LinX 0.6.4. Inoltre, per stimare correttamente il consumo energetico in idle, abbiamo attivato tutte le tecnologie di risparmio energetico disponibili: C1E, C6, AMD Cool"n"Quiet e Enhanced Intel SpeedStep.



In modalità inattiva, il consumo dei sistemi con processori basati sulla microarchitettura Bulldozer è diventato inferiore a quello di sistemi simili con CPU della famiglia Phenom II. Tuttavia, i moderni sistemi Intel LGA1155 consumano molto meno in modalità inattiva.



Nel caso in cui il carico di calcolo sia a thread singolo, il consumo dei sistemi Socket AM3+ aumenta notevolmente, ovviamente a causa dell'elevata aggressività della tecnologia Turbo Core. Questo non è il caso dei sistemi basati su processori Intel, che possono vantare ancora una volta un'efficienza energetica significativamente più elevata.



Con un carico multi-thread completo, la situazione non è molto diversa. È solo il sistema con il processore LGA1366 Core i7-990X che "è andato avanti". Per il resto è tutto come prima. In termini di consumo energetico, l'FX-8150 non vanta particolari successi. Ha iniziato a consumare un po 'meno del Phenom II X6 1100T, ma i processori Sandy Bridge sono almeno una volta e mezza più economici.

AMD ha sfruttato tutta l'efficienza energetica ottenuta attraverso l'introduzione di una nuova microarchitettura per aumentare le frequenze di clock. E, di conseguenza, non vediamo né un nuovo livello di efficienza né prestazioni sostanzialmente migliorate. Di conseguenza, in termini di prestazioni per watt, Bulldozer, come i suoi predecessori, è seriamente inferiore alle microarchitetture concorrenti di Intel.

Per riferimento, presentiamo il consumo a pieno carico, misurato separatamente nei circuiti di alimentazione del processore e della scheda madre.






Il consumo "puro" dell'FX-8150 a otto core è circa il doppio di quello dei processori Sandy Bridge. Considerando che entrambi i processori sono prodotti utilizzando lo stesso processo tecnologico e hanno tensioni di core simili, diventa incredibilmente interessante cosa intendesse AMD quando parlava di efficienza energetica della sua microarchitettura Bulldozer.

Overclocking

La piattaforma Socket AM3+ e i processori della serie FX sono inizialmente posizionati come overclocker. Ciò è dimostrato sia dallo sblocco completo di tutti i moltiplicatori sia dagli esperimenti condotti sotto l'egida di AMD, in cui è stato stabilito un record mondiale di overclocking utilizzando uno dei processori FX-8150. Anche le dichiarazioni dell'azienda secondo cui la nuova microarchitettura è ottimizzata per il funzionamento a frequenze di clock elevate sembrano promettenti. Avremo davvero un nuovo miracolo dell'overclocking da AMD? Controlliamo.

Overclockare qualsiasi processore FX è molto semplice, non per niente sul loro logo c'è scritto "Unlocked". La frequenza del processore può essere modificata mediante un moltiplicatore tramite la configurazione del BIOS o tramite utilità specializzate fornite sia dalla stessa AMD (Overdrive Utility) che dai produttori della scheda madre. Allo stesso modo, nei sistemi Socket AM3+, è possibile overcloccare il northbridge e la memoria integrata nel processore.

Durante i test siamo riusciti a ottenere un funzionamento stabile del nostro FX-8150 ad una frequenza di 4,6 GHz. Per garantire la stabilità in questo stato, la tensione di alimentazione del processore doveva essere aumentata a 1,475 V e, inoltre, era necessario abilitare la funzione Load-Line Calibration. Durante i test di stabilità, la temperatura del processore funzionante a questa frequenza non ha superato gli 85 gradi secondo il sensore della presa o i 75 gradi secondo il sensore integrato nel processore. Per eliminare il calore ricordiamo che è stato utilizzato un efficiente raffreddatore ad aria NZXT Havik 140.



Tieni presente che allo stesso tempo abbiamo provato a overcloccare il north bridge integrato nella CPU, poiché l'aumento della sua frequenza ha un effetto positivo sulla velocità della cache di terzo livello e del controller di memoria. Tuttavia, sfortunatamente, un significativo overclock di questo nodo del processore ha incontrato una barriera invisibile e non è riuscito a raggiungere una frequenza superiore a 2,4 GHz, anche se abbiamo provato contemporaneamente ad aumentare la sua tensione di alimentazione.

In ogni caso, l'overclock dell'FX-8150 a 4,6 GHz è un buon risultato, soprattutto considerando il fatto che i processori AMD della famiglia Phenom II venivano raramente overclockati in aria oltre i 4,0 GHz. In altre parole, la microarchitettura Bulldozer ha effettivamente permesso di spingere leggermente più in alto il limite di frequenza.

Tuttavia, l'overclocking dei processori FX dovrebbe essere confrontato, prima di tutto, non con il vecchio Phenom II, ma con i processori Core i5 e Core i7 concorrenti per i sistemi LGA1155. Ma chiaramente non accelerano peggio. Ad esempio, un overclock abbastanza tipico per il Core i5-2500K con un aumento di tensione di 0,15 V sopra il nominale e utilizzando un raffreddatore ad aria è di 4,7 GHz. E in questo contesto il risultato dell'FX-8150 non sembra più così brillante.

L'impressione di overclockare lo Zambezi si deteriora ancora di più se confrontiamo le prestazioni dell'FX-8150 overcloccato e del Core i5-2500K overcloccato (l'aumento delle prestazioni rispetto alla modalità nominale è indicato tra parentesi):



In generale, l'overclocking non cambia la qualità dei risultati. Ma laddove l'FX-8150 era più veloce in modalità nominale, il divario si è ridotto. E dove il Core i5-2500 era in testa, ha consolidato il suo vantaggio. Non sorprende: la frequenza dell'FX-8150 in overclock è aumentata del 28%, mentre l'aumento della frequenza del Core i5-2500K è stato del 42%. E in generale, come si può giudicare dall'entità del guadagno in termini di prestazioni derivante dall'overclocking, la microarchitettura Sandy Bridge reagisce in modo più sensibile all'aumento delle frequenze. In altre parole, anche se teniamo conto dell'overclocking, i processori con microarchitettura Bulldozer, sebbene si overclockino abbastanza bene, non sembrano più forti dei concorrenti Intel.

conclusioni

Successo o fallimento? Sicuramente molti di voi vorranno vedere un verdetto chiaro alla fine dell'articolo. Tuttavia, in questo caso, tutto è molto ambiguo e AMD ha messo i revisori in una posizione molto difficile con il suo Bulldozer.

Il fatto è che AMD ha dimostrato un approccio completamente non standard allo sviluppo della microarchitettura. Considerando che le prestazioni del processore sono costituite da tre componenti: numero di istruzioni eseguite nel core del processore per ciclo di clock, frequenza e numero di core, gli sviluppatori hanno spostato le loro priorità sul numero di core. Allo stesso tempo, le prestazioni specifiche dei singoli core sono state ridotte, ma il design risultante ha aperto la strada alla creazione di processori economici a otto core o anche più complessi. Si tratta di una mossa molto forte per il mercato dei server, dove i carichi multi-thread la fanno da padrone e i processori con un gran numero di core sono molto richiesti. Quindi, è molto probabile che la nuova microarchitettura Bulldozer consentirà ad AMD di migliorare significativamente la propria posizione nel mercato dei server ad alte prestazioni.

Tuttavia, oggi abbiamo conosciuto il processore FX, costruito su questa microarchitettura, ma destinato ai computer desktop. Ed è qui che la discrepanza tra le capacità hardware di Bulldozer e i tipici carichi di lavoro desktop è diventata pienamente evidente. È particolarmente deludente che la campagna di marketing sia stata strutturata in modo tale da indurre molti a credere in Bulldozer come una stella nascente nel mercato dei desktop. Tuttavia, queste speranze non erano destinate a realizzarsi.


I processori FX, basati sulla microarchitettura Bulldozer, sono stati in grado di dimostrare i loro punti di forza solo in un piccolo sottoinsieme di compiti risolti dagli utenti ordinari. Tra le tipiche applicazioni comuni, non ci sono molti esempi che generano un semplice carico di lavoro multi-thread intero e le elevate prestazioni di Bulldozer si rivelano solo in questo caso. Di conseguenza, in alcuni casi Bulldozer si è rivelato non solo più lento delle soluzioni concorrenti di Intel, ma anche peggiore del processore Phenom II X6, costruito sulla microarchitettura della generazione precedente. Ciò significa che AMD non è riuscita a produrre un processore desktop rivoluzionario.

In effetti, FX è solo il prossimo Phenom, che sembra essere abbastanza buono di per sé, soprattutto rispetto ai suoi predecessori. I processori FX sono generalmente più veloci del Phenom II, si overclockano significativamente meglio e hanno un consumo leggermente inferiore, quindi possono essere considerati un buon sostituto per i portatori della obsoleta microarchitettura K10.

Tuttavia, ricordiamo che AMD è in guerra non solo con se stessa, ma anche con Intel. Pertanto, siamo ancora costretti a esprimere la deludente conclusione che i processori FX hanno senso solo in quei desktop focalizzati sull'elaborazione video e sulla transcodifica. In altri casi, rispetto ai processori Sandy Bridge, le loro prestazioni raramente sembrano incoraggianti. Lo stesso si può dire del consumo energetico e dell'overclocking. Separatamente, va aggiunto che i processori AMD FX, come previsto, si sono rivelati una cattiva opzione per i sistemi di gioco, poiché i moderni giochi 3D praticamente non utilizzano algoritmi veramente multi-thread. Tuttavia, i fan dei prodotti AMD probabilmente riusciranno a sopportarlo, dato che il numero di fotogrammi al secondo nei giochi è spesso limitato dalla grafica e non dal processore.

In altre parole, le prospettive di mercato per i processori FX dipenderanno da due fattori: quanto è grande l'esercito dei sostenitori di AMD; e da quanto abilmente il produttore gestirà la leva del prezzo. Tuttavia, non si prevede chiaramente che i processori desktop con la microarchitettura Bulldozer diventeranno molto popolari.

Il recente annuncio degli ultimi processori AMD è diventato uno degli eventi più emozionanti di quest'anno. L’intensa attesa, alimentata da numerose fughe di informazioni e slide segrete, ha lasciato in pace non solo i fan del campo bianco-verde, ma anche gli aderenti ai prodotti dell’azienda concorrente. I dati sulle prestazioni erano contrastanti, spaziando da uno schiacciante vantaggio rispetto ai concorrenti al completo fallimento. Nessuno metterà in dubbio l'affermazione secondo cui la microarchitettura Stars, che è alla base di tutte le attuali soluzioni desktop di AMD, è oggi piuttosto obsoleta. Le capacità dei successori dei leggendari processori K8, AMD Phenom II e Athlon II non soddisfano più le realtà moderne. Ecco perché il lancio di processori basati sull'architettura fondamentalmente nuova Bulldozer era estremamente necessario. Ciò consentirebbe di eguagliare o addirittura superare le soluzioni della concorrenza in termini di prestazioni ed efficienza energetica. Il vantaggio in termini di prestazioni dovrebbe essere fornito da un'architettura a otto core fondamentalmente nuova e l'introduzione di un sottile processo tecnologico a 32 nm, insieme a capacità "avanzate" per il controllo di tensioni e frequenze dei singoli blocchi funzionali, promette una significativa riduzione della potenza consumo rispetto alle soluzioni della generazione precedente.

Finalmente, il 12 ottobre, il velo della segretezza è stato strappato: è stato allora che ha avuto luogo il tanto atteso annuncio dei processori AMD FX, basati sulla microarchitettura Bulldozer. Il produttore di chip ha presentato un'intera linea di CPU basate su questa microarchitettura, che comprende modelli a quattro, sei e otto core. Tra le altre cose, AMD ha rilanciato il marchio "FX", che era il nome precedentemente utilizzato per i prodotti per appassionati. In effetti, tutti i processori AMD FX dell'attuale generazione hanno un moltiplicatore sbloccato per l'aumento, che, in teoria, dovrebbe renderli attraenti per gli overclocker. Variando in modo flessibile il numero di unità funzionali e frequenze operative, AMD è riuscita a riempire quasi tutte le principali nicchie di mercato, dai sistemi di gioco a basso costo alle offerte per configurazioni nella fascia di prezzo più alta. La gamma completa degli ultimi processori AMD rispetto ai Phenom II a quattro e sei core si presenta così:

FX8150 FX8120 FX6100 FX4100 Fenomeno II X6 Fenomeno II X4
Nucleo Zambesi Zambesi Zambesi Zambesi Thuban Deneb
Connettore Presa AM3/AM3+ Presa AM3/AM3+ Presa AM3/AM3+ Presa AM3/AM3+ Presa AM2+/AM3 Presa AM2+/AM3
Tecnologia di processo CPU, nm 32 32 32 32 45 45
Numero di transistor, milioni 2000 2000 2000 2000 904 758
Zona Cristalli, mq. mm 315 315 315 315 346 243
Numero di core 8 8 6 4 6 4
Frequenza nominale, MHz 3600 3100 3600 3100 2600 — 3300 3200 — 3700
Frequenza Turbo Core, MHz 3900/4200* 3400/4000* 3300/3900* 3600/3800* 3100 — 3700
Frequenza NB, MHz 2200 2200 2200 2200 2000 2000/1800
Dimensioni della cache L1, KB 16×8 + 64×4 16×8 + 64×4 16×6 + 64×3
16×4 + 64×2 128×6 128×4
Dimensioni della cache L2, KB 2048×4
2048×4
2048×4
2048×4
512×6
512×4
Volume della cache L3, MB 8 8 8 8 6 6
Fattore 18 15,5 16,5 18 13 — 16,5 16 — 18,5
Canali di memoria 2 2 2 2 2 2
Tipo di memoria supportata DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR3 1333/1600/1866 DDR2 800/1066, DDR3 1333/1600
Bus per la comunicazione con il chipset Ipertrasporto 3.1 Ipertrasporto 3.1 Ipertrasporto 3.1 Ipertrasporto 3.1 Ipertrasporto 3.0 Ipertrasporto 3.0
Frequenza dell'ipertrasporto, MHz 5200 5200 5200 5200 4000 4000
Tensione operativa, V 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4 0,825-1,4
TDP, W 125 125 95 95 125 125
Prezzo consigliato, $ 245 205 165 115 165 — 205 117 — 185

Se chiudi gli occhi sul numero di core di elaborazione, rispetto ai loro predecessori, i processori FX hanno ricevuto un bus Hyper Transport 3.1 più veloce, supporto per memoria DDR3 1866 MHz ad alta velocità e una cache di livello 3 aumentata a 8 MB. Inoltre, attiriamo la vostra attenzione sulle frequenze di clock abbastanza elevate, che sono molto vicine, e in alcuni casi addirittura superano la soglia dei 4000 MHz. In base al prezzo consigliato, il processore quad-core FX 4100 dovrebbe competere con il dual-core Sandy Bridge ed il più giovane Phenom II X4; I concorrenti dell'FX 6100 a sei core saranno i modelli più giovani Core i5 e Phenom II X6 a sei core. Gli otto core FX 8120 e FX 8150 giocano nella "major league", governata dai vecchi Core i5 e Core i7, che finora hanno mostrato un eccellente livello di prestazioni. Come potete vedere, il posizionamento dei nuovi processori AMD FX li obbliga a rimanere al livello di rivali molto seri, quindi sarà molto difficile per i principianti!

Microarchitettura del bulldozer: struttura e caratteristiche operative

Prima di tutto, va notato che AMD FX sono processori centrali di razza e non hanno un core grafico. Naturalmente, a questo proposito, si può accusare AMD di incoerenza, perché la promozione del mercato delle APU (Accelerated Processing Unit) è una delle principali iniziative strategiche dell'azienda. Invece di un adattatore video integrato, gli utenti ricevono la piena compatibilità di AMD FX con la potente piattaforma Socket AM3/AM3+, che offre molte eccellenti schede madri e supporta tutte le attuali capacità di espansione. AMD ha rilasciato una nona serie aggiornata di set di logica di sistema appositamente per i processori FX.


Ricordiamo le caratteristiche principali del chipset di punta AMD 990FX. Permette quindi di realizzare configurazioni grafiche AMD CrossFireX e NVIDIA SLI; grazie al South Bridge, l'SB950 supporta lo standard SATA 6 Gb/s, ma non ha la possibilità di collegare dispositivi USB 3.0. Per quanto riguarda le schede madri Socket AM3 basate su set logici di sistema delle generazioni precedenti, dopo aver aggiornato il microcodice firmware dovranno supportare anche Bulldozer. Ma questo dipende già dal modello specifico.

Uno di caratteristiche chiave I processori basati sulla microarchitettura Bulldozer hanno rappresentato il passaggio al processo litografico a 32 nm, utilizzato con grande successo dal suo principale concorrente, Intel, per quasi due anni. Oltre a ridurre potenzialmente il consumo energetico e migliorare il potenziale di overclocking, questo fatto ha avuto un impatto positivo sul costo di produzione dei cristalli semiconduttori. AMD non può più essere definita una nuova arrivata nello sviluppo della tecnologia di processo a 32 nm: è con questo livello di dettaglio che vengono prodotte le APU Llano di discreto successo, che, sebbene non abbiano ottenuto riconoscimenti tra gli appassionati, sono eccellenti per la costruzione poco costose e PC universali compatti. Grazie all'applicazione tecnologie moderne Il chip di produzione (nonostante contenga quasi 2000 milioni di transistor) si è rivelato molto compatto. L'AMD FX 8150 a otto core ha un'area del core di soli 315 mm², che è più piccola dell'ammiraglia della generazione precedente Phenom II X6, il cui die occupa fino a 346 mm². Tuttavia, i processori AMD FX sono ancora lontani dalle prestazioni dei processori quad-core Sandy Bridge, poiché nei primi il chip, nonostante la presenza di un acceleratore grafico integrato, occupa solo 216 mm².

Le principali innovazioni apportate alla microarchitettura Bulldozer hanno interessato l'algoritmo per l'esecuzione di calcoli multi-thread. Per molto tempo, le unità di elaborazione centrale sono state in grado di eseguire un singolo thread di calcolo alla volta. La cosiddetta operazione simultanea di più programmi è stata effettuata utilizzando un gestore di interruzioni, ovvero le attività di elaborazione di diverse applicazioni hanno ricevuto a loro volta accesso a breve termine alle risorse del processore. È grazie a questo che il multitasking è diventato possibile. sistemi operativi. Inutile dire che la velocità operativa in questa modalità era bassa. Allo stesso tempo, gli sviluppatori di CPU iniziarono a notare che sotto carico, diversi blocchi funzionali del processore potevano essere inattivi mentre altri erano impegnati nell'elaborazione del thread computazionale. Questo è ciò che li ha spinti a condividere le stesse risorse del processore per elaborare più thread computazionali. Intel ha introdotto questa funzionalità chiamata Hyper-Threading nei suoi processori nel 2002. Questo principio offre alcuni miglioramenti in un certo tipo di attività. Allo stesso tempo, l'approccio di AMD all'implementazione del calcolo multi-thread è rimasto invariato per molto tempo: ogni thread deve essere eseguito su un core separato. Ora, dopo aver ottimizzato le prestazioni dei singoli nodi del processore e analizzato attentamente il carico, gli sviluppatori AMD hanno ritenuto che le prestazioni di alcuni nodi fossero abbastanza sufficienti per servire due thread di elaborazione indipendenti contemporaneamente. Questo approccio ha permesso di ridurre notevolmente il numero di transistor mantenendo un'elevata produttività. Ora, alla luce dei crescenti requisiti prestazionali pur mantenendo parametri di consumo energetico accettabili, gli sviluppatori sono costretti a cercare modi per aumentare il numero di istruzioni eseguite per ciclo di clock.

Quindi, al centro di tutti i processori centrali AMD FX c'è un chip semiconduttore costituito da quattro moduli di elaborazione, ciascuno dei quali è dotato di una propria gamma di memoria cache di livello 2, una cache condivisa di livello 3 da 8 MB, una memoria DDR3 a doppio canale controller di memoria e controller bus HyperTransport e north bridge integrato.


Ovviamente, i modelli di fascia bassa sono realizzati con chip a tutti gli effetti disabilitando i singoli blocchi funzionali. Guardando la struttura del cristallo Zambesi, si ha involontariamente l'impressione che si tratti di un normale processore quad-core. In realtà, non è così, e soprattutto questo fatto è dimostrato dalla struttura del modulo di calcolo, un'unità strutturale dei processori AMD FX.

Il modulo di calcolo include due unità intere (ALU), ciascuna in grado di eseguire fino a quattro istruzioni per ciclo di clock, dotate della propria cache di livello 1 per l'archiviazione dei dati. Tutti gli altri blocchi, come il predittore di ramo, il decodificatore di istruzioni, la memoria buffer di istruzioni e l'array di cache L2 da 2 MB, vengono forniti in un'unica copia. Ovviamente, gli sviluppatori hanno ritenuto che le prestazioni di questi blocchi fossero sufficienti per servire due ALU.


Inoltre, ciascuno dei moduli di calcolo dispone di un'unità in virgola mobile (FPU), anch'essa sottoposta a miglioramenti significativi. Così, alle estensioni SIMD standard, sono stati aggiunti i set SSE4.1 e SSE4.2, nonché istruzioni specifiche XOP, AES e AVX, che possono migliorare significativamente le prestazioni se supportate dal software. Interessante sembra la possibilità di eseguire istruzioni AVX a 256 bit, per questo vengono utilizzate contemporaneamente le risorse di due blocchi, ognuno dei quali è in grado di elaborare istruzioni FMAC a 128 bit. In questo caso, l'unità FPU è in grado di eseguire due brevi istruzioni AVX contemporaneamente.

Come puoi vedere, la microarchitettura Bulldozer ha capacità di calcolo molto avanzate, soprattutto rispetto alle generazioni precedenti di processori AMD. Tuttavia, un tale vantaggio tecnologico va a scapito della necessità di un'attenta ottimizzazione del codice del programma. Altrimenti, soprattutto nelle applicazioni più vecchie, le prestazioni potrebbero non essere buone come previsto.

Qualche parola da dire sull'organizzazione della memoria interna di AMD FX, che è diventata campione non solo nel numero di core, ma anche nella dimensione totale della cache. Come abbiamo già detto, ciascuno dei blocchi interi ha un buffer da 16 KB per la memorizzazione dei dati ed entrambi i buffer possono essere utilizzati per far funzionare il blocco FPU. Per memorizzare le istruzioni, ogni modulo di calcolo dispone di una cache L1 separata da 64 KB e i dati intermedi vengono accumulati in un'impressionante cache L2 da 2 MB. L'array di cache di livello 3 comune a tutte e quattro le unità di calcolo ha un volume di 8 MB e ha un'associatività di 64 linee per modulo. Grazie all'utilizzo di un'organizzazione esclusiva delle cache di 2° e 3° livello, possiamo parlare del loro volume totale di 16 MB. Non sorprende che il cristallo Bulldozer si sia rivelato così complesso: la maggior parte del budget del transistor è destinata all'organizzazione della memoria interna del processore. Si noti che la frequenza operativa della cache L3 può essere 2000 MHz o 2200 MHz a seconda del modello di processore.

Come si può vedere da breve descrizione kernel, la microarchitettura Bulldozer, nonostante tutte le sue innovazioni, non è priva di alcuni difetti. Tuttavia, ogni modulo di calcolo ha solo un predittore di salto, un'unità di recupero delle istruzioni e un decodificatore di istruzioni, che, tra l'altro, è in grado di elaborare non più di quattro istruzioni per ciclo di clock. Vedremo come si comporta AMD FX nelle applicazioni del mondo reale, ma la mia intuizione è che nelle applicazioni che fanno molto affidamento sulla FPU ma mancano di ottimizzazioni software per i nuovi set di istruzioni SIMD, i processori più recenti forniranno livelli di prestazioni simili al quad-core. Modelli.

Oltre all’architettura, anche i meccanismi di gestione dell’energia hanno subito modifiche. Nonostante il maggior numero di transistors e le elevate velocità clock, anche i vecchi AMD FX a otto core hanno un pacchetto termico che non supera i 125 W. Naturalmente, in questo ha giocato un certo ruolo anche il processo tecnologico a 32 nm, grazie al quale la tensione di alimentazione standard non supera 1,4 V, ma il merito principale appartiene ancora ai meccanismi avanzati di regolazione delle frequenze di clock e delle tensioni di alimentazione. La prima generazione di questo concetto è stata implementata nel Phenom II X6, dove nel caso di un carico di calcolo non superiore a tre thread, le frequenze dei tre core attivi potevano essere aumentate di 400 MHz. I processori AMD FX offrono molta più flessibilità nel controllo dei parametri chiave delle prestazioni. Pertanto, grazie all'utilizzo dei transistor power gate, il gestore del risparmio energetico del processore è in grado di disattivare interi blocchi funzionali. In assenza di carico, il modulo di elaborazione, insieme all'array di cache L2, può essere completamente spento, liberando parte del budget TDP. Allo stesso tempo, la frequenza clock e la tensione dei moduli di calcolo attivi possono essere aumentate, e l'aumento di frequenza in modalità Max Turbo raggiunge i rispettabili 900 MHz. D'accordo, non abbiamo mai visto un algoritmo di overclock automatico così aggressivo. Inoltre, con un carico uniforme su tutti i moduli informatici, è possibile aumentare la frequenza dell'orologio a circa 300 MHz. In realtà, questa è la modalità operativa Turbo Core e sarà attiva finché il consumo energetico del processore non supera l'involucro termico. In altre parole, il concetto stesso di “frequenza di clock standard” per AMD FX perde il suo significato originale.


E tutto andrebbe molto bene se non fosse così triste. Il fatto è che lo scheduler dei processi dei sistemi operativi Windows non è ancora sufficientemente ottimizzato per i processori AMD FX. Esiste la possibilità che due thread della stessa applicazione vengano eseguiti su unità di calcolo intere di moduli diversi, il che impedirà al processore di entrare in modalità Max Turbo e richiederà il ricaricamento di dati e istruzioni nella cache. Idealmente, lo scheduler del sistema operativo dovrebbe tenere conto delle caratteristiche architettoniche di Bulldozer, nel qual caso la combinazione dell'utilizzo di Turbo Core e Max Turbo dovrebbe dare il massimo effetto positivo.


È già noto che il task scheduler del futuro Microsoft Windows 8 sarà ottimizzato per funzionare sui processori Bulldozer. Per quanto riguarda oggi, forse verrà rilasciato un aggiornamento per gli attuali sistemi operativi, oppure i programmatori AMD svilupperanno finalmente un "driver miracoloso"...

Non solo i fan dei prodotti dell'azienda, ma anche molti utenti che seguono i progressi dell'IT, aspettano apertamente i processori AMD con un'architettura Bulldozer fondamentalmente nuova. Negli ultimi anni, proponendo soluzioni interessanti in termini di rapporto prezzo/prestazioni, AMD si è concentrata principalmente su dispositivi entry-level e di fascia media. Rilanciando la linea FX, è ovvio che l'azienda si aspetta di attirare l'attenzione degli appassionati più esigenti, pronti a sperimentare e pretendere la massima velocità. Studieremo le capacità della nuova famiglia utilizzando l'esempio del primo processore desktop a otto core al mondo: AMD FX-8150. Vediamo se il produttore riuscirà a soddisfare le aspettative dei suoi fan.

A differenza del suo principale concorrente, che può permettersi di seguire il principio del pendolo nello sviluppo della CPU, modificando architetture e processi tecnologici Con periodicità annuale, AMD non delinea un arco temporale specifico per i suoi progetti, affidandosi agli istinti del mercato e al proprio potenziale tecnologico. La storia dell'architettura Bulldozer è iniziata molto tempo fa. Si presumeva che sarebbe stato presentato nel 2009, ma a causa di varie circostanze, l'implementazione pratica di soluzioni ingegneristiche audaci nel silicio è diventata possibile solo ora.

Il bulldozer per AMD è serio e durerà a lungo. Nei prossimi anni questa microarchitettura diventerà la base per i futuri processori di vari segmenti: server, desktop e mobili. Questo vale sia per le CPU discrete che per quelle ibride: anche l'APU dovrebbe essere trasformata nel tempo in Bulldozer. Solo per i sistemi compatti AMD utilizzerà chip basati sull'economico Bobcat e le sue versioni aggiornate. Con l'annuncio di Bulldozer, l'azienda ha deciso di far rivivere la serie leggendaria introducendo i processori della linea AMD FX, che hanno ricevuto una nuova architettura e sono realizzati utilizzando la più avanzata tecnologia di processo a 32 nanometri.

Caratteristiche dell'architettura

I chip Bulldozer si basano su moduli con due unità di calcolo x86. Tuttavia, questi ultimi non sono completamente autonomi: alcune risorse sono comuni a entrambi i core. Nello specifico, l'unità di prelettura, il decodificatore di istruzioni, la FPU e la cache L2. Un modulo dual-core monolitico consente l'esecuzione simultanea di due thread, ma con alcune avvertenze. Secondo i calcoli del produttore, questo approccio è completamente giustificato e consente di ottenere circa l'80% dell'efficienza dei core fisici a tutti gli effetti. Tuttavia, ciò riduce significativamente il numero di transistor e, di conseguenza, l'area del cristallo e il suo consumo energetico.

Tenendo conto della nuova struttura, l'architettura interna è stata riprogettata molto seriamente, cosa che ha interessato di fatto tutte le unità esecutive. Non ci sono praticamente somiglianze con il K10, utilizzato per i chip Phenom II e Athlon II. AMD ha introdotto il supporto per le istruzioni AVX, SSE 4.2 e AES-NI e ha aggiunto i propri set FMA4 e XOP.

Come i migliori processori Phenom, i chip FX hanno ricevuto un sistema di caching a tre livelli. Tuttavia, anche la sua organizzazione è notevolmente diversa da quella dei suoi predecessori. La cache dati L1 è stata ridotta da 64 KB a 16 KB, mentre allo stesso tempo la sua velocità di trasmissione è aumentata in modo significativo. L2 con una capacità di 2 MB è condivisa da entrambi i core di ciascun modulo. A seconda del numero di questi ultimi, la capacità totale della cache di secondo livello nel processore AMD FX può variare da 4 a 8 MB. La sua latenza è leggermente aumentata: un prezzo da pagare per l'ottimizzazione per il funzionamento a frequenze più alte. I chip con architettura Bulldozer sono inoltre dotati di una cache L3 da 8 MB. Considerando lo schema operativo esclusivo, il volume totale del buffer è piuttosto impressionante per i modelli desktop. Un algoritmo migliorato di prelettura dei dati ci consente di sperare che la velocità del sottosistema di memoria venga aumentata. Per quanto riguarda la RAM stessa, la CPU FX supporta i moduli DDR3-1866 in modalità dual-channel.

AMD FX è prodotto utilizzando una tecnologia di processo a 32 nm con tecnologia SOI, simile a quella utilizzata nella produzione dell'APU Llano. I chip sono prodotti presso gli stabilimenti della consociata GlobalFoundries. La CPU si basa su un cristallo a otto core con un'area di 315 mm2. Secondo la topologia, la maggior parte di essa è allocata alla memoria cache, quindi non sorprende che il numero totale di transistor in questo caso raggiunga l'impressionante cifra di 2 miliardi.Per fare un confronto: il Phenom II X6 (Thuban) a sei core include "solo ” 904 milioni di transistor, ma grazie alla tecnologia di processo a 45 nanometri, l'area del cristallo è di 346 mm2. Considerando la differenza di area, possiamo supporre che il costo dei chip FX sia inferiore a quello dei loro predecessori. Tuttavia, il passaggio ai 32 nm non è facile per GlobalFoundries. AMD ha già segnalato difficoltà con la produzione di grezzi adatti, a causa delle quali l'azienda non riesce a soddisfare pienamente la domanda di Llano ibrido. Speriamo che ciò non influisca sulla disponibilità di FX in vendita e che tutti possano acquistarli.

Lo stesso cristallo verrà utilizzato per i modelli a quattro e sei core, il che consentirà di gestire in modo più efficiente i chip che presentano determinati difetti. Nel frattempo, è probabile che per produrre queste CPU verranno utilizzati cristalli pienamente operativi con moduli disattivati. E in questo caso puoi contare sulla prossima lotteria con lo sblocco dei core disabilitati. Sarebbe un ottimo modo per suscitare interesse nei processori AMD FX.

Specifiche processori
Modello FX-8150 Phenom II X6 1075T Phenom II X4 975 Core i7-2600K Core i5-2500K
Nome in codice Bulldozer Thuban Deneb Ponte Sabbioso Ponte Sabbioso
Numero di nuclei/fili, pz. 8/8 6/6 4/4 4/8 4/4
Frequenza di clock di base, GHz 3,6 3 3,6 3,4 3,3
Frequenza di clock dopo l'overclocking automatico, GHz 3,9/4,2 3,5 3,8 3,7
Dimensioni della cache L2/L3, MB 8/8 6×0,5/6 4×0,5/6 4×0,25/8 4×0,25/6
Tecnologia di produzione, nm 32 45 45 32 32
Presa della CPU AM3+ AM3 AM3 LGA1155 LGA1155
Consumo energetico (TDP), W 125 125 125 95 95
Prezzo consigliato, $ 245 181(162*) 175 (160*) 317 (315*) 216 (225*)
*Secondo il catalogo Hotline.ua.

Nucleo Turbo

La tecnologia di aumento dinamico della frequenza Turbo Core era precedentemente utilizzata da AMD per le APU Thuban e Llano a sei core. I processori FX hanno un nuovo meccanismo e algoritmo per questa funzione. Nel caso in cui, sotto carico, il consumo energetico del chip rientri nei limiti del suo TDP e la temperatura non superi un valore specificato, la frequenza può aumentare automaticamente (100-300 MHz) anche in una situazione in cui tutti i core sono attivi (All Core Boost). Se almeno la metà dei moduli è inattiva, AMD FX può passare alla modalità Max Turbo Boost, aumentando la tensione di alimentazione e in modo molto significativo la frequenza di clock delle unità funzionanti (fino a 900 MHz).

AMD si preoccupa anche di migliorare l'efficienza dei nuovi chip. Considerando la crescita del numero di core di elaborazione, è impossibile fare affidamento solo sull'effetto dell'utilizzo di un processo tecnico più raffinato. Quando non c'è carico su entrambi i core del processore all'interno dello stesso modulo e entrano nello stato di risparmio energetico C6, i transistor di potenza consentono di disattivare l'alimentazione da questo nodo, riducendo il consumo complessivo della CPU.

Supporto logico

Come la precedente piattaforma desktop AMD, il controller del bus PCI Express 2.0 è rimasto prerogativa del north bridge del chipset e non si è spostato sotto la copertura del processore. È il numero di linee supportate di questa interfaccia e, di conseguenza, la capacità di creare configurazioni con più schede video, che sono diventate le differenze distintive dei nuovi set logici per i chip Zambezi. L'AMD 990FX di fascia alta ha 42 collegamenti a sua disposizione, con la possibilità di essere configurato per esigenze grafiche come 2x16x o 4x8x. AMD 990X ha 26 corsie e consente di accoppiare solo due schede video in modalità CrossFireX o SLI in una configurazione 2x8x. Bene, AMD 970, con lo stesso numero di collegamenti PCI-E, offre di accontentarsi di un adattatore. In tutti i casi la periferia è servita dal north bridge SB950, che non apporta novità interessanti: sei porte SATA 6 Gb/s con la possibilità di creare RAID (0,1,5,10), fino a 14 USB 2.0 connettori, funzionano con PCI. Purtroppo, a differenza del chipset AMD A75 per la piattaforma FM1, non c'è supporto per il bus USB 3.0 ad alta velocità.

Piattaforma AM3+

Per funzionare con i processori della serie FX, è necessaria una scheda madre con socket AM3+. Può trattarsi di un modello basato sul "nuovo" chipset AMD 9xx o di un prodotto con logica delle generazioni precedenti. La compatibilità con AM3 è teoricamente possibile, ma non è garantita né dalla stessa AMD né dai produttori di schede madri. È possibile che questi ultimi rilascino firmware per le loro soluzioni top, ma si tratta di casi piuttosto isolati. E anche in tali situazioni, i chip FX funzioneranno con una velocità ridotta nel passaggio tra gli stati Turbo Boost e Cool’n’Quiet. In questo caso, tutti i possibili problemi con il funzionamento del sistema ricadranno sulle spalle degli utenti. Pertanto, in questo caso non puoi contare su un aggiornamento senza problemi.

Le schede con AM3+ si distinguono facilmente per il colore nero del socket del processore, mentre il connettore AM3 è bianco. Fortunatamente, il design degli elementi di montaggio CO non è cambiato, quindi qualsiasi dispositivo di raffreddamento compatibile con AM2/AM2+/AM3 sarà adatto per raffreddare l'AMD FX.

La formazione

3DMark 11, test CPU (fisica), punti
Punti di vantaggio 3DMark
PC Mark 7, Test di calcolo, punti
CineBench 11.5, punti
Benchmark HD x264 4.0, fps
7-Zip 9.20, MIPS
Far Cry 2, 1920×1080, DX10, alta qualità, fps
Hard Reset, 1920×1080, modalità alta, fps
Metro 2033, 1920×1080, DX11, PhysX, alta qualità, fps
Colin McRae: DiRT 3, 1920×1080, alta qualità, fps
Lost Planet 2, 1920×1080, DX11, alta qualità, test B, fps
Crysis 2, 1920×1080, DX9, alta qualità, test Downtown, fps
Consumo energetico del sistema, W

Grazie alla struttura modulare dei processori dell'azienda, è facile costruire la propria linea di prodotti, offrendo dispositivi con varie quantità unità di calcolo e frequenze di clock. Al momento del lancio, la linea di chip desktop, denominata Zambezi, comprende quattro CPU. Il fiore all'occhiello è la soluzione FX-8150 a otto core con una formula di frequenza di 3,6/3,9/4,2 GHz. 8 MB di cache L2 e L3, nonché un TDP di 125 W. L'FX-8120 è simile nell'equipaggiamento, l'unica differenza è nella modalità di funzionamento della frequenza: 3,1/3,4/4,0 GHz. L'FX-6100 a sei core ha 6 MB di cache L2 e gli stessi 8 MB di L3, ma il suo pacchetto termico è di 95 W. La versione più economica con due moduli e quattro unità di calcolo x86 FX-4100 funziona a 3,6/3,7/3,8 GHz, si accontenta di 4 MB L2, capiente L3 (8 MB) e un TDP di 95 W. Per quanto riguarda il costo dei dispositivi, i prezzi all'ingrosso consigliati per i modelli elencati sono rispettivamente di $ 245/205/165/115.

Overclocking

La capacità di overclockare perfettamente i processori è uno dei parametri chiave dei chip FX. AMD pone particolare enfasi su questa funzionalità. Il moltiplicatore gratuito è disponibile per tutti i modelli della linea e la possibilità di modificarlo sarà presente su qualsiasi tabellone con AM3+.

L'architettura FX è stata originariamente progettata per funzionare a velocità di clock elevate. Gli artigiani armati di recipienti di azoto liquido sono riusciti a ottenere uno screenshot della CPU-Z in una situazione in cui il processore funzionava a quasi 8,5 GHz. Allo stesso tempo, però, è stato necessario lasciare attivo solo un modulo su quattro. Tutti gli otto core sono stati realizzati per funzionare a 8,1 GHz. In precedenza, tali frequenze venivano raggiunte solo dalle versioni più leggere di Intel Celeron per LGA775. Ora gli appassionati avranno un oggetto molto più interessante per gli esperimenti di overclocking.

Nel caso di un sistema di raffreddamento ad aria, dovrai accontentarti di risultati più modesti. Quando la tensione di alimentazione è stata aumentata a 1,45 V, la CPU ha funzionato stabilmente a 4,6 GHz. Potrebbe non essere così impressionante, ma il potenziale è chiaramente migliore rispetto ai chip Phenom II da 45 nm.

Risultati

I risultati dei test delle prestazioni sono presentati in grafici. Il quadro è sufficientemente indicativo per farsi un'opinione generale sulle capacità del nuovo sviluppo di AMD. I processori FX, come previsto, hanno ricevuto un aumento delle prestazioni nelle attività multi-thread: archiviazione, codifica video HD, rendering. In questo caso, il chip a otto core è in grado di competere sia con il Core i5-2500K che con il più costoso Core i7-2600K. Tuttavia, non appena si tratta di applicazioni con ottimizzazioni non importanti per l'esecuzione di codice parallelo, AMD FX perde terreno - le prestazioni specifiche delle loro unità x86 sono addirittura leggermente inferiori a quelle dei prodotti con architettura K10. Nei giochi che scenario migliore utilizzare 3-4 thread, un notevole vantaggio per i processori Intel. Se si utilizzano impostazioni di massima qualità grafica, dove la scheda video diventa un limitatore, le prestazioni dei sistemi si livellano, ma è impossibile valutare il reale potenziale della CPU in tali condizioni.

Il passaggio alla tecnologia di processo a 32 nanometri ha invece permesso di mantenere il consumo energetico allo stesso livello con un aumento delle prestazioni. La priorità in questo caso erano probabilmente le prestazioni piuttosto che il miglioramento dell'efficienza della CPU.

Anche a giudicare dal costo di AMD FX, è ovvio che l'azienda prevede principalmente di prendere piede nella categoria di prezzo medio, assegnando deliberatamente a Intel il segmento delle soluzioni costose di fascia alta. Nelle condizioni attuali, oggettivamente, il produttore non può competere adeguatamente nella lega dei “pesi supermassimi”. Avendo fatto affidamento sull'elaborazione multi-core, è molto problematico ottenere risultati eccezionali con un software scarsamente ottimizzato. Allo stesso tempo, solo cinque anni fa eravamo sinceramente sorpresi di chi potrebbe aver bisogno di un processore quad-core su un desktop e di come utilizzare in modo efficace le risorse di una tale CPU. Oggi questo è un luogo comune e i vantaggi dei chip con un tale numero di unità di calcolo non sollevano più dubbi. Forse i modelli a otto core riceveranno un riconoscimento simile qualche tempo dopo.

Fortunatamente, AMD non starà a guardare quale destino accadrà ai suoi processori. I piani annunciati per un ulteriore sviluppo ispirano, anche se moderato, ottimismo. L'azienda continuerà a perfezionare attivamente l'attuale architettura, migliorando sia l'efficienza energetica che le prestazioni della CPU, ma il ritmo indicato - 10-15% all'anno - non è molto impressionante. Con tali indicatori, puoi contare su un cambiamento radicale della situazione solo se Intel rallenta lo sviluppo dei suoi prodotti, ma non ci sono prerequisiti per questo: il meccanismo "tick-tock" non ha ancora fallito. Già nella primavera del 2012 verranno presentati i chip Ivy Bridge, realizzati con tecnologia a 22 nanometri e utilizzando transistor 3D.

La valutazione finale dell'architettura considerata e del processore AMD FX-8150 basato su di essa è ambigua, e questo già indica che la rivoluzione non è avvenuta. Almeno in questa fase, è invisibile all'utente finale. Un salto di qualità nelle prestazioni si verifica in applicazioni ben parallele, mentre nelle attività a thread singolo non si osserva alcun aumento significativo. Le grandi aspettative riposte su Bulldozer sono state giustificate solo in parte. AMD ha ancora del lavoro da fare per offrire soluzioni interessanti e competere per un posto nel cuore degli appassionati esigenti.

Amministratore di sistema(è attivo lingua inglese amministratore di sistema, amministratore di sistema) - un nome abbreviato di una professione, il cui nome completo suona in russo Amministratore di sistema. Questa professione è diventata recentemente molto popolare tra la maggior parte dei giovani e dei meno giovani: la insegnano, ci lavorano e guadagnano bene. Ciò è dovuto al rapido sviluppo di varie tecnologie informatiche e alla loro penetrazione in tutte le sfere della vita umana. La parola amministratore di sistema è spesso usata nel discorso colloquiale, nei posti vacanti e nei curriculum quando si cerca un lavoro, in una parola - ovunque. Di seguito parleremo di cos'è la professione di amministratore di sistema.

IN realtà moderne, un amministratore di sistema può essere chiamato praticamente qualsiasi persona coinvolta nella manutenzione e nella manutenzione di una specifica rete di computer, inclusi tutti i suoi componenti hardware e/o software, che possono includere:

  • Personal computer, sia workstation che server;
  • Apparecchiature di rete come switch, router, firewall e altro;
  • Server Web, server di posta, server di database e altri.

Inoltre, in alcuni casi, l'amministratore di sistema può essere responsabile di garantire un'adeguata sicurezza delle informazioni.

A seconda della sua specializzazione, un amministratore di sistema può svolgere le seguenti attività:

  • Un amministratore di workstation e server ripara molto spesso sia l'hardware (schede madri guaste, alimentatori bruciati) che il software (Windows non si carica, le virgole non vengono stampate in Word...).
  • Amministratore di una rete aziendale basata su un dominio Active Directory. Un'attività molto apprezzata, vista la prevalenza dei sistemi operativi Windows, nonché la necessità di controllarli in qualche modo in maniera centralizzata. Uno specialista di questo tipo deve essere in grado di creare, distribuire in gruppi, modificare gli utenti, concedere loro i diritti appropriati nel dominio AD ed essere anche in grado di gestire i criteri di gruppo per gli utenti, i loro computer e i gruppi di cui sono tutti membri.
  • Amministrazione di reti e apparati di rete. Le sue responsabilità includono la conoscenza della topologia di rete, la capacità di lavorare con apparecchiature di rete sia non configurabili che personalizzabili, la pianificazione locale rete di computer, nonché la possibilità di combinare diversi luoghi di lavoro remoti in un'unica rete configurando NAT e VPN. Inoltre, non dovresti dimenticare di controllare l'accesso all'interno e all'esterno di questa rete, impostando un proxy.
  • Un amministratore del server Web, che deve essere almeno in grado di installare, configurare e mantenere uno dei seguenti server Web: Apache, IIS, Nginx e monitorare l'hosting (che può essere posizionato sia all'interno della rete dell'organizzazione che all'esterno di essa). Inoltre, un buon amministratore dovrebbe essere in grado di configurare la normale distribuzione delle risorse in caso di carichi elevati, il clustering e molte altre cose specifiche.
  • Anche l'amministrazione di un server di posta è un compito comune per un amministratore di sistema; i suoi compiti includono il lavoro con soluzioni popolari come Exim, Microsoft Exchange, Postfix, Sendmail o soluzioni di posta aziendale di Google o, ad esempio, Yandex. Oltre all'ovvio controllo sugli account (creazione, cancellazione, configurazione), è necessario anche poter predisporre un sistema antispam, ecc.
  • Amministratore del sito. Queste responsabilità possono includere semplicemente il riempimento del sito con alcuni contenuti, ma poiché stiamo parlando di un amministratore di sistema, in teoria dovrebbe essere in grado di impostare l'hosting (incluso un server web, come menzionato sopra), installare e configurare il sito desiderato , ad esempio qualsiasi sistema di gestione dei contenuti (CMS).
  • Molto raramente, le responsabilità di un amministratore di sistema possono includere il compito di creare o mantenere un sistema di videosorveglianza. Le attività includono l'installazione e la configurazione delle telecamere, la risposta a vari eventi, il salvataggio e la riproduzione delle registrazioni. Ha un atteggiamento debole nei confronti dell'amministrazione del sistema e spesso rientra nelle sue responsabilità insieme ad altre responsabilità.

Tralasciando le occupazioni dell'amministratore di sistema sopra descritte ci sono cose possibili come l'amministrazione di database (Microsoft SQL, MySQL e i suoi molteplici rami, Oracle, ecc.), l'amministrazione 1C (da non confondere con "programmatore 1C"), PBX e molto altro .

 

 

Questo è interessante: