NVIDIA TITAN X super videokaardi ülevaade ja testimine: paremuse demonstreerimine. NVIDIA GeForce GTX TITAN X ülevaade ja testimine: beebide võitmine testib geforce gtx titan x

Tutvustame põhilist üksikasjalikku materjali Nvidia Geforce GTX Titan X uuringuga.

Õppeobjekt: 3D-graafika kiirendi (videokaart) Nvidia Geforce GTX Titan X 12288 MB 384-bitine GDDR5 PCI-E

Arendaja üksikasjad: Nvidia Corporation (Nvidia kaubamärk) asutati 1993. aastal Ameerika Ühendriikides. Peakorter Santa Claras (California). Arendab graafikaprotsessoreid, tehnoloogiaid. Kuni 1999. aastani oli peamine kaubamärk Riva (Riva 128/TNT/TNT2), aastast 1999 kuni tänapäevani - Geforce. 2000. aastal omandati 3dfx Interactive varad, misjärel kanti 3dfx / Voodoo kaubamärgid üle Nvidiale. Tootmist ei ole. Töötajate koguarv (koos piirkondlike kontoritega) on ligikaudu 5000 inimest.

1. osa: teooria ja arhitektuur

Nagu juba teada, andis Nvidia eelmise kuu keskel välja uue tipptasemel videokaardi nimega Geforce GTX Titan X, millest on saanud turu võimsaim. Avaldasime kohe selle uue toote üksikasjaliku ülevaate, kuid see sisaldas ainult praktilisi uuringuid, ilma teoreetilise osa ja sünteetiliste testideta. See juhtus erinevate asjaolude, sealhulgas meist sõltumatute asjaolude tõttu. Kuid täna parandame seda defekti ja vaatame märtsikuu uudsust lähemalt - kuu aja jooksul pole juhtunud midagi, mis kaotaks oma tähtsuse.

Veel 2013. aastal andis Nvidia välja uue videokaartide kaubamärgi Geforce GTX Titan esimese lahenduse, mis sai nime Oak Ridge'i riiklikus laboris asuva superarvuti järgi. Uue mudelisarja esimene mudel püstitas uued rekordid nii jõudluse kui ka hinna osas – USA turu MSRP oli 999 dollarit. See oli esimene tipptasemel Titani seeria graafikakaart, mis seejärel jätkus mitte nii populaarse kahe kiibiga Titan Z ja kiirendatud Titan Blackiga, mis sai täielikult lukustamata GK110 revision B GPU.

Ja nüüd, 2015. aasta kevadel, on käes järjekordne Nvidia uudsus "titanium" premium-seeriast. GTX Titan X avalikustas esmakordselt ettevõtte president Jensen Huang GDC 2015 mänguarendajate konverentsil Epic Unreal Engine üritusel. Tegelikult osales see videokaart nähtamatult saates nagunii, olles paigaldatud paljudele demostendidele, kuid Jensen esitles seda ametlikult.

Enne Geforce GTX Titan X väljaandmist oli kiireim ühekiibiline videokaart eelmise aasta septembris esitletud sama Maxwelli graafikaarhitektuuri GM204 kiibil põhinev Geforce GTX 980. See mudel on väga energiasäästlik, pakkudes korralikku töötlemisvõimsust, tarbides samal ajal vaid 165 W energiat – see tähendab, et see on kaks korda energiasäästlikum kui eelmise põlvkonna Geforce.

Samal ajal toetavad Maxwelli GPU-d eelseisvat DirectX 12 (sh funktsioonitase 12.1) ja teisi ettevõtte uusimaid graafikatehnoloogiaid: Nvidia Voxel Global Illumination (VXGI, kirjutasime sellest GTX 980 artiklis), uus Multi-Frame. proovitud anti-aliasing meetod AA (MFAA), Dynamic Super Resolution (DSR) ja palju muud. Jõudluse, energiatõhususe ja funktsioonide kombinatsioon tegi GM204 kiibist selle väljaandmise ajal parima täiustatud graafikaprotsessori.

Kuid kõik muutub millalgi ja 2048 tuuma ja 128 tekstuuriühikuga GPU asendati uue graafikaprotsessoriga, mis põhineb samal teise põlvkonna Maxwelli arhitektuuril (esimest mäletame GM107 kiibist, millel on Geforce GTX 750 Ti videokaart põhineb) ja need samad võimalused, kuid 3072 CUDA südamiku ja 192 tekstuuriühikuga – see kõik on juba pakitud 8 miljardisse transistori. Loomulikult sai Geforce GTX Titan X kohe kõige võimsamaks lahenduseks.

Tegelikult oli tipptasemel teise põlvkonna Maxwelli kiip, mida me nüüd tunneme koodnime GM200 all, Nvidias valmis juba mõnda aega enne selle väljakuulutamist. Uue tipptasemel graafikakaardi väljalaskmine lihtsalt ei olnud mõttekas, kui isegi GM204-l põhinev Geforce GTX 980 tegi suurepärast tööd, olles maailma kiireim ühekiibiline graafikakaart. Nvidia ootas mõnda aega AMD võimsamat GPU-l põhinevat lahendust, mis on toodetud samal 28 nm protsessitehnoloogial, kuid ei jäänud ootama.

Tõenäoliselt ei muutuks toode tõelise konkurentsi puudumisel üldse hapuks, sellegipoolest otsustasid nad selle välja anda, tagades sellega kõige võimsamaid GPU-sid tootva ettevõtte tiitli. Ja tõepoolest, vastase otsust polnud mõtet oodata, sest see lükkus vähemalt juunisse – nii kaua oodata on lihtsalt kahjum. Sel juhul saate alati välja anda veelgi võimsama videokaardi, mis põhineb samal GPU-l, kuid töötab kõrgemal sagedusel.

Kuid miks on meil vaja selliseid võimsaid lahendusi mitmeplatvormiliste mängude ajastul, mille GPU võimsusvajadus on üsna keskmine? Esiteks peaksid esimesed mängurakendused, mis kasutavad DirectX 12 võimalusi, isegi kui need on mitme platvormiga, ilmuma üsna pea - lõppude lõpuks pakuvad selliste rakenduste arvutiversioonid peaaegu alati paremat graafikat, lisaefekte ja kõrgema eraldusvõimega tekstuurid. Teiseks on juba välja antud DirectX 11 mängud, mis suudavad kasutada kõiki võimsaimate graafikaprotsessorite võimalusi – nagu näiteks Grand Theft Auto V, millest allpool lähemalt räägime.

On oluline, et Nvidia Maxwelli graafikalahendused toetaksid täielikult DirectX 12 nn funktsioonitaseme 12.1 funktsioonitaset – hetkel teadaolevalt kõrgeimat. Nvidia on juba pikka aega pakkunud mänguarendajatele DirectX-i tulevase versiooni draivereid ja nüüd on need saadaval kasutajatele, kes on installinud Microsoft Windows 10 tehnilise eelvaate. Pole üllatav, et just Geforce GTX Titan X videokaarte kasutati DirectX 12 võimaluste demonstreerimiseks Game Developers Conference'il, kus mudelit esmakordselt näidati.

Kuna vaatluse all olev Nvidia videokaardi mudel põhineb Maxwelli arhitektuuri teise põlvkonna tipptasemel GPU-l, mida oleme juba üle vaadanud ja mis on detailides sarnane eelmise Kepleri arhitektuuriga, on kasulik lugeda varasemaid artikleid ettevõtte videokaarte enne selle materjali lugemist. Nvidia:

  • Nvidia Geforce GTX 970 – hea asendus GTX 770-le
  • Nvidia Geforce GTX 980 – Geforce GTX 680 järgija, edestades isegi GTX 780 Ti
  • Nvidia Geforce GTX 750 Ti – Maxwell alustab väikesest... hoolimata Maxwellist
  • Nvidia Geforce GTX 680 on uus ühe pesaga 3D-graafika liider

Niisiis, vaatame GM200 GPU-l põhineva Geforce GTX Titan X videokaardi üksikasjalikke tehnilisi andmeid.

Graafikakiirendi Geforce GTX Titan X
ParameeterTähendus
Kiibi koodinimiGM200
Tootmistehnoloogia28 nm
Transistoride arvumbes 8 miljardit
Põhialaumbes 600 mm 2
ArhitektuurÜhtne, tavaliste protsessorite massiiviga mitut tüüpi andmete vootöötluseks: tipud, pikslid jne.
DirectX riistvara tugiDirectX 12 funktsioonitaseme 12.1 toega
Mälu siin384-bitine: kuus sõltumatut 64-bitist mälukontrollerit koos GDDR5 mälu toega
GPU sagedus1000 (1075) MHz
Arvutusplokid24 voogesituse multiprotsessorit, sealhulgas 3072 ühe- ja kahetäpset ujukoma skalaari ALU-d (1/32 FP32-st) vastavalt IEEE 754-2008 standardile;
Tekstuurimisplokid192 tekstuuri adresseerimis- ja filtreerimisseadet, mis toetavad FP16 ja FP32 komponente tekstuurides ning trilineaarset ja anisotroopset filtreerimist kõigi tekstuurivormingute jaoks
Rasteriseerimisühikud (ROP)6 laia ROP-i (96 pikslit), mis toetavad erinevaid antialiase režiime, sealhulgas programmeeritavad ja FP16 või FP32 kaadripuhvervorminguga. Plokid koosnevad konfigureeritavate ALU-de massiivist ja vastutavad sügavuse genereerimise ja võrdlemise, mitme proovivõtu ja segamise eest
Monitori tugiIntegreeritud tugi kuni neljale monitorile, mis on ühendatud Dual Link DVI, HDMI 2.0 ja DisplayPort 1.2 kaudu
Geforce GTX Titan X võrdlusgraafikakaardi spetsifikatsioonid
ParameeterTähendus
Tuumsagedus1000 (1075) MHz
Universaalsete protsessorite arv3072
Tekstuuriplokkide arv192
Segamisplokkide arv96
Tõhus mälusagedus7000 (4×1750) MHz
Mälu tüüpGDDR5
Mälu siin384-bitine
Mälu suurus12 GB
Mälu ribalaius336,5 GB/s
Arvutusjõudlus (FP32)kuni 7 teraflopsi
Teoreetiline maksimaalne täitmismäär96 gigapikslit/s
Teoreetiline tekstuuri proovivõtu sagedus192 gigatekseli/s
RehvPCI Express 3.0
ÜhendusedÜks Dual Link DVI, üks HDMI 2.0 ja kolm DisplayPort 1.2
Energiatarbiminekuni 250 W
LisatoitÜks 8-kontaktiline ja üks 6-kontaktiline pistik
Süsteemi šassiis hõivatud pesade arv2
Soovitatav hind999 $ (USA), 74990 RUB (Venemaa)

Uus Geforce GTX Titan X mudel sai nime, mis jätkab Nvidia esmaklassiliste lahenduste rida konkreetse positsioneerimise jaoks – sinna lisati lihtsalt täht X. Uus mudel asendas Geforce GTX Titan Black mudeli ja on ettevõtte edetabelis kõige tipus. praegune tootesari. Selle kohale on jäänud vaid kahekiibiline Geforce GTX Titan Z (kuigi seda ei saa enam mainida) ja selle all on ühe kiibiga mudelid GTX 980 ja GTX 970. on ühe kiibiga turu parim jõudluslahendus. videokaardid.

Kõnealune Nvidia mudel põhineb GM200 kiibil, millel on 384-bitine mälusiin ja mälu töötab sagedusel 7 GHz, mis annab maksimaalseks ribalaiuse 336,5 GB / s - poolteist korda rohkem kui GTX-is. 980. See on päris muljetavaldav väärtus, eriti kui meenutada teise põlvkonna Maxwellis kasutusel olevaid uusi kiibile infotihendusmeetodeid, mis aitavad olemasolevat mälu ribalaiust tunduvalt tõhusamalt kasutada kui konkurendi GPU.

Sellise mälusiini puhul võiks videokaardile installitud videomälu maht olla 6 või 12 GB, kuid eliitmudeli puhul otsustati paigaldada 12 GB, et jätkata esimese GTX Titani poolt seatud trendi. mudelid. See on enam kui piisav, et käivitada mis tahes 3D-rakendusi, arvestamata kvaliteediparameetreid - sellest videomälust piisab absoluutselt iga olemasoleva mängu jaoks mis tahes ekraani eraldusvõime ja kvaliteediseadetega, mis muudab Geforce GTX Titan X videokaardi eriti ahvatlevaks. perspektiivvaade – selle omanikul ei saa videomälu kunagi otsa.

Geforce GTX Titan X ametlik voolutarbimise näitaja on 250 W – sama mis teistel eliit-Titani seeria ühekiibilistel lahendustel. Huvitaval kombel on 250 W umbes 50% rohkem kui GTX 980 ja sama palju on kasvanud ka peamiste funktsionaalplokkide arv. Üsna suur tarbimine probleeme ei too, etalonjahuti saab sellise soojushulga hajutamisel suurepäraselt hakkama ning entusiastlikud süsteemid pärast GTX Titan ja GTX 780 Ti on selliseks energiatarbimiseks juba ammu valmis.

Arhitektuur

Geforce GTX Titan X videokaardi mudel põhineb uuel GM200 graafikaprotsessoril, mis sisaldab kõiki GM204 kiibi arhitektuurilisi funktsioone, nii et kõik GTX 980 artiklis öeldu kehtib täielikult uue esmaklassilise toote kohta - soovitame kõigepealt lugege materjali, milles on täpselt välja toodud Maxwelli arhitektuurilised omadused.

GM200 GPU-d võib nimetada GM204 äärmuslikuks versiooniks, mis on võimalik 28 nm protsessis. Uus kiip on suurem, palju kiirem ja energianõudlikum. Nvidia andmetel sisaldab "suur Maxwell" 8 miljardit transistorit, mille pindala on umbes 600 mm 2 - see tähendab, et see on ettevõtte suurim graafikaprotsessor. "Big Maxwellil" on 50% rohkem vooprotsessoreid, 50% rohkem ROP-e ja 50% rohkem mälu ribalaiust, mistõttu on selle pindala peaaegu poolteist korda suurem.

Arhitektuuriliselt on GM200 videokiip täielikult kooskõlas noorema mudeliga GM204, see koosneb ka GPC klastritest, mis sisaldavad mitut SM-i multiprotsessorit. Tippgraafikaprotsessor sisaldab kuut GPC klastrit, mis koosnevad 24 multiprotsessorist, kokku on selles 3072 CUDA südamikku ning tekstuurioperatsioonid (sämpling ja filtreerimine) tehakse 192 tekstuuriühiku abil. Ja baassagedusega 1 GHz on tekstuurmoodulite jõudlus 192 gigatekseli sekundis, mis on enam kui kolmandiku võrra kõrgem kui ettevõtte eelmise võimsaima videokaardi - Geforce GTX 980 - sarnane omadus.

Teise põlvkonna Maxwelli multiprotsessor on jagatud neljaks 32 CUDA tuumaga plokkiks (kokku 128 tuuma SMM-i kohta), millest igaühel on oma ressursid käskude jaotamiseks, töötlemise ajastamiseks ja käsuvoo puhverdamiseks. Tänu sellele, et igal arvutusplokil on oma dispetšeriplokid, kasutatakse CUDA tuumasid efektiivsemalt kui Kepleris, mis vähendab ka GPU voolutarbimist. Multiprotsessor ise pole võrreldes GM204-ga muutunud:

GPU vahemälu kasutamise tõhususe parandamiseks on mälu alamsüsteemis tehtud mitmeid muudatusi. Igal GM200 multiprotsessoril on spetsiaalne 96 KB jagatud mälu ning esimese taseme ja tekstuuri vahemälud on kombineeritud 24 KB plokkideks – kaks plokki mitme protsessori kohta (kokku 48 KB SMM-i kohta). Eelmise põlvkonna Kepleri GPU-del oli ainult 64 KB jagatud mälu, mis toimis ka L1 vahemäluna. Kõikide muudatuste tulemusena on Maxwell CUDA tuumade efektiivsus umbes 1,4 korda kõrgem kui sarnasel Kepleri kiibil ning uute kiipide energiatõhusus on umbes kaks korda kõrgem.

Üldiselt on GM200 graafikaprotsessoris kõik paigutatud täpselt samamoodi nagu 2014. aastal üle vaadatud GM204 kiibis. Nad ei puudutanud isegi tuumasid, mis suudavad sooritada topelttäpsusega ujukoma toiminguid kiirusega, mis moodustab vaid 1/32 ühekordse täpsusega arvutuste kiirusest – täpselt nagu Geforce GTX 980. Näib, et Nvidia tunnistas, et väljalase spetsialiseeritud lahendused professionaalsetele turule (GK210) ja mängudele (GM200) on igati õigustatud.

GM200 mälu alamsüsteem on võrreldes GM204-ga tugevdatud - see põhineb kuuel 64-bitisel mälukontrolleril, mis kokku moodustab 384-bitise siini. Mälukiibid töötavad efektiivsel sagedusel 7 GHz, mis annab maksimaalseks ribalaiuse 336,5 GB / s, mis on poolteist korda suurem kui Geforce GTX 980 oma. Ärge unustage Nvidia uusi andmete tihendamise meetodeid. , mis võimaldavad teil saavutada varasemate toodetega võrreldes suuremat efektiivset mälu ribalaiust – samal 384-bitisel siinil. Geforce GTX 980 ülevaates kaalusime hoolikalt seda Maxwelli teise põlvkonna kiipide uuendust, mis tagab neile Kepleriga võrreldes neljandiku tõhusama videomälu kasutamise.

Nagu kõigil hiljutistel Geforce'i graafikakaartidel, on ka GTX Titan X-l baassagedus- minimaalne GPU töötamiseks 3D-režiimis, samuti Boost Clocki turbosagedus. Uudsuse baassagedus on 1000 MHz ja Boost Clock sagedus 1075 MHz. Nagu varem, tähendab turbosagedus ainult GPU keskmist sagedust teatud mängurakenduste ja muude Nvidia kasutatavate 3D-ülesannete jaoks ning tegelik töösagedus võib olla suurem - see sõltub 3D koormusest ja tingimustest (temperatuur, võimsus). tarbimine jne)

Selgub, et uudsuse GPU sagedus on umbes 10% kõrgem kui GTX Titan Blackil, kuid madalam kui GTX 980 omal, kuna suuri GPU-sid tuleb alati kellatada madalamal sagedusel (ja GM200 on märgatavalt pindalalt suurem kui GM204). Seetõttu on uudsuse üldine 3D jõudlus umbes 33% kõrgem kui GTX 980 oma, eriti kui võrrelda Turbo Boosti sagedusi.

Muus osas on GM200 kiip täpselt sama, mis GM204 – lahendused on oma võimalustelt ja toetatud tehnoloogiatelt identsed. Isegi kuvarite ja videoandmetega töötamise moodulid jäeti täpselt samaks, mis mudelil Geforce GTX 980 põhineb mudelil GM204. Sellest lähtuvalt kehtib kõik, mis GTX 980 ja GTX 970 kohta kirjutasime, Titan X kohta täielikult .

Seetõttu võite kõigi muude uudsuse funktsionaalsete peensuste kohta küsimuste korral vaadata Geforce GTX 980 ja GTX 750 Ti arvustusi, milles kirjutasime üksikasjalikult Maxwelli arhitektuurist, voogesituse multiprotsessorite seadmest (Streaming Multiprocessor - SMM) , mälu alamsüsteemi korraldus ja mõned muud arhitektuurilised erinevused. Samuti saate vaadata selliseid funktsioone nagu riistvaratugi kiirendatud VXGI globaalse valgustuse arvutuste jaoks, uued täisekraani antialiasingud ja täiustatud DirectX 12 graafika API võimalused.

Uute tehniliste protsesside väljatöötamisega seotud probleemide lahendamine

Võime julgelt väita, et 28 nm protsessitehnoloogiast on videokaartide turul kõik juba ammu väsinud – jälgime seda juba neljandat aastat ning esialgu ei suutnud TSMC sammugi edasi teha ning siis tundus, et on võimalik 20 nm tootmist alustada, aga kasutu, et suurte GPUde jaoks seda ei olnud - sobivate tootlus on suht väike ja kulutatud 28 nm-ga võrreldes eeliseid ei leitud. Seetõttu pidid Nvidia ja AMD olemasolevatest võimalustest võimalikult palju välja pigistama ja Maxwelli kiipide puhul see Nvidial selgelt õnnestuski. Võimsuse ja energiatõhususe osas on selle arhitektuuriga GPU-dest saanud selge samm edasi, millele AMD lihtsalt ei reageerinud – vähemalt mitte veel.

Nii suutsid Nvidia insenerid GM204-st GK104-ga võrreldes palju rohkem jõudlust välja pigistada sama energiatarbimise tasemega, kuigi kiip suurenes kolmandiku võrra ja transistoride suurem tihedus võimaldas nende arvu veelgi suurendada. - 3,5 miljardilt 5,2 miljardile On selge, et sellistes tingimustes osutus GM204-l palju rohkem täitmisüksusi, mis andis tulemuseks suurema 3D jõudluse.

Kuid Maxwelli arhitektuuri suurima kiibi puhul ei saanud Nvidia disainerid kiibi suurust liiga palju suurendada, võrreldes GK110-ga on selle pindala juba umbes 550 mm 2 ja see ei olnud võimalik suurendada oma pindala kolmandiku või vähemalt veerandi võrra - sellise GPU tootmine muutuks liiga keeruliseks ja kulukaks. Pidin midagi ohverdama (võrreldes vanema Kepleriga) ja sellest millestki sai topelttäpsusega arvutuste jõudlus - selle tempo on GM200-s täpselt sama, mis teistel Maxwelli lahendustel, kuigi vanem Kepler oli mitmekülgsem, sobis graafiliste ja mittegraafiliste arvutuste jaoks.

See otsus ei olnud Kepleri jaoks lihtne - liiga suure osa selle kiibi pindalast hõivasid CUDA FP64 tuumad ja muud spetsiaalsed arvutusüksused. Suure Maxwelli puhul otsustati graafikaülesannetega hakkama saada ja see tehti lihtsalt GM204 suurendatud versioonina. Uus GM200 kiip on muutunud puhtalt graafiliseks, sellel pole FP64 arvutuste jaoks spetsiaalseid plokke ja nende kiirus jääb samaks - vaid 1/32 FP32-st. Kuid suurem osa GK110 pindalast, mille hõivasid FP64 ALU-d, vabastati ja nende asemele paigutati graafika jaoks olulisemad FP32 ALU-d.

Selline samm võimaldas oluliselt suurendada graafika (ja andmetöötluse, kui võtta FP32 arvutused) jõudlust võrreldes GK110-ga ilma energiatarbimist suurendamata ja kristalli pindala vähese suurenemisega - alla 10%. Huvitav on see, et Nvidia läks seekord teadlikult graafika ja arvutuskiipide eraldamise poole. Kuigi GM200 jääb FP32 arvutustes väga tootlikuks ja Tesla spetsiaalsed lahendused ühe täpsusega arvutusteks on täiesti võimalikud, piisavad paljude teaduslike ülesannete jaoks, jääb Tesla K40 FP64 arvutuste jaoks kõige tootlikumaks.

See on muide erinevus algsest Titanist - liini esimest lahendust sai kasutada ka professionaalsel otstarbel topelttäpsusega arvutuste tegemiseks, kuna sellel on ka FP64 arvutuste määr 1/3. Ja paljud teadlased on kasutanud GTX Titanit oma CUDA rakenduste ja ülesannete jaoks stardikaardina, siirdudes edukalt Tesla lahendustele. Selleks GTX Titan X enam ei sobi, tuleb oodata järgmise põlvkonna GPU-sid. Kui neid esialgu muidugi graafika- ja arvutuskiipideks ei jaotata.

Laienduskaartidel on selline jaotus juba olemas – Tesla K80 mudelil on paar GK210 kiipi, mida videokaartides ei kasutata ja mis erinevad GK110-st kahekordse registrifaili ja ühismälu poolest arvutusülesannete suuremaks täitmiseks. Selgub, et GK210 võib pidada eranditult "arvutusprotsessoriks" ja GM200 - puhtalt "graafika" (teatud konventsionaalsusega, kuna mõlemal GPU-l on samad võimalused, vaid erinevad spetsialiseerumised).

Vaatame, mis juhtub Nvidia graafikaarhitektuuride järgmistes põlvkondades, mis on toodetud juba "õhemal" tehnilisel protsessil – võib-olla ei lähe nendes vähemalt esialgu sellist eraldamist vaja. Või vastupidi, näeme kohe ranget jaotust eri spetsialiseerumisega GPU mudeliteks (arvutusmudelid saavad rohkem arvutusvõimalusi ja graafikamudelid - näiteks TMU ja ROP plokid), kuigi arhitektuur jääb samaks.

Videokaardi disaini omadused

Aga tagasi Geforce GTX Titan X juurde. See on võimas graafikakaart, mis on mõeldud arvutimängusõpradele, seega peaks sellel olema ka sobiv välimus- tahvli ja jahuti originaalne ja soliidne disain. Sarnaselt Titan sarja varasematele lahendustele on Geforce GTX Titan X mudel kaetud alumiiniumkorpusega, mis annab videokaardile ülimalt esmaklassilise välimuse - see näeb tõesti soliidne välja.

Jahutussüsteem on samuti väga muljetavaldav – Titan X jahuti disainis on kasutatud vasesulamist aurukambrit – see jahutab GM200 GPU-d. Aurustuskamber on ühendatud suure kahe piluga alumiiniumsulamist jahutusradiaatoriga, mis hajutab videokiibilt ülekantud soojuse. Ventilaator eemaldab kuumutatud õhu väljaspool arvuti korpust, millel on üldine positiivne mõju temperatuuri režiim süsteemis. Ventilaator on väga vaikne ka ülekiirendamisel ja pika koormuse all ning tänu sellele on 250W GTX Titan X oma klassis üks vaiksemaid graafikakaarte.

Erinevalt referentsplaadist Geforce GTX 980 ei sisalda uus toode spetsiaalset eemaldatavat plaati, mis katab plaadi tagumise pinna – seda tehakse selleks, et tagada maksimaalne õhuvool PCB-le selle jahutamiseks. Plaati toiteallikaks on üks 8-kontaktiline ja üks 6-kontaktiline PCI Expressi lisatoitepistikud.

Kuna Geforce GTX Titan X on mõeldud entusiastidele, kes eelistavad maksimaalse jõudlusega lahendusi, siis kõik uue videokaardi komponendid valiti just seda silmas pidades ning isegi mõningase varuga funktsioonide ja omaduste osas.

Näiteks Geforce GTX Titan X graafikaprotsessori energiaga varustamiseks kasutatakse 6-faasilist toitesüsteemi koos täiendava võimenduse võimalusega. GDDR5 mälu töö tagamiseks kasutatakse täiendavalt teist kahefaasilist toitesüsteemi. Videokaardi 6 + 2-faasiline toitesüsteem tagab kõnealusele mudelile enam kui piisava võimsuse isegi ülekiirendamise korral. Seega on Titan X võrdlusplaat võimeline andma GPU-le kuni 275W võimsust eeldusel, et sihtvõimsuse (võimsuse sihtmärgi) maksimumväärtus on seatud 110% peale.

Samuti parandati kiirendamise potentsiaali edasiseks parandamiseks kõigi uute komponentide jahutust, võrreldes algse Geforce GTX Titan videokaardiga – ümberkujundatud plaat ja jahuti tõid kaasa parema kiirendamisvõimaluse. Selle tulemusena on peaaegu kõik Titan X näidised võimelised töötama sagedustel kuni 1,4 GHz või rohkem – sama etalonõhujahutiga.

Geforce GTX Titan X võrdlusplaadi pikkus on 267 mm, sellel on järgmised pildiväljundpistikud: üks Dual-Link DVI, üks HDMI 2.0 ja kolm DisplayPorti. Geforce GTX Titan X toetab väljundit kuni 5K eraldusvõimega kuvaritele ja on veel üks HDMI 2.0 toega graafikakaart, mis konkurendil veel puudub – see võimaldab ühendada uue toote 4K teleritega, pakkudes maksimaalset pildikvaliteeti suure värskendussagedusega 60 Hz.

Mänguarendaja tugi

Nvidia on alati olnud ettevõte, mis teeb väga tihedat koostööd tarkvaratootjatega ja eriti mänguarendajatega. Mis on ainult PhysX - kõige populaarsem mängu mootor füüsilised efektid, mida on kasutatud üle 10 aasta enam kui 500 mängus. PhysX-i laialdane kasutamine tuleneb muu hulgas sellest, et see on integreeritud ühte populaarsemasse mängumootorisse: Unreal Engine 3 ja Unreal Engine 4. Nii teatas Nvidia Game Developers Conference 2015 mänguarendajate konverentsil tasuta juurdepääs protsessori lähtekoodidele – PhysX 3.3.3 keskendunud osa C++ arendajatele Windowsi, Linuxi, OS X ja Androidi versioonides.

Arendajad saavad nüüd muuta mootori PhysX-koodi, kuidas nad soovivad, ja muudatused saab isegi siis lisada Nvidia PhysX-i põhikoodi. Tehes PhysX-i avatud lähtekoodiga avalikkusele kättesaadavaks, on Nvidia andnud oma füüsikamootorile juurdepääsu veelgi suuremale hulgale mänguarendajatele, kes saavad seda täiustatud füüsikamootorit oma mängudes kasutada.

Nvidia jätkab teise oma tehnoloogia, üsna uue VXGI dünaamilise globaalse valgustuse simulatsiooni algoritmi reklaamimist, mis hõlmab teise põlvkonna Maxwelli GPU-dega videokaartide, näiteks Geforce GTX Titan X, spetsiaalse riistvarakiirenduse tuge.

VXGI kasutuselevõtt mängu võimaldab arendajatel pakkuda reaalajas väga kvaliteetset dünaamilise globaalse valgustuse arvutust, kasutades kõiki kaasaegsete GPU-de võimalusi ja pakkudes kõrgeimat jõudlust. Globaalse valgustuse arvutamise tähtsuse mõistmiseks (renderdamisel võetakse arvesse mitte ainult valgusallikate otsest valgustust, vaid ka selle peegeldust kõikidelt stseeni objektidelt), vaadake lihtsalt paari pilti – GI-ga ja ilma:

On selge, et see näide on kunstlik ja tegelikkuses kasutavad mängudisainerid globaalse varjutuse simuleerimiseks spetsiaalseid meetodeid, lisatulede paigutamist või eelnevalt arvutatud valgustust – kuid enne VXGI tulekut polnud need kas täielikult dünaamilised (eelarvutatud staatilise elektri jaoks). geomeetria) või ei olnud piisavalt realistlik ja/või jõudlus. Tulevastes mängudes on VXGI-d täiesti võimalik kasutada ja mitte ainult parimatel GPU-del.

VXGI tehnika on olnud mänguarendajate seas väga populaarne. Vähemalt paljud neist on seda meetodit katsestseenides proovinud, on tulemustest väga põnevil ja kaaluvad selle lisamist oma mängudesse. Ja siin on veel üks stseen globaalse valgustuse kvaliteetse arvutusega - see näitab ka, kui oluline on võtta arvesse stseeni kõigilt pindadelt peegelduvaid valguskiiri:

Kuigi arendajad pole VXGI-d oma mootoritesse juurutanud, saate kasutada Unreal Engine 4 VXGI GitHubi mootori eriversiooni, mis on saadaval kõigile huvitatud arendajatele - see võimaldab VXGI-d kiiresti oma mängu integreerida (ja mitte ainult! ) projektid, mis kasutavad seda populaarset mängumootorit – see aga nõuab mõningaid muudatusi, VXGI-d ei saa lihtsalt "lubada".

Mõelgem veel ühele Nvidia tehnoloogiale – täisekraanil MFAA-meetodil antialiasing, mis tagab suurepärase jõudluse ja samal ajal vastuvõetava antialiase kvaliteedi. Oleme sellest meetodist juba kirjutanud ja kordame vaid lühidalt olemust ja vaatenurki. MFAA tugi on Maxwelli GPU-de üks peamisi omadusi võrreldes eelmise põlvkonna GPU-dega. Kasutades võimalust programmeerida MSAA-meetodil antialiasing-näidiste positsioone, muudavad need näidised iga kaadrit selliselt, et MFAA on peaaegu täisväärtuslik MSAA, kuid GPU-le on väiksem koormus.

Selle tulemusel näeb pilt sisse lülitatud MFAA-ga välja peaaegu nagu MSAA-ga, kuid jõudluse kadu on palju väiksem. Näiteks MFAA 4x tagab kiiruse, mis on samaväärne MSAA 2x-ga ja antialiasingu kvaliteet on MSAA 4x-le lähedane. Seetõttu on nendes mängudes, kus jõudlusest kõrge kaadrisageduse saavutamiseks ei piisa, MFAA kasutamine igati õigustatud ja võib kvaliteeti parandada. Siin on näide MSAA ja MFAA tulemuslikkusest Titan X graafikakaardil võrreldes tavalise Titaniga (4K eraldusvõimega):

MFAA antialiasing ühildub kõigi MSAA toega DirectX 10 ja DirectX 11 mängudega (erandiks on haruldased projektid nagu Dead Rising 3, Dragon Age 2 ja Max Payne 3). MFAA saab käsitsi lubada Nvidia juhtpaneelil. Samuti on MFAA integreeritud Geforce Experience'i ning see meetod lubatakse automaatselt erinevate mängude jaoks Geforce Experience'i abil optimeerimise korral. Ainus probleem on selles, et hetkel ei ühildu MFAA endiselt Nvidia SLI tehnoloogiaga, mida nad lubavad parandada videodraiverite tulevastes versioonides.

Kaasaegsed mängud Geforce GTX Titan X-l

Kogu oma võimsuse ja võimalustega on Geforce GTX Titan X võimeline toime tulema mitte ainult praeguste mängudega, vaid ka tulevaste projektidega, toetades eelseisvat DirectX 12 versiooni. kvaliteet, täisekraani antialiasing lubatud ja kõrge eraldusvõimega renderdus – nagu 4K.

Kõrge eraldusvõime ja lubatud antialiasingu korral muutub võimas mälu alamsüsteem eriti oluliseks ning Geforce GTX Titan X on sellega kõik korras – 384-bitine mäluliides ja efektiivsel 7 GHz sagedusel töötavad kiibid tagavad ribalaiuse 336,5 GB / s - kuigi see pole rekord, on see üsna korralik.

Ja väga oluline on ka see, et kõik andmed mahuksid videomällu, sest kui MSAA on paljudes mängudes 4K resolutsiooniga lubatud, siis videomälu mahust lihtsalt ei piisa – vaja läheb üle 4 GB mälu. Ja Titan X-l pole mitte ainult 6 GB, vaid koguni 12 GB videomälu, sest see rida on loodud just neile entusiastidele, kes ei salli kompromisse. On selge, et sellise hulga sisemälu korral ei pea mängija mõtlema, kas mängu jõudlus kõrge eraldusvõimega väheneb, kui multisampling on lubatud - kõigis mängudes on mis tahes seadete korral 12 GB rohkem. kui piisavalt.

Praegu saab absoluutselt igas mängus määrata mis tahes sätteid ja valida mis tahes eraldusvõime – Titan X tagab piisava kaadrisageduse (peaaegu) igas olukorras. Siin on mängud, mille Nvidia valis oma lahenduse toimivuse demonstreerimiseks:

Nagu näete, on kaadrisagedus 40 kaadrit sekundis või suurem enamikus "raskeimates" kaasaegsetes mängudes, millel on täisekraani antialiasing sisse lülitatud, sealhulgas projektid nagu Far Cry 4 - selles mängus Ultra seadete ja anti- - 4K eraldusvõimega varjunime kasutamine on vastuvõetava renderduskiiruse saavutamine võimalik ainult Titan X või mitme kiibi konfiguratsioonides.

Ja tulevikumängude väljalaskmisega, millel on DirectX 12 tugi, võime oodata veelgi suuremat GPU ja videomälu jõudluse nõuete tõusu - renderdamise kvaliteedi parandamist ei anta "tasuta". Muide, Nvidia polnud selleks ajaks veel testinud oma Titan X graafikakaarti viimases mängus, mis ilmus üsna hiljuti - Grand Theft Auto V PC-versioonis. See mänguseeria on kaasaegsete projektide seas populaarseim, milles tegutsete erinevate kuritegelike elementidena Los Santose linna maastikel, mis on kahtlaselt sarnane tõelise Los Angelesega. GTAV PC-versioon oli väga oodatud ja lõpuks ilmus aprilli keskel – kuu aega pärast Titan X-i.

Isegi Grand Theft Auto V mängu konsooliversioonid (räägime muidugi praeguse põlvkonna konsoolidest) olid pildikvaliteedi poolest üsna head ja mängu PC-versioon pakub selle parandamiseks veel mitmeid võimalusi: a oluliselt suurenenud joonistuskaugus (objektid, efektid, varjud), võimalus mängida 60 kaadrit sekundis või rohkem, sealhulgas eraldusvõimega kuni 4K. Lisaks lubavad need rikkalikku ja tihedat liiklust, palju dünaamilisi objekte stseenis, täiustatud ilmaefekte, varje, valgustust jne.

Paari Nvidia GameWorksi tehnoloogia kasutamine on GTAV-is pildi kvaliteeti veelgi parandanud. Tuletage meelde, et GameWorks on spetsiaalne platvorm mängude ja graafika arendajatele, pakkudes neile 3D-tehnoloogiaid ja utiliite, mis on loodud Nvidia videokaartide jaoks. GameWorksi tehnoloogiate lisamine mängudele võimaldab suhteliselt lihtsalt saavutada kvaliteetset realistlikku suitsu, villa ja karvade, lainete, aga ka globaalse valgustuse ja muude efektide imitatsiooni. GameWorks muudab arendajate jaoks asjad lihtsamaks, pakkudes näiteid, teeke ja SDK-sid, mis on mängukoodis kasutamiseks valmis.

Grand Theft Auto V kasutab paari neist Nvidia tehnoloogiatest: ShadowWorks Percentage-Closer Soft Shadows (PCSS) ja Temporal Anti-Aliasing (TXAA), mis parandavad mängu niigi head graafikat. PCSS on spetsiaalne varjude renderdamise tehnika, mille kvaliteet on parem kui tüüpilistel pehmete varjude meetoditel. PCSS-il on kolm eelist: varjude servade pehmus oleneb varju heitava objekti ja pinna vahelisest kaugusest, millele see on joonistatud, samuti tagab see parema filtreerimise, mis vähendab artefaktide hulka varjude sakiliste servade kujul, ja varjupuhvri kasutamine võimaldab õigesti käsitleda erinevate objektide varjude ristumisi ja vältida "topelt" varjude tekkimist.

Selle tulemusena pakub mäng PCSS-i sisselülitamisel pehmeid realistlikke dünaamilisi varje, mis on palju parema kvaliteediga kui see, mida nägime. mängukonsoolid. Ja sellise mängu jaoks nagu Grand Theft Auto V, kus ere päike liigub pidevalt üle horisondi, on varjude kvaliteet väga oluline, need on alati silmapiiril. Järgmistelt ekraanipiltidelt näete erinevust kahe mängus kasutatud kõrgeima kvaliteediga meetodi vahel (AMD algoritm versus Nvidia meetod):

Selgelt on näha, et PCSS-meetod võimaldab saada varjude pehmeid servi, mis on järk-järgult hägustunud, mida rohkem, mida kaugemal on kaugus objekti vahel, millest vari asub, ja pinna vahel, mis varju "vastu võtab". Samal ajal ei mõjuta PCSS-i kaasamine mängu lõpptulemust peaaegu üldse. Kuigi see meetod tagab parema varjukvaliteedi ja realistlikkuse, on selle valiku sisselülitamine jõudluse jaoks praktiliselt "tasuta".

Teine oluline täiendus GTAV arvutiversioonile on Nvidia TXAA antialiasing meetod. Temporal Anti-Aliasing on uus antialiasing algoritm, mis on loodud spetsiaalselt tavapäraste antialiasingu meetodite probleemide lahendamiseks, mida nähakse liikumisel – kus üksikud pikslid vilguvad. Selle meetodi abil ekraanil olevate pikslite filtreerimiseks kasutatakse näidiseid mitte ainult piksli sees, vaid ka väljaspool seda, samuti koos eelmiste kaadrite näidistega, mis võimaldab teil saada "kino" filtreerimiskvaliteedi.

Meetodi eelis MSAA ees on eriti märgatav sellistel poolläbipaistva pinnaga objektidel nagu muru, puulehed ja aiavõrgud. TXAA aitab ka siluda pikslite kaupa efekte. Üldiselt on meetod väga kvaliteetne ja läheneb 3D-graafikas kasutatavate professionaalsete meetodite kvaliteedile, kuid tulemus pärast TXAA-d on võrreldes MSAA-ga veidi hägusem, mis ei meeldi kõigile kasutajatele.

TXAA lubamise tulemus sõltub mängust ja tingimustest ning korreleerub peamiselt MSAA kiirusega, mida ka selles meetodis kasutatakse. Kuid võrreldes puhaste järeltöötlusmeetoditega, nagu FXAA, mis tagavad maksimaalse kiiruse madalama kvaliteediga, on TXAA eesmärk maksimeerida kvaliteeti mõne täiendava jõudluse löögi korral. Kuid maailma sellise rikkalikkuse ja detailirohkega, nagu näeme Grand Theft Auto V-s, on kvaliteetse antialiasi lisamine üsna kasulik.

Mängu arvutiversioonil on rikkalikud graafikaseaded, mis võimaldavad teil saada vajaliku pildikvaliteedi nõutava jõudlusega. Seega pakub GTAV PC-s vastuvõetavat renderduskiirust ja -kvaliteeti kõigis Nvidia lahendustes, alates umbes Geforce GTX 660-st. Noh, mängu kõigi graafiliste efektide täielikuks nautimiseks on soovitatav kasutada midagi sellist nagu Geforce GTX 970/980. või isegi Titan x.

Seadete kontrollimiseks on mängu sisse ehitatud jõudlustest – see etalon sisaldab viit reaalsele mängule lähedast stseeni, mis võimaldab hinnata mängu renderduskiirust erinevate riistvarakonfiguratsioonidega arvutis. Kuid Nvidia graafikakaartide omanikud saavad seda hõlpsamini teha, optimeerides mängu oma arvuti jaoks, kasutades Geforce Experience'i. See tarkvara valib ja konfigureerib optimaalsed sätted säilitades samal ajal mängitava renderduskiiruse – ja seda kõike tehakse ühe nupuvajutusega. Geforce Experience leiab parima funktsioonide kombinatsiooni nii FullHD monitoriga Geforce GTX 660 kui ka 4K-teleriga Titan X jaoks, pakkudes konkreetse süsteemi jaoks parimaid seadeid.

GTAV-mängu täielik tugi ilmus uues Geforce'i draiverite versioonis 350.12 WHQL, millel on selle rakenduse jaoks spetsiaalne optimeeritud profiil. See draiveriversioon pakub optimaalset mängusisest jõudlust, sealhulgas muid Nvidia tehnoloogiaid: 3D Vision, 4K ruumiline heli, dünaamiline ülieraldusvõime (DSR), GameStream, G-SYNC (ruumiline heli), mitme kaadri proovivõtu aliasing (MFAA), protsentuaalne lähedus Pehmed varjud (PCSS), SLI ja palju muud.

Samuti sisaldab 350.12 WHQL spetsiaalne draiver mitme mängu jaoks uuendatud SLI profiile, sealhulgas uut Grand Theft Auto V profiili. Lisaks SLI profiilidele värskendab ja lisab draiver profiile nii 3D Visioni tehnoloogia jaoks ning GTAV profiil oli hinnatud "Suurepärane", mis tähendab selles mängus suurepärast stereopildi kvaliteeti – vastavate prillide ja monitoride omanikel tasub seda proovida!

Virtuaalreaalsuse tehnoloogiate tugi

Virtuaalreaalsuse (Virtual Reality – VR) teema on nüüd mängutööstuses üks valjemaid. Paljuski on VR-i vastu huvi elavnemises "süüdi" Oculuse ettevõte, mille Facebook seejärel omandas. Seni on nad näidanud ainult prototüüpe või SDK-sid, kuid neil on plaanis sel aastal välja anda Oculus Rifti kiivri kommertsversioon. Ka teised ettevõtted ei jää kõrvale. Näiteks, kuulus firma Valve on teatanud plaanist teha koostööd HTC-ga, et 2015. aasta lõpuks välja anda ka oma VR-peakomplekt.

Loomulikult näevad VR-is tulevikku ka GPU-tootjad ning Nvidia teeb tihedat koostööd virtuaalreaalsuse tarkvara- ja riistvaralahenduste tarnijatega, et tagada nende võimalikult mugav töö Geforce'i videokaartidega (või isegi Tegraga, kes teab?) . Ja need pole pelgalt turundusloosungid, sest selleks, et VR-i kasutamine oleks mugav, tuleb lahendada mitmeid probleeme, sealhulgas vähendada viivitust mängija tegevuse (pea liigutamise) ja sellest tuleneva selle liigutuse kuvamise vahel ekraanil – liiga suur viivitus ei riku lihtsalt virtuaalreaalsuse kogemust, vaid võib põhjustada nn liikumishaigust (haigus, liikumishaigus).

Selle latentsuse vähendamiseks toetab Nvidia VR Directi tarkvara funktsiooni, mida nimetatakse asünkroonseks ajakõveraks. Asünkroonse ajavääratuse kasutamisega saab mõni aeg tagasi renderdatud stseen liikuda mängija pealiigutuste põhjal, mille kiivri andurid hiljem salvestavad. See vähendab toimingu ja pildi renderdamise vahelist latentsust, kuna GPU ei pea enne nihutamist kogu kaadrit ümber arvutama. Nvidia pakub juba VR-rakenduste arendajatele draiverite tuge ja nad saavad oma tarkvaras rakendada asünkroonseid ajamoonutusi.

Lisaks väljundi viitele on väga oluline saavutada virtuaalreaalsuse kiivris mugav mängimine, mitte ainult kõrge kaadrisageduse tagamiseks, vaid kaadri kuvamiseks iga silma jaoks võimalikult sujuva muutusega. Seetõttu soovivad paljud mängijad pärast tulevase põlvkonna VR-kiivrite populariseerimist proovida neid kaasaegsetes mängudes, mis nõuavad GPU võimsust. Ja mõnel juhul peate looma kahe kiibiga SLI konfiguratsiooni paarist võimsast videokaardist nagu Geforce GTX Titan X.

Maksimaalse mugavuse tagamiseks sellistel juhtudel pakub Nvidia VR SLI tehnoloogiat, mis võimaldab mänguarendajatel määrata paarist igale silmale konkreetse GPU, et vähendada latentsust ja parandada jõudlust. Sel juhul renderdab vasaku silma pilti üks GPU ja parema silma jaoks teine ​​GPU. See ilmne lahendus vähendab latentsust ja sobib ideaalselt VR-rakenduste jaoks.

Seni pole VR SLI ja asünkroonne ajakõverdus avalikult saadaval Nvidia draiverid, kuid see pole eriti vajalik, sest nende kasutamine eeldab mängude käivitatava koodi muutmist. Nvidia valitud partneritele, nagu Epic, Crytek, Valve ja Oculus, on saadaval väljalaskeeelsed Geforce'i videodraiverid, mis toetavad VR SLI-d ja Asynchronous Time Warpi. Noh, avalik draiver vabastatakse müügil olevate lõplike VR-toodete väljaandmisele lähemal.

Lisaks kasutati sellist võimsat graafikakaarti nagu Geforce GTX Titan X paljudel virtuaalreaalsuse demonstratsioonidel tänavusel Game Developers Conference 2015. Siin on vaid mõned näited: "Thief in the Shadows" – Nvidia, Epic ühisarendus. , Oculus ja WETA Digital, visuaalefektide stuudio The Hobbit Movie Trilogy taga, Back to Dinosaur Island on Cryteki kuulsa 14-aastase X-Isle: Dinosaur Island demo ja Valve'i portaali taaskäivitamine ”, “Töösimulaator”, “TheBluVR”. ” ja „Galerii”. Üldiselt sõltub see VR-kiivrite müügile ilmumisest ja Nvidia on selleks valmis.

Järeldused teoreetilise osa kohta

Arhitektuuri seisukohalt osutus Maxwelli arhitektuuri teise põlvkonna uus tipptasemel GPU väga huvitavaks. Sarnaselt tema õdedele-vendadele kasutab GM200 parimat ettevõtte varasematest arhitektuuridest, lisades funktsionaalsust ja kõiki Maxwelli teise põlvkonna täiustusi. Seetõttu näeb uudsus funktsionaalselt väga hea välja, vastates Geforce GTX 900 sarja mudelitele. Täitmisüksuste tõsise uuenduse abil saavutasid Nvidia insenerid Maxwellis jõudluse ja voolutarbimise suhte kahekordistamise, funktsionaalsuse lisamisel tuletame meelde VXGI globaalse valgustuse kiirenduse ja graafika API DirectX 12 riistvaratuge.

Tipptasemel Geforce GTX Titan X graafikakaart on mõeldud ülimalt entusiastlikele mängijatele, kes soovivad uusimate arvutimängude ülimat kvaliteeti ja jõudlust, mis töötavad kõrgeima eraldusvõimega, kõrgeima kvaliteediga seadetega, täisekraanil anti- aliasing ja seda kõike vastuvõetava kaadrisagedusega. Ühest küljest vajavad vähesed mängud nii võimsat GPU-d ja saate installida paar odavamat videokaarti. Teisest küljest eelistavad paljud mängijad suurema latentsusaja ja ebaühtlase kaadrisagedusega mitmekiibiliste lahenduste probleemide tõttu ühte võimsat GPU-d paarile vähem võimsale. Rääkimata sellest, et ühe kiibiga kaart tagab ka väiksema energiatarbimise ja jahutussüsteemi müra.

Loomulikult on sellistel tingimustel Geforce GTX Titan X peamine probleem lahenduse hind. Kuid tõsiasi on see, et seda müüakse nišis, kus hinna ja hinna ja kvaliteedi suhte kontseptsioone lihtsalt pole vaja - maksimaalse jõudlusega lahendused on alati märgatavalt kallimad kui neile lähedased, kuid siiski mitte nii produktiivsed. Ja Titan X on ülivõimas ja kallis graafikakaart neile, kes on nõus maksma 3D-rakenduste maksimaalse kiiruse eest.

Geforce GTX Titan X on positsioneeritud esmaklassilise (luksuslik, eliit – kuidas seda nimetada) videokaardiks ning soovitatava hinna osas ei tohiks kurta – seda enam, et sarja varasemad lahendused (GTX Titan ja GTX Titan) Must) maksis algselt täpselt sama palju - 999 dollarit. See on lahendus neile, kes vajavad hoolimata selle hinnast kiireimat GPU-d. Veelgi enam, rikkaimatele entusiastidele ja 3D-etalonide rekordiomanikele on saadaval kolme ja isegi nelja Titan X videokaardiga süsteemid – need on lihtsalt maailma kiireimad videosüsteemid.

Need on nõuded, mida Titan X täielikult õigustab ja pakub – tipptasemel uudsus, isegi üksinda, näitab kõigis mängurakendustes ja peaaegu kõigis tingimustes (eraldusvõime ja seaded) suurimat kaadrisagedust ning kiiret GDDR5 videomälu 12 GB võimaldab teil mitte mõelda kohaliku mälu puudumisele mitu aastat ette - isegi tulevaste põlvkondade mängud, mis toetavad DirectX 12 jne, lihtsalt ei suuda seda mälu nii palju ummistada, et sellest ei piisa.

Nagu 2013. aasta esimese GTX Titani puhul, seab GTX Titan X esmaklassilises graafikasegmendis jõudluse ja funktsionaalsuse osas uue lati. Omal ajal sai GTX Titan Nvidia jaoks üsna edukaks tooteks ja pole kahtlust, et GTX Titan X kordab oma eelkäija edu. Pealegi on Maxwelli arhitektuuri suurimal videokiibil põhinev mudel muutunud ilma igasuguste reservatsioonideta turu tootlikumaks. Kuna videokaarte nagu GTX Titan X toodab Nvidia ise ja müüb oma partneritele võrdlusnäidiseid, pole selle väljakuulutamise hetkest peale poodides saadavuse probleeme olnud.

GTX Titan X elab igas mõttes oma kõrgeima tasemeni: Maxwelli perekonna võimsaim GPU, varasemate Titani mudelite stiilis suurepärane graafikakaartide disain, aga ka suurepärane jahutussüsteem – tõhus ja vaikne. 3D-renderduse kiiruse poolest on see meie aja parim videokaart, mis pakub enam kui kolmandiku võrra suuremat jõudlust võrreldes parimate mudelitega, mis tulid välja enne Titan X-i – nagu Geforce GTX 980. Ja kui te ei arvesta kahe- kiipvideosüsteemid (nagu paar sama GTX 980 või üks Radeon R9 295X2 konkurendilt, kellel on mitme kiibi konfiguratsioonidele omased probleemid), siis võib Titan X-i nimetada parimaks lahenduseks mittevaestele entusiastidele.

Materjali järgmises osas uurime uue Nvidia Geforce GTX Titan X videokaardi renderduskiirust praktikas, kõrvutades selle kiirust AMD võimsaimate videosüsteemide jõudlusega ja Nvidia eelkäijate jõudlusega. meie tavalistes sünteetilistes testides ja seejärel mängudes.

NVIDIA esimene Pascali arhitektuur, mis turule jõudis, oli GP104 protsessoril põhinev GeForce GTX 1080. Tänu uuele 16 nm FinFET protsessitehnoloogiale ning kiibi arhitektuuri ja vooluringide optimeerimisele saavutab GTX 1080 mängu jõudluse taseme, mis on ligikaudu 30% kõrgem kui NVIDIA lipulaeva graafikakaardi eelmise põlvkonna puhul. GeForce GTX TITAN X. Samal ajal õnnestus GTX 1080 arendajatel vähendada kiirendi võimsuseelarvet 70 vatti võrreldes eelkäija TDP-ga - 250 vatilt 180 vatile. Samal ajal on 250 W TDP standardne sihtmärk NVIDIA tipptasemel mängugraafikakaartidele mitmes valdkonnas. viimased põlvkonnad, seega oli veelgi produktiivsema toote ilmumine pärast GTX 1080, mis selle niši Pascali sarjas hõivaks, vaid aja küsimus.

Alates Kepleri arhitektuurist on NVIDIA võtnud kasutusele järgmise strateegia GPU-de vabastamiseks erinevates jõudluskategooriates. Esiteks debüteerib teise astme kiip: GK104 Kepleri perekonnas, GM204 Maxwelli versioonis 2 ja nüüd GP104 Pascalis. Seejärel täidab NVIDIA ühe või kaks madalamat taset ja pärast märkimisväärset tühimikku ilmub tipptasemel GPU, mis on NVIDIA võimsaima kiirendi aluseks, säilitades samal ajal praeguse töövoo juures energiatarbimise 250 W piires.

Pascali arhitektuuri praegune tipp on GP100 protsessor, millel on enneolematu arv Shader ALU-sid (3840 CUDA südamikku) ja 16 GB HBM2 mälu, mis on kombineeritud GPU-ga ränisubstraadil. GP100 on kasutusel osana Tesla P100 kiirendist, mille kasutamine on NVLINK siini ja 300 W TDP-ga spetsiaalse kujuteguri tõttu piiratud superarvutite valdkonnaga. Ka Tesla P100 peaks aasta lõpus ilmuma standardses PCI Expressi laienduskaardi formaadis.

Just GP100 kiip oleks tööstuse entusiastide unistustes pidanud tulevikus kroonima GeForce 10 mänguadapterite sarja ja NVIDIA oleks võinud varem välja anda uue TITAN-i – just vahepeatusega sellel kohal, eelmine suur GPU-d saabusid mänguarvutitesse (GK110 TITANi osana ja GM200 - TITAN X-is).

Sel korral osutus aga ilmselt õigus ekspertidel, kes ennustasid NVIDIA GPU liini lõplikku jagunemist kaheks mittekattuvateks rühmaks - ühelt poolt mängukiibid ja prosumer (sõnadest tootja ja tarbija) suunad. ja teiselt poolt arvutikiibid. Sel juhul on eristav tegur GPU kiirus kahekordse täpsusega ujukomaarvude (FP64) operatsioonides. Kepleri sarjas on arendajad selle omaduse juba ohverdanud kõigi kiipide jaoks (1/24 FP32-st), välja arvatud vanemal - GK110/GK210 (1/3 FP32-st), et vähendada GPU energiatarbimist. Järgmises põlvkonnas see trend halvenes: kõik Maxwelli protsessorid töötavad FP64 kiirusega 1/32 FP32-st.

Olukord Pascaliga näitas, et FP64 jõudluse säästmine ei jäänud 28 nm protsessitehnoloogia viivituse tõttu ajutiseks meetmeks. NVIDIA vajab endiselt GPU-d serverite, superarvutite ja tööjaamade jaoks, mis suudavad FP64 kõrge jõudlusega toime tulla. Mänguvideoadapterite jaoks on see transistori eelarvet ja GPU energiatarbimist paisuv funktsionaalsus aga vaid koormaks.

Seega, selle asemel, et portida GP100 (ilmselgelt kallis kiip nii ala kui ka integreeritud HBM2 mälu tõttu toota) mänguritele mõeldud videokaartidele, andis NVIDIA välja lisatoote – GP102, mis keskendus toimingutele FP32-ga – põhilise numbrivorminguga, mida kasutatakse. 3D-graafika renderdamisel ja paljudes arvutusülesannetes. ainuke funktsionaalne omadus GP102 - int8-vormingus täisarvuliste operatsioonide tugi. See on NVIDIA jaoks oluline punkt, kuna int8 kasutatakse laialdaselt masinõppeülesannetes, mille ettevõte on endale üheks prioriteediks seadnud (täpsemalt on selliste ülesannete üks klasse sügavõpe). Lähiajal on plaanis avaldada sellele teemale pühendatud eraldi artikkel.

Uus TITAN X, esimene GP102 protsessoril põhinev seade, on positsioneeritud peamiselt professionaalse taseme kiirendina, mis on mõeldud sügava õppimisega seotud uurimis- ja kaubanduslikeks rakendusteks. Seda kinnitab GeForce'i kaubamärgi puudumine kaardi nimes. Siiski ei kahtle ka uudsuse laiad mänguvõimalused. Kõiki varem välja antud titaane peeti lisaks nende arvutusfunktsioonidele esmaklassilisteks mängugraafikakaartideks, mis suutsid pakkuda graafika kvaliteeti ja jõudlust, mida nende praegustele GeForce'i põhisarja mudelitele ei pakutud.

NVIDIA GP102

See GPU on mõeldud alternatiivina superarvutile GP100, mis ei jää viimasele alla 3D-graafika ja FP32 arvutuste funktsioonide poolest. Samas on GP102 loojad vähendanud kõiki komponente, mis ei vasta toote otstarbele.

Näiteks GP100 üksainus SM (Streaming Multiprocessor – plokk, mis ühendab CUDA südamikud koos tekstuuri kaardistamise üksuste, planeerijate, dispetšerite ja kohalike mälusegmentidega) GP100-s sisaldab FP32 toimingute jaoks 64 CUDA südamikku, samas kui GP102 SM on selles suhtes päritud. Maxwellilt: 128 CUDA südamikku. CUDA tuumade peenem jaotus GP100-s võimaldab protsessoril korraga täita rohkem käsuvooge (ja ka lõimerühmi – lõime – ja lõimeplokke) ning SM-is olevate salvestustüüpide koguhulka, näiteks ühismälu (jagatud mälu) ja registrifail, on kogu GPU osas Maxwelli arhitektuuriga võrreldes suurenenud.

NVIDIA GP102 plokkskeem

Lisaks on GP100-s FP32 toimingute iga 64 CUDA südamiku kohta FP64 jaoks 32 südamikku, samas kui GP102 SM-i konfiguratsioon on selles suhtes päritud Maxwellilt: FP32 jaoks on 128 CUDA südamikku ja FP64 jaoks 4 tuuma. Sellest ka GP102 kärbitud topelttäpsus.

Lõpuks kannab GP100 suuremat L2 vahemälu: 4096 KB versus GP102 3072 KB. Ja loomulikult puudub GP102-l NVLINK siinikontroller ja HBM2 mälukontrollerid (kogu siini laiusega 4096 bitti) on asendatud GDDR5X SDRAM-kontrolleritega. 12 neist 32-bitistest kontrolleritest pakuvad ühist 384-bitist mälupöördussiini.

Muudes meid huvitavates aspektides on GP100 ja GP102 kiibid identsed. Mõlemad stantsid sisaldavad 3840 FP32-ga ühilduvat CUDA südamikku ja 240 tekstuurikaardistajat ning 96 ROP-i. Seega üldisest vaatenurgast kordab GP102 arvutusüksuste struktuur GP104 kiibi struktuuri, mida on kohandatud kvantitatiivsete muutustega. Kuigi me veel ei tea mõningaid parameetreid (L1 vahemälu, ühismälu ja registrifailide suurused), on need tõenäoliselt nendes kahes GPU-s samad.

GP102 kiip, mis on toodetud TSMC 16 nm FinFET protsessitehnoloogia abil, sisaldab 12 miljardit transistorit 471 mm 2 suurusel alal. Võrdluseks: GP100 omadused on 15,3 miljardit transistorit ja 610 mm 2. See on väga oluline erinevus. Lisaks, kui TSMC ei ole suurendanud fotomaski suurust 16 nm protsessi jaoks võrreldes 28 nm-ga, on GP100 peaaegu ammendatud, samas kui GP102 kerge arhitektuur võimaldab NVIDIA-l luua laiemale tarbijaturule suurema tuuma. tulevikus, kasutades sama tootmisliini. (Mida aga tõenäoliselt ei juhtu, kui arendajad oma tippmudelite TDP-standardeid ümber ei mõtle).

Seoses Pascali arhitektuuri ja Maxwelli vaheliste erinevustega soovitame vaadata meie GeForce GTX 1080 ülevaadet. Selle iteratsiooni käigus on arendajad välja töötanud eelmise põlvkonna eelised ja kompenseerinud selle loomupärased puudused.

Märgime lühidalt järgmisi punkte:

  • täiustatud värvide tihendamine suhtega kuni 8:1;
  • PolyMorph Engine'i funktsioon Simultaneous Multi-Projection, mis võimaldab luua kuni 16 stseeni geomeetria projektsiooni ühe käiguga (VR ja mitme ekraaniga süsteemide jaoks NVIDIA Surroundi konfiguratsioonis);
  • võimalus katkestada (eelmakse) joonistuskõne (renderdamise ajal) ja käsuvoo (arvutuste ajal) ajal, mis koos GPU arvutusressursside dünaamilise jaotusega pakub täielikku tuge asünkroonsele andmetöötlusele (Async Compute) - täiendav jõudluse allikas mängudes DirectX 12 API all ja vähenenud latentsus VR-is;
  • DisplayPort 1.3/1.4 ja HDMI 2.b liidestega ühilduv kuvakontroller. Suure dünaamilise ulatuse (HDR) tugi;
  • Suurenenud ribalaiusega SLI siin.

Tehnilised andmed, hind

TITAN X ei kasuta GP102 GPU täisfunktsionaalset versiooni: 30 SM-ist on kaks siin keelatud. Seega CUDA tuumade ja tekstuuriühikute arvult ühtib Titan Tesla P100-ga, kus on osaliselt “lõigatud” ka GP100 kiip (3584 CUDA südamikku ja 224 tekstuuriühikut).

Uudsuse graafikaprotsessor töötab kõrgematel sagedustel (1417/1531 MHz) kui Tesla P100-l (superarvuti versioonis kuni 1328/1480 MHz ja PCI-Expressi plaadi vormiteguris kuni 1300 MHz). Siiski on "Titani" sagedused GeForce GTX 1080 (1607/1733 MHz) omadustega võrreldes üsna konservatiivsed. Nagu ülekiirendamise katsetes näeme, oli piiravaks teguriks seadme voolutarve, mille NVIDIA määras tuttavale 250 W.

TITAN X on varustatud 12 GB GDDR5X SDRAM-iga, mille ribalaius on 10 Gbps kontakti kohta. 384-bitine siini tagab andmeedastuse kiirusega 480 GB / s: selles indikaatoris on TITAN X vaid veidi madalam praegusest rekordiomanikust - Radeon R9 Fury X-st, aga ka muudest GPU-l Fidžil põhinevatest AMD toodetest ( 512 GB / s).

Tootja NVIDIA
Mudel GeForce GTX TITAN GeForce GTX TITAN must GeForce GTX TITAN Z GeForce GTX TITAN X GeForce GTX 1080 TITAN X
GPU
Nimi GK110 GK110 2 × GK110 GM200 GP104 GP102
mikroarhitektuur Kepler Kepler Kepler Maxwell Pascal Pascal
Protsessi tehnoloogia, nm 28 nm 28 nm 28 nm 28 nm 16nm FinFET 16nm FinFET
Transistoride arv, miljonit 7 080 7 080 2 × 7080 8 000 7 200 12 000
Kellasagedus, MHz: põhikell / võimenduskell 837/876 889/980 705/876 1 000 / 1 089 1 607 / 1 733 1 417 / 1531
Varjurite ALUde arv 2 688 2 880 2 × 2880 3 072 2 560 3 584
Tekstuuri ülekatete arv 224 240 2 × 240 192 160 224
ROP-ide arv 48 48 2×48 96 64 96
RAM
Bussi laius, bitt 384 384 2 × 384 384 256 384
Kiibi tüüp GDDR5 SDRAM GDDR5 SDRAM GDDR5 SDRAM GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM
Kellasagedus, MHz (ribalaius kontakti kohta, Mbps) 1 502 (6 008) 1 750 (7 000) 1 750 (7 000) 1 753 (7 012) 1 250 (10 000) 1 250 (10 000)
Maht, MB 6 144 6 144 2 × 6144 12 288 8 192 12 288
I/O buss PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Esitus
Maksimaalne jõudlus FP32, GFLOPS (põhineb maksimaalsel määratud sagedusel) 4 709 5 645 10 092 6 691 8 873 10 974
Jõudlus FP32/FP64 1/3 1/3 1/3 1/32 1/32 1/32
RAM-i ribalaius, GB/s 288 336 2 × 336 336 320 480
Pildi väljund
Pildiväljundi liidesed DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-D, DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-I, DisplayPort 1.2, HDMI 1.4a DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b
TDP, W 250 250 375 250 180 250
Soovitatav jaehind avaldamise ajal (USA, ilma maksudeta), $ 999 999 2 999 999 599/699 1 200
Soovitatav jaehind vabastamise ajal (Venemaa), hõõruda. 34 990 35 990 114 990 74 900 — / 54 990

Teoreetilise jõudluse osas on TITAN X esimene ühe GPU-ga graafikakaart, mis ületab FP32 jõudluses 10 TFLOPS-i. Varasematest NVIDIA toodetest oli selleks võimeline vaid paarile GK110 kiibile ehitatud TITAN Z. Teisest küljest, erinevalt Tesla P100-st (ja sarnaselt GeForce GTX 1060/1070/1080-le), iseloomustab TITAN X-i väga tagasihoidlik jõudlus kahekordse (1/32 FP32-st) ja poole täpsusega (1/64 FP32-st). arvutusi, kuid on võimeline sooritama toiminguid int8 numbritega kiirusega, mis on 4 korda suurem kui FP32 puhul. Teised Pascali perekonna GPU-d – GP104 (GeForce GTX 1070 /1080, Tesla P4) ja GP106 (GTX 1060) ja GP100 (Tesla P100) toetavad samuti int8 jõudlussuhtega 4:1 võrreldes FP32-ga, kuid praegu me ei tea seda kui see on GeForce'i mängugraafikakaartides piiratud funktsionaalsusega.

TITAN X on väga-väga kallis ost, mille kasuks otsustavad vaid need, kes tõesti nii täiuslikku videokaarti omada tahavad. NVIDIA on selle kaubamärgi all olevate varasemate ühe pesaga mudelitega võrreldes hinda tõstnud 200 dollari võrra 1200 dollarile.Seekord ei levita seadet partnerite kaudu ja seda müüakse valitud riikides ainult NVIDIA veebisaidil. Venemaa pole veel nende hulgas.

Disain

Videokaardi korpus on valmistatud samas stiilis Founders Editioni kaubamärgi all olevate toodetega GeForce 10. Radiaalventilaatoriga (turbiiniga) jahutussüsteem on kaetud metallkorpusega ning trükkplaadi tagapind. tahvel on kaitstud paksu plaadiga. Osa viimasest saab eemaldada, et tagada SLI-režiimis külgneva videokaardi jahutile takistamatu õhu juurdepääs. Naljakas, et kuigi formaalselt TITAN X enam GeForce’i perekonda ei kuulu, lehvib videokaardi küljel ikkagi see roheliste LED-lampidega valgustatud kiri.

Jahuti disain on sama, mis GTX 1070/1080-l: GPU annab soojust aurustuskambriga jahutusradiaatorile, RAM-i kiibid ja pingemuunduri transistorid on kaetud massiivse alumiiniumraamiga, mis kannab eraldi plokki. väikestest uimedest.

Muide, nagu üks TITAN X omanikest teada sai, võimaldab NVIDIA kasutajatel muuta videokaardi jahutussüsteemi millegi tõhusama vastu (näiteks LSS), ilma et see garantii kaotaks.

Maksma

Sarnaselt GTX 1060/1070/1080 võrdlusversioonidele on ka TITAN X plaadil kolm DisplayPort-pistikut ning üks DVI ja HDMI.

Toitesüsteem on ehitatud vastavalt skeemile 6 + 1 (faaside arv GPU ja mälukiipide jaoks). Kasutatakse kahte täiendavat toitepistikut - kuue- ja kaheksakontaktilist, mis koos PCI-Expressi pistiku elektriliinidega annavad videokaardile 300-vatise võimsusreservi.

GDDR5X SDRAM-mälu, nagu ka GeForce GTX 1080-l, koosneb Micron D9TXS mikroskeemidest standardse efektiivse sagedusega 10 GHz.

Katsestend, testimise metoodika

Testistendi konfiguratsioon
Protsessor Intel Core i7-5960X @ 4GHz (100 × 40)
Emaplaat ASUS RAMPAGE V EXTREME
RAM Corsair Vengeance LPX, 2133 MHz, 4 × 4 GB
ROM Intel SSD 520 240 GB + Crucial M550 512 GB
Toiteallikas Corsair AX1200i 1200W
CPU jahutussüsteem Thermalright Archon
Raam CoolerMasteri katsestend V1.0
Ekraan NEC EA244UHD
Operatsioonisüsteem Windows 10 Pro x64
AMD GPU tarkvara
Kõik Radeoni tarkvara Crimson Edition 16.8.2, mitte-WHQL
NVIDIA GPU tarkvara
Kõik GeForce'i mänguvalmidusega draiver 372.54 WHQL

CPU töötab konstantsel sagedusel. NVIDIA draiveri sätetes valitakse protsessor PhysX-i arvutamiseks protsessoriks. AMD draiveri sätetes on säte Tesselation teisaldatud AMD optimeeritud valikust Kasuta rakenduse sätteid.

Etalonid: mängud
Mäng (väljalaskekuupäeva järjekorras) API Seaded Täisekraani antialiasing
1920 × 1080 / 2560 × 1440 3840 × 2160
Crysis 3 + FRAPS DirectX 11 Max kvaliteet. Rabamissiooni algus MSAA 4x Väljas
Battlefield 4 + FRAPS Max kvaliteet. Tashgari missiooni algus MSAA 4x + FXAA kõrge
Metroo: Last Light Redux, sisseehitatud etalon Max kvaliteet SSAA 4x
GTA V, sisseehitatud etalon Max kvaliteet MSAA 4x + FXAA
DiRT ralli Max kvaliteet MSAA 4x
Tomb Raideri tõus, sisseehitatud etalon DirectX 12 Max kvaliteet, VXAO väljas SSAA 4x
Tom Clancy's The Division, sisseehitatud etalon DirectX 11 Max kvaliteet, HFTS väljas SMAA 1x Ultra
HITMAN, sisseehitatud etalon DirectX 12 Max kvaliteet SSAA 4x
Ashes of the Singularity, sisseehitatud etalon DirectX 12 Max kvaliteet MSAA 4x + Ajutine AA 4x
HUKATUS Vulkan Max kvaliteet. Missioon Valukoda TSSAA 8TX
Total War: WARHAMMER, sisseehitatud etalon DirectX 12 Max kvaliteet MSAA 4x
Võrdlusnäitajad: video dekodeerimine, andmetöötlus
Programm Seaded
DXVA Checker, Decode Benchmark, H.264 Failid 1920 × 1080p (kõrge profiil, L4.1), 3840 × 2160p (kõrge profiil, L5.1). Microsoft H264 videodekooder
DXVA Checker, Decode Benchmark, H.265 Failid 1920 × 1080p (põhiprofiil, L4.0), 3840 × 2160p (põhiprofiil, L5.0). Microsoft H265 videodekooder
LuxMark 3,1x64 Hotelli fuajee etapp (kompleksne võrdlusalus)
Sony Vegas Pro 13 Sony võrdlusalus Vegas Pro 11 jaoks, kestus 65 s, renderdatud XDCAM EX-is, 1920 × 1080p 24 Hz
SiSoftware Sandra 2016 SP1, GPGPU teaduslik analüüs OpenCL, FP32/FP64
CompuBench CL Desktop Edition X64, ookeanipinna simulatsioon
CompuBench CL Desktop Edition X64, osakeste simulatsioon – 64K

Testis osalejad

Toimivuse testimisel osalesid järgmised videokaardid:

  • NVIDIA TITAN X (1417/10000 MHz, 12 GB);

Esitus: 3DMark

Sünteetilised testid näitavad TITAN X-i keskmist eelist GeForce GTX 1080 ees 25%. Võrreldes TITANi kaubamärgi eelmise põlvkonna, aga ka Radeon R9 Fury X-ga, pakub uus lipulaev 61-63% suuremat jõudlust ja enam kui kahekordset jõudlust võrreldes Kepleri arhitektuuril põhineva TITANi esimese versiooniga. Võrreldes NVIDIA kiirendiga on üsna kõrgel positsioonil Radeon R9 295X2 - uus toode on 3DMarkis vaid 18% kiirem.

3DMark (graafiline skoor)
Luba
tulelöök 1920 × 1080 26 341 10 449 17 074 21 648 23 962 16 279
Fire Strike Extreme 2560 × 1440 13 025 4 766 7 945 10 207 10 527 7 745
Fire Strike Ultra 3840 × 2160 6 488 2 299 4 011 4 994 5 399 3 942
aja spioon 2560 × 1440 8 295 2 614 4 935 6 955 7 186 5 084
Max −60% −35% −16% −9% −38%
Keskmine −64% −38% −20% −15% −39%
Min. −68% −41% −23% −19% −41%



Jõudlus: mängimine (1920 × 1080, 2560 × 1440)

Nii võimsa GPU jaoks suhteliselt madala eraldusvõimega testides ületab uus TITAN X keskmiste tulemuste poolest GeForce GTX 1080 15-20% (vastavalt 1080p kuni 1440p). Uus lipulaev näeb 28 nm perioodi parimate kiirenditega võrreldes veelgi muljetavaldavam välja: see on 47-56% kiirem kui GM200-l põhinev GeForce GTX TITAN X ja 67-72% Radeon R9 Fury X-st.

Kui võtame Kepleri põlvkonna kõige esimese TITANi, siis räägime jõudluse enam kui kahekordsest kasvust.

1920 × 1080
Täisekraani antialiasing NVIDIA TITAN X (1417/10000 MHz, 12 GB) NVIDIA GeForce GTX TITAN (837/6008MHz, 6 GB) NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 GB) AMD Radeon R9 295X2 (1018/5000 MHz, 8 GB) AMD Radeon R9 Fury X (1050/1000 MHz, 4 GB)
Singulaarsuse tuhk MSAA 4x 47 20 31 42 34 26
Battlefield 4 MSAA 4x + FXAA kõrge 162 71 118 149 134 94
Crysis 3 MSAA 4x 99 45 65 79 90 60
DiRT ralli MSAA 4x 126 57 83 101 97 65
HUKATUS TSSAA 8TX 200 69 151 185 122 156
gta v MSAA 4x + FXAA 85 44 68 84 76 52
HITMAN SSAA 4x 68 21 39 52 24 33
Metroo: Last Light Redux SSAA 4x 124 47 73 92 94 70
Tomb Raideri tõus SSAA 4x 70 28 47 62 55 41
Tom Clancy osakond SMAA 1x Ultra 87 35 59 80 57 58
Täielik sõda: WARHAMMER MSAA 4x 76 38 56 73 37 49
Max −48% −20% −0% −9% −22%
Keskmine −58% −32% −13% −29% −40%
Min. −69% −43% −26% −65% −51%
2560 × 1440
Täisekraani antialiasing NVIDIA TITAN X (1417/10000 MHz, 12 GB) NVIDIA GeForce GTX TITAN (837/6008MHz, 6 GB) NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 GB) AMD Radeon R9 295X2 (1018/5000 MHz, 8 GB) AMD Radeon R9 Fury X (1050/1000 MHz, 4 GB)
Singulaarsuse tuhk MSAA 4x 39 16 24 33 27 21
Battlefield 4 MSAA 4x + FXAA kõrge 109 47 75 98 95 65
Crysis 3 MSAA 4x 63 27 40 53 59 39
DiRT ralli MSAA 4x 93 40 60 74 71 48
HUKATUS TSSAA 8TX 166 45 95 126 82 107
gta v SMAA 67 31 48 63 61 39
HITMAN MSAA 4x + FXAA 43 13 24 33 12 17
Metroo: Last Light Redux SSAA 4x 71 26 43 52 54 43
Tomb Raideri tõus Ei toetata 44 16 28 38 23 27
Tom Clancy osakond SSAA 4x 63 24 43 58 45 44
Täielik sõda: WARHAMMER SMAA 1x kõrge 57 26 39 50 25 34
Max −53% −29% −6% −6% −30%
Keskmine −61% −36% −16% −33% −42%
Min. −73% −44% −27% −72% −60%

Märge:




Jõudlus: mängimine (3840 × 2160)

1440p-lt 4K-le liikudes jääb NVIDIA graafikakaartide suhe samaks. TITAN X on 20% kiirem kui GeForce GTX 1080 ja 56% kiirem kui Maxwellil põhinev TITAN X.

Sellele mudelile omane Radeon R9 Fury X tuleb 4K-s testidega tõhusamalt toime, mis lõpuks kahandas "Titani" eelise 56%-ni.

3840 × 2160
Täisekraani antialiasing NVIDIA TITAN X (1417/10000 MHz, 12 GB) NVIDIA GeForce GTX TITAN (837/6008MHz, 6 GB) NVIDIA GeForce GTX TITAN X (1000/7012MHz, 12GB) NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 GB) AMD Radeon R9 295X2 (1018/5000 MHz, 8 GB) AMD Radeon R9 Fury X (1050/1000 MHz, 4 GB)
Singulaarsuse tuhk Väljas 45 20 29 41 38 37
Battlefield 4 84 35 57 74 72 52
Crysis 3 42 18 28 36 40 29
DiRT ralli 65 26 41 50 48 33
HUKATUS 92 24 51 68 45 57
gta v 55 25 39 51 49 34
HITMAN 67 21 38 53 24 33
Metroo: Last Light Redux 64 23 38 47 47 38
Tomb Raideri tõus 50 19 33 44 37 31
Tom Clancy osakond 38 15 25 33 26 28
Täielik sõda: WARHAMMER 43 20 30 38 20 32
Max −53% −29% −7% −5% −18%
Keskmine −61% −36% −16% −29% −36%
Min. −74% −45% −27% −64% −51%

Märge: Total War: WARHAMMER ei toeta DirectX 12 GeForce GTX TITAN jaoks.

Jõudlus: video dekodeerimine

GP102 integreerib sama riistvarakoodeki, mis Pascali perekonna kaks noorem GPU-d, nii et TITAN X demonstreerib H.264 ja HEVC standardite dekodeerimiskiirust, mis on samaväärne GeForce GTX 1080-ga, mis on kohandatud madalamate GPU taktsageduste jaoks. Pascali jõudlus selles ülesandes on ületamatu nii Maxwelli kiipide NVIDIA koodekite kui ka AMD Polarise koodekitega võrreldes.

Märge: kuna tavaliselt ei erine dekoodrid sama GPU rea piires, on diagrammidel igast perekonnast üks seade (või rohkem, kui seda reeglit rikutakse).

Märge. 2: GeForce GTXTITAN X, nagu teisedki Maxwell GPU arhitektuuril põhinevad seadmed, välja arvatud GM204 (GeForce GTX 950/960), teostab osalise H.265 riistvara dekodeerimise, mida varundavad protsessori ressurssid.

Jõudlus: andmetöötlus

Erinevate arhitektuuride vaheline seos GPGPU ülesannetes sõltub iga rakenduse eripärast. TITAN X pakub enamasti GeForce GTX 1080-ga võrreldes prognoositavat jõudlust, kuid on erandjuhtudel, kus ülesanne sõltub GPU sagedusest (nagu osakeste füüsika test CompuBench CL-is ja renderdamine Sony Vegases): siin eelis on GTX 1080 poolel. Vastupidi, uus TITAN X maksis kätte olukorras, kus GeForce GTX 1080 jääb alla Maxwellil põhinevale TITAN X-ile ja Radeon R9 Fury X-le (kiirte jälgimine LuxMarkis).

SiSoftware Sandra maatrikskorrutamise ja kiire Fourier' teisenduse testis on TITAN X suurepärane FP32 režiimis. Mis puutub FP64-sse, siis lihtsalt toore jõu tõttu (suur hulk CUDA tuumasid ja kõrged taktsagedused) saavutas kiirendi suurema jõudluse kui Kepleri põlvkonna algne TITAN ja Radeon R9 Fury X - soodsama suhtega videokaardid. jõudlust FP32 ja FP64 abil. Lõppkokkuvõttes ei vähenda see täielikult TITAN X-i kui kahekordse täpsusega ülesannete kiirendit. Selleks otstarbeks sobib aga kõige paremini Radeon R9 295X2. AMD videokaardid hoiavad tugevaid positsioone ka mõnes teises testis: veepinna arvutamisel CompuBench CL-is ja Sony Vegases.

Kellasagedused, energiatarve, temperatuur, kiirendamine

Mängukoormuse korral saavutab TITAN X GPU perioodiliselt sama kõrge taktsageduse kui GP104 GTX 1080-s (1848 vs. 1860 MHz), kuid enamasti jääb see oluliselt madalamasse vahemikku (1557-1671 MHz). Samal ajal on maksimaalne GPU toitepinge 1,062 V (1,05 V GTX 1080 puhul).

CO ventilaator pöörleb kiirusel kuni 2472 pööret minutis. Kaart vajab tugevamat jahutust kui GTX 1080 ja kuna jahedama disain on jäänud muutumatuks, tekitab see rohkem müra. Selle teguri kompenseerimiseks on TITAN X seatud 3 °C kõrgemaks GPU sihttemperatuuriks.

Kuigi tehniliselt on Pascal-põhine TITAN X sama TDP-ga kui eelmise põlvkonna TITAN X, siis praktikas arendab uue videokaardiga süsteem oluliselt rohkem võimsust (49 W võrra). Siiski võib siin rolli mängida suurenenud koormus protsessorile, mis teenindab tõhusamat graafikaprotsessorit. FurMarkis on seevastu kõik 250 W TDP-ga kiirendid (nagu ka 275 W Fury X) samal tasemel.

Titani ülekiirendamiseks kasutasime ära olemasolevat võimalust suurendada graafikakaardi võimsuspiirangut 20%, käivitada CO turbiini täiskiirusel (4837 p/min) ja tõsta GPU maksimaalset pinget 1,093 V-ni (sama väärtus kui GTX 1080 puhul). Selle tulemusena suutsime tõsta GPU baassagedust 200 MHz võrra 1617 MHz-ni ja efektiivset mälusagedust 11100 MHz-ni.

Ainuüksi see pole nii suure kiibi puhul halb, kuid mitte vähem oluline pole suurenenud võimsuspiir. Ülekiirendatud GPU toetab sagedusi vahemikus 1974–1987 MHz, saavutades haripunkti 2063 MHz, mis pole midagi vähemat kui hämmastav saavutus. Võrdluseks: meie GTX 1080 eksemplari GPU tippsagedus oli kiirendamise ajal 2126 MHz.

Ülekiirendatud TITAN X-iga süsteem pakub 46 W rohkem võimsust kui tavaline graafikakaart. Maksimaalsele kiirusele keeratud ventilaator alandas GPU temperatuuri 17–20 °C, mis võimaldab kasutajatel eeldada sama tõhusat kiirendamist madalamatel kiirustel, pakkudes suhteliselt mugavat mürataset.

Jõudlus: kiirendamine

TITAN X kiirendamine võimaldab jõudlust väga oluliselt suurendada – 3DMarkis 14% ja 1080p ja 1440p eraldusvõimega mängude võrdlusnäitajates 18-23%. 4K eraldusvõimega mängudes ulatub boonus 26% -ni.

Erinevus ülekiirendatud TITAN X ja võrdlussagedustel töötava GeForce GTX 1080 vahel saavutab šokeerivad väärtused - 36, 47 ja 50% kolmes kasutatud eraldusvõimes. Muidugi kehtib ka GTX 1080 ise ülekiirendamisele, kuid nagu me võrdlusvideokaardi ülevaatest mäletame, lisab see tulemustele vaid 9, 13 ja 12%. Seega, kui võrrelda GeForce 10 liini ülekiirendatud lipulaeva ja ülekiirendatud TITAN X-i, jääb viimase eeliseks 25, 30 ja 34%.

Kasutades oma vanu ülekiirendatud GeForce GTX TITAN X GM200 kiibi jõudlusandmeid, teeme sarnased arvutused, et võrrelda kahte titaanide põlvkonda. Ülekiirendatud TITAN X Pascalis edestab oma eelkäijat 75, 93 ja 97%. Kui mõlemad kiirendid on ülekiirendatud, säilitab uudsus eraldusvõimega 1440p ja 2160p 74 ja 70% edumaa. Meie (nagu seda otsust kritiseerinud lugejad mäletavad) keeldusime GeForce GTX TITAN X ülevaates 1080p režiimis testimast.

3DMark (graafiline skoor)
Luba NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 GB) NVIDIA TITAN X (1417/10000 MHz, 12 GB)
tulelöök 1920 × 1080 21 648 26 341 31 038
Fire Strike Extreme 2560 × 1440 10 207 13 025 15 191
Fire Strike Ultra 3840 × 2160 4 994 6 488 7 552
aja spioon 2560 × 1440 6 955 8 295 8 644
Max +30% +51%
Keskmine +25% +42%
Min. +19% 101 126 126
HUKATUS TSSAA 8TX 185 200 200
gta v MSAA 4x + FXAA 84 85 96
HITMAN SSAA 4x 52 68 77
Metroo: Last Light Redux SSAA 4x 92 124 140
Tomb Raideri tõus SSAA 4x 62 70 94
Tom Clancy osakond SMAA 1x Ultra 80 87 117
Täielik sõda: WARHAMMER MSAA 4x 73 76 88
Max +35% +57%
Keskmine +16% +36%
Min. +0% +8%

TITAN X on positsioneeritud peamiselt GPGPU tegumikiirendina, mille hulgas on masinõpe esmatähtis, toetades GP102-s int8 numbrivormingut kiirusega 4:1 võrreldes FP32 toimingutega. Enamiku FP32-põhiste andmetöötlusrakenduste jaoks pakub TITAN X ka jõudlust, võrreldes kõigi varem välja antud mängu- ja tarbijaklassi kiirenditega.

Ärge vähendage topelttäpsusega töötamise funktsiooni. Kuigi graafikaprotsessoritel põhinevatel kaartidel, nagu NVIDIA GK110/210 ning AMD Tahiti ja Hawaii, on TITAN X-iga võrreldes parem FP32 ja FP64 suhe, saavutab see tänu oma täiustatud tootmisprotsessile selles kategoorias vähemalt konkurentsivõimelisi tulemusi. , mis andis videokaardi. suure taktsageduse ja tohutu hulga CUDA tuumadega.

Meie saidi jaoks on uus TITAN X huvitav eelkõige mänguvideokaardina. Selles osas jätab uudsus kahetise mulje. Ühest küljest ei õigusta 15-20% eelis GeForce GTX 1080 ees mängude võrdlusnäitajates ostja vaatevinklist mudeli nii kõrget hinda (1200 dollarit) ja pealegi ei võimalda endiselt palju käitada. kaasaegsetest mängudest 4K eraldusvõimega koos maksimaalse graafikakvaliteedi seadetega mugava kaadrisagedusega (60 kaadrit sekundis).

Teisest küljest ei vasta NVIDIA 250 W TDP limiit selgelt GPU võimalustele. Natiivsel ülekiirendamisel saavutab TITAN X kergesti sagedused, mis ületavad 2 GHz, mis lõppkokkuvõttes tagab 34% suurema jõudluse kui (samuti ülekiirendatud) GeForce GTX 1080 4K-režiimis. Tegelikult teeb ülekiirendamine TITAN X-ist esimeseks mängimiseks mõeldud graafikakaardi, mis sobib selliste seadete jaoks tingimusteta.

2560 × 1440
Täisekraani antialiasing NVIDIA GeForce GTX 1080 (1607/10008 MHz, 8 GB) NVIDIA TITAN X (1417/10000 MHz, 12 GB) NVIDIA TITAN X (1617/11110 MHz, 12 GB)
Singulaarsuse tuhk MSAA 4x 33 39 48
Battlefield 4 MSAA 4x + FXAA kõrge 98 109 146
Crysis 3 MSAA 4x 53 63 81
DiRT ralli MSAA 4x 74 93 93
HUKATUS TSSAA 8TX 126 166 183
gta v SMAA 63 67 86
HITMAN MSAA 4x + FXAA 33 43 49
Metroo: Last Light Redux SSAA 4x 52 71 82
Tomb Raideri tõus Ei toetata 38 44 59
Tom Clancy osakond SSAA 4x 58 63 86
Täielik sõda: WARHAMMER SMAA 1x kõrge 50 57 74
Max +36% +58%
Keskmine +20% +47%
Min.
HUKATUS 68 92 104
gta v 51 55 75
HITMAN 53 67 77
Metroo: Last Light Redux 47 64 74
Tomb Raideri tõus 44 50 69
Tom Clancy osakond 33 38 52
Täielik sõda: WARHAMMER 38 43 58
Max +37% +59%
Keskmine

NVIDIA ei kaldu aastate jooksul kujunenud traditsioonidest nii sageli kõrvale. Nii et 2015. aastal esitlevad “rohelised” väljakujunenud kevadtraditsiooni kohaselt uut ühe kiibiga lipulaeva. GeForceGTXTITANX. 2015. aasta suve alguses on tegu maailma võimsaima ühel GPU-l põhineva videokaardiga.

Uus graafikaadapter on Titansi valikus järjekorras neljas ja loogiliselt asendab see . Uudsuse keskmes on GM200 tähisega graafikatuum, mis on loodud teise põlvkonna mikroarhitektuuri alusel. Põhispetsifikatsioonide poolest on GM200 1,5x "laiendatud" GM204 tuum, millel põhineb hiljutine ühe kiibiga lipulaev. Täpsemalt on poolteist korda suurendatud CUDA tuumade, ROP ja TMU üksuste arvu ning vahemälu suurust. Vaatame lähemalt nende kahe videokaardi omadusi.

Uue lipulaeva voolutarve osutus märgatavalt suuremaks kui GTX 980 voolutarve. Loomulikult on selle põhjuseks TITAN X suurem jõudlus, mis võib 980 mudeliga võrreldes ulatuda 30%-ni. Tootja soovitab, et süsteemi toiteallikas oleks vähemalt 600 vatti.

Siin peate võib-olla tähelepanu pöörama uudsuse jahutussüsteemile. Nimelt asjaolu, et GeForce GTX TITAN X tarnitakse ametlikult eranditult võrdlusjahutiga, mis peaks tagama kõrge jõudluse madala mürataseme juures.

Mängud/Seaded 1920x1080 pxThe Witcher 3: Wild Hunt 79 kaadrit sekundisgta v 66 kaadrit sekundisBattlefield Hardline 126 kaadrit sekundisMetroo: viimane tuli 67 kaadrit sekundisCrysis 3 65 kaadrit sekundis

*Kõrgeim võimalik graafika kvaliteet

On üsna ilmne, et uus toode toetab kõiki praegu olemasolevaid NVIDIA tehnoloogiaid – SLI®, G-Sync™, GameStream™, ShadowPlay™, 2.0 GPU Boost™, Dynamic Super Resolution, MFAA, GameWorks™, OpenGL 4.5. Toetatud on ka Microsoft DirectX 12 API, millele järgneb täiendamine versioonile 12.1.

Tootja teatas kõnealuse mudeli hinnaks müügi alguses 999 dollarit. Tegelikult on see sama palju kui "mustal titaanil". Kuid kui pöörata tähelepanu uue videokaardi tohutult suurenenud jõudlusele võrreldes selle eelkäijaga, siis siin tegi NVIDIA taas suure ja õigeaegse sammu edasi.

Nvidia Geforce GTX Titan X

Kõige võimsam ühe protsessoriga kiirendi

  • 2. osa – Praktiline tutvumine

Seoses uue kiirendi (ja selle tarkvara) testnäidise hilise laekumisega, samuti meie autori Aleksei Berillo osalemisega GTC töös, on selle ülevaate osad pühendatud uue Nvidia arhitektuurile. toode ja sünteetiliste testide analüüs avaldatakse hiljem (umbes nädala pärast). Ja nüüd tutvustame materjali, mis tutvustab lugejaid videokaardi omadustega, aga ka mängutestide tulemustega.

Seade(id)



Nvidia Geforce GTX Titan X 12288MB 384-bitine GDDR5 PCI-E
ParameeterTähendusNimiväärtus (viide)
GPUGeforce GTX Titan X (GM200)
LiidesPCI Express x16
GPU töösagedus (ROP), MHz1000—1075 1000—1075
Mälu sagedus (füüsiline (efektiivne)), MHz1750 (7000) 1750 (7000)
Mäluvahetuse siini laius, bitt384
Arvutusühikute arv GPU-s / plokkide sagedus, MHz24/1000—1075 24/1000—1075
Toimingute arv (ALU) ploki kohta128
Operatsioonid kokku (ALU)3072
Tekstuuriühikute arv (BLF/TLF/ANIS)192
Rasteriseerimisplokkide arv (ROP)96
Mõõdud, mm270×100×35270×100×35
Videokaardi poolt hõivatud pesade arv süsteemiüksuses2 2
Tekstoliidi värvmustmust
Energiatarve (tipp 3D-/2D-režiimis/unerežiimis), W257/98/14 257/98/14
Müratase (2D-režiimis / 2D-režiimis (video taasesitus) / maksimaalses 3D-režiimis), dBA20/21/29,5
Väljundpesad1 × DVI (Dual-Link/HDMI), 1 × HDMI 2.0, 3 × DisplayPort 1.2
Multitöötluse tugiSLI
Maksimaalne vastuvõtjate/monitoride arv samaaegseks pildiväljundiks4 4
Abitoide: 8-kontaktiliste pistikute arv1 1
Lisatoide: 6-kontaktiliste pistikute arv1 1
Maksimaalne 2D eraldusvõime: DP/HDMI/Dual-Link DVI/Single-Link DVI
Maksimaalne 3D eraldusvõime: DP/HDMI/Dual-Link DVI/Single-Link DVI3840×2400/3840×2400/2560×1600/1920×1200

Komplektis kohaliku mäluga

Kaardil on 12288 MB GDDR5 SDRAM-i, mis on paigutatud 24 4 Gb kiibile (12 PCB mõlemal küljel).

DirectX 11 sünteetiliste testidena kasutasime näiteid Microsofti ja AMD SDK-dest ning Nvidia demoprogrammist. Esimene neist on HDRToneMappingCS11.exe ja NBodyGravityCS11.exe DirectX SDK-st (veebruar 2010). Võtsime rakendusi ka mõlemalt videokiibi tootjalt: Nvidia ja AMD. Alates ATI Radeon Võeti SDK näidised DetailTessellation11 ja PNTriangles11 (need on ka DirectX SDK-s). Lisaks kasutati Nvidia Realistic Water Terrain demoprogrammi, tuntud ka kui Island11.

Sünteetilised testid viidi läbi järgmiste videokaartidega:

  • Geforce GTX Titan X GTX Titan X)
  • Geforce GTX Titan Z standardsete parameetritega (lühendatult GTX Titan Z)
  • Geforce GTX 980 standardsete parameetritega (lühendatult GTX 980)
  • Radeon R9 295X2 standardsete parameetritega (lühendatult R9 295X2)
  • Radeon R9 290X standardsete parameetritega (lühendatult R9 290X)

Geforce GTX Titan X videokaardi uue mudeli jõudluse analüüsimiseks valiti need lahendused järgmistel põhjustel. Geforce GTX 980 põhineb sama Maxwelli arhitektuuriga, kuid madalama tasemega graafikaprotsessoril - GM204 ja meil on väga huvitav hinnata, mida andis kiibi keerukus GM200-le. Noh, Geforce GTX Titan Z kahe kiibiga videokaart võeti lihtsalt viitamiseks - kui kõige produktiivsem Nvidia videokaart, mis põhineb eelmise Kepleri arhitektuuri GK110 kiibil.

Rivaalselt ettevõttelt AMD valisime võrdluseks ka kaks graafikakaarti. Need on põhimõtteliselt väga erinevad, kuigi põhinevad samadel Hawaii GPU-del – neil on lihtsalt kaartidel erinev arv GPU-sid ja need erinevad nii asukoha kui ka hinna poolest. Geforce GTX Titan X-l hinnakonkurente pole, seega võtsime võimsaima kahekiibilise videokaardi Radeon R9 295X2, kuigi tehniliselt poleks selline võrdlus kuigi huvitav. Viimase jaoks võeti konkurendi kiireim ühekiibiline videokaart Radeon R9 290X, mis ilmus küll liiga kaua aega tagasi ja põhineb selgelt väiksema keerukusega GPU-l. Kuid AMD lahenduste hulgast pole lihtsalt muud valikut.

Direct3D 10: PS 4.0 pikslivarjutuse testid (tekstuurimine, silmus)

Loobusime iganenud DirectX 9 etalonitest, kuna ülivõimsad lahendused nagu Geforce GTX Titan X ei näita neis kuigi häid tulemusi, kuna neid piirab alati mälu ribalaius, täitekiirus või tekstureerimine. Rääkimata sellest, et kahekiibilised videokaardid ei tööta sellistes rakendustes alati õigesti ja meil on neid kaks.

RightMark3D teine ​​versioon sisaldab kahte juba tuttavat PS 3.0 testi Direct3D 9 jaoks, mis kirjutati ümber DirectX 10 jaoks, ja veel kahte uut testi. Esimene paar lisas võimaluse lubada isevarjutust ja varjundi supersämplingut, mis lisaks suurendab videokiipide koormust.

Need testid mõõdavad pikslivarjutajate toimivust tsüklitega, millal suurel hulgal tekstuurinäidised (kõige raskemas režiimis kuni mitusada näidist piksli kohta) ja suhteliselt väike ALU koormus. Teisisõnu mõõdavad nad tekstuuri toomise kiirust ja hargnemise efektiivsust pikslivarjutajas.

Esimene pikslivarjutuse test on karusnahk. Madalaimate seadistuste korral kasutab see kõrguskaardilt 15–30 tekstuurinäidist ja põhitekstuurist kahte näidist. Efekti detail - "Kõrge" režiim suurendab proovide arvu 40-80-ni, "shader" supersampling'i kaasamine - kuni 60-120 proovi ja "High" režiimi koos SSAA-ga iseloomustab maksimaalne "raskusaste" - kõrguskaardilt 160 kuni 320 näidist.

Kontrollime esmalt režiime, kus supersampling pole lubatud, need on suhteliselt lihtsad ning tulemuste suhe režiimides "Madal" ja "Kõrge" peaks olema ligikaudu sama.

Selle testi jõudlus sõltub TMU-de arvust ja efektiivsusest ning mõjutab ka keeruliste programmide täitmise efektiivsust. Ja ilma supersämplimiseta versioonis on tõhus täituvus ja mälu ribalaius jõudlusele täiendav mõju. Tulemused "Kõrge" taseme täpsustamisel on kuni poolteist korda madalamad kui "Madala" taseme puhul.

Protseduurilise karusnaha renderdamise ülesannetes suure hulga tekstuurivalikutega ja GCN-i arhitektuuril põhinevate videokiipide väljalaskmisega on AMD juba ammu juhtpositsiooni haaranud. Just Radeoni plaadid on nendes võrdlustes tänaseni parimad, mis näitab, et need on nende programmide läbiviimisel tõhusamad. Seda järeldust kinnitab tänane võrdlus – meie poolt käsitletav Nvidia videokaart kaotas isegi vananenud ühekiibilisele Radeon R9 290X, rääkimata lähimast hinnakonkurendist AMD-lt.

Esimeses Direct3D 10 testis osutus Geforce GTX Titan X mudeli uus videokaart veidi kiiremaks kui tema noorem õde sama arhitektuuriga kiibil GTX 980 näol, kuid viimane ei jää palju alla. - 9-12%. Seda tulemust võib seletada GTX 980 märgatavalt väiksema tekstureerimiskiirusega ja see jääb teiste parameetrite osas maha, kuigi asi pole ilmselgelt ALU seadmete jõudluses. Kahe kiibiga Titan Z on kiirem, kuid mitte nii kiire kui Radeon R9 295X2.

Vaatame sama testi tulemust, kuid sisse lülitatud "shader" supersamplinguga, mis neljakordistab töö: sellises olukorras peaks midagi muutuma ja mälu ribalaius koos täitekiirusega avaldab vähem mõju:

Geforce GTX Titan X mudeli uus videokaart edestab keerulistes tingimustes juba märgatavamalt sama põlvkonna nooremat mudelit - GTX 980, olles kiirem korralikud 33-39%, mis on teoreetilisele erinevusele palju lähemal. nende vahel. Ja konkurentide mahajäämus Radeon R9 295X2 ja R9 290X näol on vähenenud - Nvidia uus toode on ühe kiibiga Radeonile peaaegu järele jõudnud. Kahekiibiline on aga kaugel ees, sest AMD kiibid eelistavad pikslite kaupa arvutusi ja on sellistes arvutustes väga tugevad.

Järgmine DX10 test mõõdab keeruliste silmustega pikslivarjutajate toimivust suure hulga tekstuurivõtetega ja seda nimetatakse järsuks parallaksi kaardistamiseks. Madalatel seadistustel kasutab see kõrguskaardilt 10–50 tekstuurinäidist ja kolme näidist põhitekstuuridest. Kui lülitate sisse raske režiimi koos isevarjutusega, siis proovide arv kahekordistub ja supersampling neljakordistab selle arvu. Kõige keerulisem supersamplimise ja isevarjutusega testirežiim valib 80–400 tekstuuriväärtust, st kaheksa korda rohkem kui lihtrežiim. Esmalt kontrollime lihtsaid valikuid ilma supersamplemiseta:

Teine Direct3D 10 pikslivarjurite test on praktilisest vaatenurgast huvitavam, kuna parallaksi kaardistamise variante kasutatakse laialdaselt mängudes ja raskeid variante, nagu järsu parallaksi kaardistamine, on pikka aega kasutatud paljudes projektides, näiteks mängudes alates Crysis, Lost Planet ja paljud teised sarjad. Lisaks saate meie testis lisaks supersamplingule sisse lülitada ka isevarjutuse, mis suurendab videokiibi koormust umbes kaks korda - seda režiimi nimetatakse "Kõrgeks".

Diagramm on üldjoontes sarnane eelmisele, ka ilma supersämplinguta ja seekord osutus uus Geforce GTX Titan X GTX Titan Z-le pisut lähemale, kaotades mitte niivõrd kahekiibil põhinevale plaadile. paaril Kepleri perekonna GPU-l. Erinevatel tingimustel on uus toode Nvidia praeguse põlvkonna eelmisest tippmudelist 14-19% ees ja isegi kui võtta võrdlus AMD videokaartidega, on siin midagi muutunud - antud juhul uus GTX Titan. X on pisut madalam kui Radeon R9 290X. Kahe kiibiga R9 295X2 on aga kõigist kaugel ees. Vaatame, mis muudab supersamplingu kaasamist:

Kui supersampling ja enesevarju on sisse lülitatud, muutub ülesanne keerulisemaks, kahe valiku kombineeritud kaasamine korraga suurendab kaartide koormust peaaegu kaheksa korda, põhjustades jõudluse tõsise languse. Testitud videokaartide kiirusnäitajate erinevus on veidi muutunud, kuigi supersamplingu kaasamine mõjub vähem kui eelmisel juhul.

AMD Radeoni graafikalahendused toimivad selles D3D10 pikslivarjutuse testis tõhusamalt kui konkureerivad Geforce'i plaadid, kuid uus GM200 kiip muudab olukorra paremaks – Maxwelli arhitektuurikiibil põhinev Geforce GTX Titan X plaat edestab juba Radeon R9 290X-i. kõikides tingimustes (põhinedes siiski märgatavalt vähem keerukal GPU-l). Hawaii paaril põhinev kahekiibiline lahendus püsib liidripositsioonil, kuid võrreldes teiste Nvidia lahendustega pole uus toode halb. See näitas kiirust peaaegu kahe kiibiga Geforce GTX Titan Z tasemel ja edestas Geforce GTX 980 28-33%.

Direct3D 10: PS 4.0 Pixel Shaderi võrdlusnäitajad (arvuti)

Järgmised paar pikslivarjutuse testi sisaldavad minimaalset arvu tekstuuri tõmbamisi, et vähendada TMU jõudluse mõju. Nad kasutavad suurt hulka aritmeetilisi tehteid ja mõõdavad täpselt videokiipide matemaatilist jõudlust, aritmeetiliste juhiste täitmise kiirust pikslivarjutajas.

Esimene matemaatika kontrolltöö on mineraal. See on keerukas protseduuriline tekstureerimise test, mis kasutab ainult kahte tekstuuriandmete näidist ja 65 sin ja cos käsku.

Piiravate matemaatiliste testide tulemused vastavad enamasti sageduste ja arvutusühikute arvu erinevustele, kuid ainult ligikaudselt, kuna tulemusi mõjutab nende erinev tõhusus konkreetsetes ülesannetes ja draiverite optimeerimine ning uusim sagedus ja arv. toitehaldussüsteemid ja isegi rõhuasetus mälu ribalaiusele. Minerali testi puhul on uus Geforce GTX Titan X mudel vaid 10% kiirem kui sama põlvkonna GM204 kiibil põhinevast GTX 980 plaadist ning kahekiibiline GTX Titan Z selles testis nii kiire ei olnud. - miski takistab selgelt Nvidia plaatide avamist.

Geforce GTX Titan X võrdlemine AMD konkureerivate emaplaatidega poleks nii kurb, kui R9 290X ja Titan X GPU-d oleksid keerukuse poolest lähedased. Kuid GM200 on palju suurem kui Hawaii ja selle väike võit on loomulik. Nvidia arhitektuuriuuendus Keplerilt Maxwellile on toonud uued kiibid sellistes testides konkureerivatele AMD lahendustele lähemale. Kuid isegi odavam kahekiibiline lahendus Radeon R9 295X2 on märgatavalt kiirem.

Vaatleme varjundite arvutuste teist testi, mida nimetatakse tuleks. See on ALU jaoks raskem ja selles on ainult üks tekstuurivõtt ning sin ja cos juhiste arv on kahekordistunud, kuni 130. Vaatame, mis on koormuse suurenemisega muutunud:

RigthMarki teises matemaatilises testis näeme videokaartide puhul üksteise suhtes juba erinevaid tulemusi. Niisiis, uus Geforce GTX Titan X on sama graafikaarhitektuuriga kiibil juba tugevam (20%) GTX 980 ees ja kahe kiibiga Geforce on uuele tootele väga lähedal - Maxwell tuleb arvutusülesannetega palju toime. parem kui Kepler.

Radeon R9 290X jääb maha, aga nagu juba kirjutasime, on Hawaii GPU märgatavalt lihtsam kui GM200 ja see erinevus on loogiline. Kuid kuigi kahe kiibiga Radeon R9 295X2 on matemaatikatestides jätkuvalt liider, sai uus Nvidia videokiip sellistes ülesannetes üldiselt hästi hakkama, kuigi teoreetilise erinevuseni GM204-ga ei jõudnud.

Direct3D 10: geomeetria varjundi testid

RightMark3D 2.0-s on kaks geomeetria varjundi kiiruskatset, esimene valik kannab nime "Galaxy", tehnika sarnaneb Direct3D eelmiste versioonide "point spraitidega". See animeerib GPU-l osakeste süsteemi, iga punkti geomeetriavarjutaja loob neli tippu, mis moodustavad osakese. Sarnaseid algoritme tuleks tulevastes DirectX 10 mängudes laialdaselt kasutada.

Geomeetria varjundi testides tasakaalu muutmine ei mõjuta lõpptulemust, lõpppilt on alati täpselt sama, muutuvad ainult stseeni töötlemise meetodid. Parameeter "GS load" määrab, millises varjundis arvutused tehakse – tipus või geomeetrias. Arvutuste arv on alati sama.

Vaatleme "Galaxy" testi esimest versiooni koos arvutustega tipuvarjutis kolme geomeetrilise keerukuse taseme jaoks:

Stseenide erineva geomeetrilise keerukusega kiiruste suhe on kõikide lahenduste puhul ligikaudu sama, jõudlus vastab punktide arvule, iga sammuga on FPS-i langus ligi kahekordne. See ülesanne on võimsate kaasaegsete videokaartide jaoks väga lihtne ja selle jõudlust piirab geomeetria töötlemise kiirus ja mõnikord ka mälu ribalaius ja/või täituvus.

Nvidia ja AMD kiipidel põhinevate videokaartide tulemuste erinevus kaldub enamasti California firma lahenduste kasuks ning selle põhjuseks on nende firmade kiipide geomeetriliste torustike erinevused. Ka sel juhul on parimatel Nvidia videokiipidel palju geomeetrilisi töötlusseadmeid, nii et kasu on ilmne. Geomeetria testides on Geforce plaadid alati konkurentsivõimelisemad kui Radeon.

Uus Geforce GTX Titan X mudel jääb eelmise põlvkonna GPU-de kahekiibilisele GTX Titan Z-plaadile pisut maha, kuid ületab GTX 980-t 12-25%. Radeoni graafikakaardid näitavad märgatavalt erinevaid tulemusi, kuna R9 295X2 põhineb paaril GPU-l ja ainult see suudab selles testis uudsusega võistelda, samas kui Radeon R9 290X oli autsaider. Vaatame, kuidas olukord osa arvutustest geomeetriavarjurisse ülekandmisel muutub:

Kui selles testis koormus muutus, muutusid numbrid veidi AMD plaatide ja Nvidia lahenduste puhul. Ja see ei muuda tegelikult midagi. Selles geomeetriavarjurite testis olevad videokaardid reageerivad halvasti muutustele GS-i koormusparameetris, mis vastutab osa arvutustest geomeetriavarjurisse ülekandmise eest, seega jäävad järeldused samaks.

Kahjuks on "Hyperlight" geomeetriavarjurite teine ​​test, mis demonstreerib mitme tehnika kasutamist korraga: esinemine, voo väljund, puhvri koormus, mis kasutab dünaamilise geomeetria loomist kahele puhvrile joonistades, samuti uus võimalus Direct3D 10 - vooväljund, lihtsalt ei tööta kõigi kaasaegsete AMD videokaartidega. Mingil hetkel katkestas Catalysti draiverite järjekordne värskendus selle testi selle ettevõtte tahvlitel ja seda pole juba mitu aastat parandatud.

Direct3D 10: tekstuuri toomise kiirus tipuvarjutajatelt

"Vertex Texture Fetch" testid mõõdavad suure hulga tekstuuri toomise kiirust tipuvarjutist. Testid on oma olemuselt sarnased, seega peaks "Maa" ja "Lainete" testide kaartide tulemuste suhe olema ligikaudu sama. Mõlemad testid kasutavad nihke kaardistamist, mis põhineb tekstuuri proovivõtu andmetel, ainus oluline erinevus on see, et test "Waves" kasutab tingimuslikke hüppeid, samas kui "Earth" test mitte.

Mõelge esimesele katsele "Earth", kõigepealt režiimis "Effect detail Low":

Meie varasemad uuringud on näidanud, et nii täitmiskiirus kui ka mälu ribalaius võivad mõjutada selle testi tulemusi, mis on selgelt näha Nvidia plaatide tulemustes, eriti lihtsates režiimides. Nvidia uus videokaart selles testis näitab, et kiirus on selgelt väiksem kui peaks - kõik Geforce'i plaadid osutusid ligikaudu samal tasemel, mis selgelt ei vasta teooriale. Kõikides režiimides puutuvad nad selgelt kokku mälu ribalaiusega. Kuid Radeon R9 295X2 pole ka ligilähedaseltki kaks korda kiirem kui R9 290X.

Muide, seekord osutus AMD ühekiibiline plaat heledas režiimis tugevamaks kui kõik Nvidia plaadid ja kõvas režiimis ligikaudu nende tasemel. Noh, kahe kiibiga Radeon R9 295X2 sai taas meie võrdluse liidriks. Vaatame sama testi toimivust suurenenud tekstuurivõtete arvuga:

Diagrammil on olukord veidi muutunud, AMD ühekiibiline lahendus rasketes režiimides on kaotanud oluliselt rohkem Geforce plaate. Uus mudel Geforce GTX Titan X näitas kiirust kuni 14% kiiremini kui Geforce GTX 980 ja edestas ühe kiibiga Radeoni kõigis režiimides, välja arvatud kõige kergem – tänu millelegi samale keskendumisele. Kui võrrelda uut toodet AMD kahekiibilise lahendusega, siis Titan X suutis võidelda raskes režiimis, näidates tihedat jõudlust, kuid jäädes maha kergetes režiimides.

Vaatleme tipuvarjutajate tekstuuri toomise teise testi tulemusi. Lainetestis on vähem valimeid, kuid see kasutab tingimuslikke hüppeid. Bilineaarsete tekstuurinäidiste arv on sel juhul kuni 14 ("Effect detail Low") või kuni 24 ("Effect detail High") tipu kohta. Geomeetria keerukus muutub sarnaselt eelmise testiga.

Teise "Waves" tiputekstuuri testi tulemused ei ole midagi sellist, mida nägime eelmistes diagrammides. Kõigi Geforce'ide kiiruse jõudlus selles testis on tõsiselt halvenenud ja uus Nvidia Geforce GTX Titan X mudel näitab kiirust vaid veidi kiiremini kui GTX 980, jäädes maha kahe kiibiga Titan Z-st. Võrreldes konkurentidega suutsid mõlemad Radeoni plaadid et näidata selles testis kõigis režiimides parimat jõudlust. Mõelge sama probleemi teisele versioonile:

Teise tekstuuri proovivõtu testi ülesande keerukusel muutus kõigi lahenduste kiirus väiksemaks, kuid rohkem said kannatada Nvidia videokaardid, sealhulgas vaadeldav mudel. Järeldustes ei muutu peaaegu midagi, uus Geforce GTX Titan X mudel on kuni 10-30% kiirem kui GTX 980, jäädes alla nii kahekiibilisele Titan Z-le kui ka mõlemale Radeoni plaatidele. Radeon R9 295X2 oli nendes testides kaugel ees ja teooria seisukohalt on see lihtsalt seletamatu, välja arvatud Nvidia ebapiisav optimeerimine.

3DMark Vantage: funktsioonide testid

3DMark Vantage paketi sünteetilised testid näitavad meile, millest me varem puudust tundsime. Selle testpaketi funktsioonitestidel on DirectX 10 tugi, need on endiselt asjakohased ja huvitavad, kuna erinevad meie omadest. Analüüsides selles paketis oleva uusima videokaardi Geforce GTX Titan X tulemusi, teeme mõned uued ja kasulikud järeldused, mis on meile RightMarki perepakettide testides kõrvale jäänud.

Funktsiooni test 1: tekstuuri täitmine

Esimene test mõõdab tekstuuri toomise üksuste jõudlust. Kasutatakse ristküliku täitmiseks väärtustega, mis on loetud väikesest tekstuurist, kasutades mitut tekstuurikoordinaati, mis muudavad iga kaadrit.

AMD ja Nvidia videokaartide kasutegur Futuremarki tekstuuritestis on üsna kõrge ning erinevate mudelite lõppnäitajad vastavate teoreetiliste parameetrite lähedal. Seega osutus GTX Titan X ja GTX 980 kiiruste erinevuseks 38% GM200 baasil põhineva lahenduse kasuks, mis on teooriale lähedane, sest uuel tootel on poolteist korda rohkem TMU ühikuid. , kuid need töötavad madalama sagedusega. Loomulikult jääb kahe GTX Titan Z mahajäämus, kuna kahel GPU-l on suurem tekstureerimiskiirus.

Mis puutub uue tipp-Nvidia videokaardi tekstureerimiskiiruse võrdlusesse konkurendi sarnase hinnaga lahendustega, siis siin jääb uudsus alla kahekiibilisele rivaalile, kes on hinnanišis tinglik naaber, kuid edestab Radeon R9 290X, kuigi mitte liiga märkimisväärselt. Sellegipoolest läheb AMD graafikakaartidel tekstureerimisega veidi paremini.

Funktsiooni test 2: värvitäide

Teine ülesanne on täitmismäära test. See kasutab väga lihtsat pikslivarjutajat, mis ei piira jõudlust. Interpoleeritud värviväärtus kirjutatakse ekraanivälisesse puhvrisse (renderdamise sihtmärk), kasutades alfa segamist. See kasutab 16-bitist FP16 ekraanivälist puhvrit, mida kasutatakse kõige sagedamini HDR-renderdust kasutavates mängudes, seega on see test üsna õigeaegne.

Teise 3DMark Vantage alamtesti numbrid näitavad ROP-ühikute jõudlust, arvestamata videomälu ribalaiust (nn "efektiivne täitmismäär") ja test mõõdab täpselt ROP-i jõudlust. Geforce GTX Titan X plaat, mida täna üle vaatame, edestab märgatavalt mõlemat Nvidia plaati, GTX 980 ja isegi GTX Titan Z, edestades GM204-l põhinevat ühekiibist plaati lausa 45% võrra – ROP-ide ja nende arvu poolest. Maxwelli arhitektuuri tipp-GPU efektiivsus on suurepärane!

Ja kui võrrelda uue Geforce GTX Titan X videokaardi stseeni täitmise kiirust AMD videokaartidega, siis selles testis käsitletav Nvidia plaat näitab parimat stseeni täitmiskiirust isegi võrreldes võimsaima kahekiibilise Radeon R9 295X2-ga. , rääkimata Radeon R9 290X tunduvalt mahajäämisest. Suur hulk ROP-plokke ja kaadripuhvri andmete tihendamise tõhususe optimeerimisi tegid oma töö.

Funktsiooni test 3: parallaksi oklusiooni kaardistamine

Üks huvitavamaid funktsiooniteste, kuna seda tehnikat kasutatakse juba mängudes. See joonistab ühe nelinurga (täpsemalt kaks kolmnurka), kasutades spetsiaalset Parallax Occlusion Mapping tehnikat, mis imiteerib keerulist geomeetriat. Kasutatakse üsna ressursimahukaid kiirte jälgimise toiminguid ja kõrge eraldusvõimega sügavuskaarti. Seda pinda varjutatakse ka raske Straussi algoritmi abil. See on videokiibi väga keeruka ja raske pikslivarjutaja test, mis sisaldab arvukalt tekstuuri tõmbamisi kiirte jälgimise, dünaamilise hargnemise ja keerukate Straussi valgustusarvutuste ajal.

See 3DMark Vantage paketist pärit test erineb eelmistest selle poolest, et selle tulemused ei sõltu ainult matemaatiliste arvutuste kiirusest, haru täitmise efektiivsusest või tekstuuri toomise kiirusest, vaid mitmest parameetrist korraga. Selle ülesande täitmisel suure kiiruse saavutamiseks on oluline GPU õige tasakaal, samuti keerukate varjundite täitmise tõhusus.

Sel juhul on oluline nii matemaatiline kui ka tekstuurijõudlus ning selles 3DMark Vantage'i "sünteetikas" osutus uus Geforce GTX Titan X plaat enam kui kolmandiku võrra kiiremaks kui sama Maxwelli arhitektuuriga GPU-l põhinev mudel. . Ja isegi kahe kiibiga Kepler GTX Titan Z kujul edestas uudsust vähem kui 10%.

Nvidia ühekiibiline tippplaat edestas selles testis selgelt ühekiiblist Radeon R9 290X, kuid mõlemat edestab tõsiselt kahekiibiline Radeon R9 295X2. AMD GPU-d on selles ülesandes mõnevõrra tõhusamad kui Nvidia kiibid ja R9 295X2-l on neid kaks.

Funktsiooni test 4: GPU riie

Neljas test on huvitav, kuna see arvutab videokiibi abil füüsilisi interaktsioone (riide imitatsiooni). Kasutatakse tipusimulatsiooni, kasutades tipu- ja geomeetriavarjurite kombineeritud toimimist, mitme käiguga. Kasutage stream out tippude ülekandmiseks ühelt simulatsioonikäigult teisele. Seega testitakse tipu- ja geomeetriavarjurite täitmise jõudlust ning voo väljavoolu kiirust.

Renderduskiirus selles testis oleneb samuti mitmest parameetrist korraga ning peamisteks mõjuteguriteks peaks olema geomeetria töötlemise jõudlus ja geomeetriavarjurite efektiivsus. See tähendab, et Nvidia kiipide tugevused peaksid ilmnema, kuid paraku - nägime väga kummalist tulemust (kontrolliti uuesti), uus Nvidia videokaart näitas pehmelt öeldes mitte liiga suurt kiirust. Geforce GTX Titan X näitas selles alamtestis kõigist lahendustest halvimat tulemust, jäädes maha isegi GTX 980-st ligi 20%!

Noh, võrdlus Radeoni plaatidega selles testis on uue toote jaoks sama inetu. Vaatamata teoreetiliselt väiksemale geomeetriliste täitmisüksuste arvule ja AMD kiipide geomeetrilisele jõudluse mahajäämusele võrreldes konkureerivate lahendustega, töötavad mõlemad Radeoni plaadid selles testis väga tõhusalt ja edestavad võrdluses kõiki kolme esitletud Geforce plaati. Jällegi tundub, et Nvidia draiverites pole konkreetse ülesande jaoks optimeeritud.

Funktsiooni test 5: GPU osakesed

Test efektide füüsiliseks simuleerimiseks, mis põhineb videokiibi abil arvutatud osakeste süsteemidel. Kasutatakse ka tipusimulatsiooni, iga tipp esindab ühte osakest. Stream outi kasutatakse samal eesmärgil nagu eelmises testis. Arvutatakse mitusada tuhat osakest, kõik on animeeritud eraldi, arvutatakse ka nende kokkupõrked kõrguskaardiga.

Sarnaselt ühele meie RightMark3D 2.0 testile joonistatakse osakesed geomeetriavarjutaja abil, mis loob osakese moodustamiseks igast punktist neli tippu. Kuid test laeb kõige enam varjude plokke koos tipuarvutustega, testitakse ka väljavoolu.

3DMark Vantage'i teises "geomeetrilises" testis on olukord tõsiselt muutunud, seekord näitavad kõik Geforce'id juba enam-vähem normaalseid tulemusi, kuigi kahe kiibiga Radeon püsib endiselt liidrikohal. Uus GTX Titan X mudel on 24% kiirem kui tema sõsar GTX 980 ja umbes sama palju alla eelmise põlvkonna GPU kahe-GPU-ga Titan Z.

Nvidia uudsuse võrdlus AMD konkureerivate videokaartidega on seekord positiivsem – see näitas tulemust konkureeriva firma kahe plaadi vahel ning osutus lähedasemaks Radeon R9 295X2-le, millel on kaks GPU-d. Uudsus on Radeon R9 290X-st kaugel ees ja see näitab meile selgelt, kui erinevad võivad kaks näiliselt sarnast testi olla: riide simulatsioon ja osakeste süsteemi simulatsioon.

Funktsiooni test 6: Perlini müra

Vantage paketi viimane funktsioonitest on videokiibi matemaatiliselt intensiivne test, see arvutab pikslivarjutajas mitu Perlini müraalgoritmi oktaavi. Iga värvikanal kasutab videokiibi koormuse suurendamiseks oma mürafunktsiooni. Perlini müra on standardne algoritm, mida sageli kasutatakse protseduurilises tekstuuris, see kasutab palju matemaatilisi arvutusi.

Sel juhul ei vasta lahenduste jõudlus päris teooriale, kuigi see on lähedal sellele, mida nägime sarnastes testides. Futuremarki paketi matemaatilises testis, mis näitab videokiipide tippjõudlust limiitülesannetes, näeme erinevat tulemuste jaotust võrreldes meie testpaketi sarnaste testidega.

Oleme juba ammu teadnud, et GCN-arhitektuuriga AMD videokiibid tulevad selliste ülesannetega endiselt paremini toime kui konkurentide lahendused, eriti kui tehakse intensiivset “matemaatikat”. Kuid Nvidia uus tippmudel põhineb suurel GM200 kiibil ja seega toimis Geforce GTX Titan X selles testis märgatavalt paremini kui Radeon R9 290X.

Kui võrrelda uut toodet Geforce GTX 900 perekonna parima mudeliga, siis antud testis oli nende vahe ligi 40% - loomulikult täna kaalutava videokaardi kasuks. See on ka teoreetilisele erinevusele lähedal. Titan X-i kohta pole paha tulemus, ainult kahe kiibiga Radeon R9 295X2 oli ees ja kaugel ees.

Direct3D 11: Arvutage varjundid

Nvidia hiljuti välja antud tipptasemel lahenduse testimiseks ülesannete jaoks, mis kasutavad DirectX 11 funktsioone, nagu tessellatsioon ja arvutusvarjutajad, kasutasime Microsofti, Nvidia ja AMD SDK näiteid ja demosid.

Esiteks vaatame võrdlusaluseid, mis kasutavad Compute shadereid. Nende välimus on üks olulisemaid uuendusi uusimad versioonid DX API, neid kasutatakse juba tänapäevastes mängudes erinevate ülesannete täitmiseks: järeltöötlus, simulatsioonid jne. Esimene test näitab näidet HDR-i renderdamisest koos toonide kaardistamisega DirectX SDK-st, järeltöötlusega pikslite ja arvutusvarjurite abil.

Kõigi AMD ja Nvidia plaatide arvutus- ja pikslivarjutajate arvutuste kiirus on ligikaudu sama, erinevusi täheldati ainult varasemate arhitektuuride GPU-del põhinevate videokaartide puhul. Meie varasemate testide põhjal otsustades ei sõltu probleemi tulemused sageli mitte niivõrd matemaatilisest võimsusest ja arvutusliku efektiivsusest, kuivõrd muudest teguritest, näiteks mälu ribalaiusest.

Sel juhul on uus tipptasemel graafikakaart kiirem kui ühekiibilised versioonid Geforce GTX 980 ja Radeon R9 290X, kuid tagapool kahekiibiline R9 295X2, mis on arusaadav, sest sellel on paari R9 võimsus. 290X. Kui võrrelda uut toodet Geforce GTX 980-ga, siis tänaseks arvestatud California firma emaplaat on 34-36% kiirem – täpselt teooria järgi.

Teine arvutusvarjurite test on samuti võetud Microsoft DirectX SDK-st ja see näitab N-keha (N-keha) gravitatsiooniarvutusprobleemi, dünaamilise osakeste süsteemi simulatsiooni, mis on allutatud füüsilistele jõududele, nagu gravitatsioon.

Selles testis on kõige sagedamini rõhk keerukate matemaatiliste arvutuste täitmise kiirusel, geomeetria töötlemisel ja koodi täitmise efektiivsusel koos hargnemisega. Ja selles DX11 testis osutus jõudude joondamine kahe erineva firma lahenduste vahel täiesti erinevaks – selgelt Geforce videokaartide kasuks.

Kummalised on aga ka erinevatel kiipidel põhineva paari Nvidia lahenduse tulemused - Geforce GTX Titan X ja GTX 980 on peaaegu võrdsed, neid lahutab jõudluses vaid 5%. Kahe kiibiga renderdamine selles ülesandes ei tööta, seega on rivaalid (ühe- ja kahekiibilised Radeoni mudelid) kiiruselt ligikaudu võrdsed. Noh, GTX Titan X on neist kolm korda ees. Tundub, et seda ülesannet arvutatakse palju tõhusamalt Maxwelli arhitektuuri GPU-del, mida me varem märkisime.

Direct3D 11: Tesselatsiooni jõudlus

Arvutusvarjutajad on väga olulised, kuid Direct3D 11 veel üks oluline uus funktsioon on riistvaraline tessellatsioon. Arutasime seda väga üksikasjalikult oma Nvidia GF100 teoreetilises artiklis. Tessellationi on DX11 mängudes kasutatud pikka aega, näiteks STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 jt. Mõned neist kasutavad tegelasmudelite jaoks tessellatsiooni, teised aga realistliku veepinna või maastiku simuleerimiseks.

Graafiliste primitiivide jaotamiseks (tessellatsioon) on mitu erinevat skeemi. Näiteks phong tessellation, PN kolmnurgad, Catmull-Clark alajaotus. Niisiis, PN-kolmnurkade plaatimisskeemi kasutatakse STALKER: Call of Pripyat ja Metro 2033 - Phong tessellatsioonis. Neid meetodeid on mänguarendusprotsessis ja olemasolevates mootorites suhteliselt kiire ja lihtne rakendada, mistõttu on need muutunud populaarseks.

Esimene tessellatsioonitest on ATI Radeoni SDK-st pärit Detail Tessellationi näide. See rakendab mitte ainult tessellatsiooni, vaid ka kahte erinevat pikslite kaupa töötlemise tehnikat: tavaliste kaartide lihtsat ülekatet ja parallaksi oklusiooni kaardistamist. Võrdleme AMD ja Nvidia DX11 lahendusi erinevates tingimustes:

Lihtsa bumpmapping testi puhul pole tahvlite kiirus kuigi oluline, kuna see ülesanne on pikka aega liiga lihtsaks muutunud ja selle jõudlus sõltub mälu ribalaiusest või täitekiirusest. Tänane ülevaatekangelane edestab GM204 kiibil põhinevat eelmist tippmudelit Geforce GTX 980 23% ja jääb veidi alla oma konkurendile Radeon R9 290X näol. Kahe kiibiga versioon on isegi veidi kiirem.

Teises keerulisemate pikslite kaupa arvutustega alamtestis on uus toode juba 34% kiirem kui Geforce GTX 980, mis on nendevahelisele teoreetilisele erinevusele lähemal. Kuid Titan X on seekord juba pisut kiirem kui ühe kiibiga tingimuslik konkurent, mis põhineb ühel Hawaiil. Kuna Radeon R9 295X2 kaks kiipi töötavad ideaalselt, saab selle ülesandega hakkama veelgi kiiremini. Kuigi matemaatiliste arvutuste jõudlus pikslivarjutajates on GCN-i arhitektuurikiipide puhul kõrgem, parandas Maxwelli arhitektuurilahenduste väljalaskmine Nvidia lahenduste positsioone.

Kerge tessellatsiooni alamtestis on hiljuti välja kuulutatud Nvidia plaat taas vaid veerandi võrra kiirem kui Geforce GTX 980 - võib-olla piirab kiirust mälu ribalaius, kuna tekstureerimisel pole selles testis peaaegu mingit mõju. Kui võrrelda uut toodet selles alamtestis AMD plaatidega, siis Nvidia plaat jääb jällegi mõlemale Radeonile alla, kuna antud tessellatsioonitestis on kolmnurga lõhenemine väga mõõdukas ja geomeetriline jõudlus üldist renderduskiirust ei piira.

Teine tessellatsiooni jõudluse test on veel üks näide ATI Radeon SDK - PN Triangles 3D-arendajatele. Tegelikult on mõlemad näited ka DX SDK-s, seega oleme kindlad, et mänguarendajad loovad nende põhjal oma koodi. Testisime seda näidet erineva tessellatsiooniteguriga, et näha, kui palju see üldist jõudlust mõjutab.

Selles testis kasutatakse keerukamat geomeetriat, mistõttu erinevate lahenduste geomeetrilise võimsuse võrdlemine toob erinevaid järeldusi. Materjalis esitatud kaasaegsed lahendused tulevad üsna hästi toime kerge ja keskmise geomeetrilise koormusega, näidates suurt kiirust. Kuid kui Hawaii üks ja kaks GPU-d Radeon R9 290X ja R9 295X2 töötavad valgustingimustes hästi, on Nvidia plaadid rasketes tingimustes parimad. Nii et täna esitletud Geforce GTX Titan X näitab kõige keerulisemates režiimides kiirust juba märgatavalt paremini kui kahekiibiline Radeon.

Mis puudutab GM200 ja GM204 kiipidel põhinevate Nvidia plaatide võrdlust, siis täna vaadeldav Geforce GTX Titan X mudel suurendab oma eelist geomeetrilise koormuse suurenemisega, kuna valgusrežiimis sõltub kõik mälu ribalaiusest. Tänu sellele edestab uus toode Geforce GTX 980 plaati olenevalt režiimi keerukusest kuni 31%.

Heidame pilgu teise testi, Nvidia Realistic Water Terrain demoprogrammi, tuntud ka kui Island, tulemustele. See demo kasutab tessellatsiooni ja nihke kaardistamist, et muuta realistlik ookeanipind ja maastik.

Islandi test ei ole puhtalt sünteetiline test puhtalt geomeetrilise GPU jõudluse mõõtmiseks, kuna see sisaldab nii keerulisi piksli- kui ka arvutusvarjureid ning selline koormus on lähemal reaalsetele mängudele, mis kasutavad kõiki GPU-üksusi, mitte ainult geomeetrilisi, nagu eelmises. geomeetria testid. Kuigi geomeetria töötlemisüksuste koormus jääb endiselt peamiseks, võib mõjutada ka näiteks sama mälu ribalaius.

Testime kõiki videokaarte nelja erineva tessellatsiooniteguriga – antud juhul nimetatakse seadet Dynamic Tesselation LOD. Esimese kolmnurga jaotusteguri puhul ei piira kiirust geomeetriliste plokkide jõudlus ja Radeoni videokaardid näitavad üsna kõrget tulemust, eriti kahe kiibiga R9 295X2, mis isegi ületab väljakuulutatud Geforce GTX Titan X plaadi tulemust, kuid juba järgmistel geomeetrilistel koormustasemetel Radeoni plaatide jõudlus langeb ja Nvidia lahendused tulevad ette. .

GM200 videokiibil põhineva uue Nvidia plaadi eelis konkurentide ees sellistes testides on juba üsna korralik ja isegi mitmekordne. Kui võrrelda Geforce GTX Titan X-i GTX 980-ga, siis nende jõudluse erinevus ulatub 37-42% -ni, mis on teooriaga suurepäraselt seletatav ja vastab sellele täpselt. Maxwelli GPU-d on segatöökoormuse korral märgatavalt tõhusamad, lülitudes kiiresti graafikalt arvutile ja uuesti tagasi, ning Titan X on selles testis palju kiirem kui isegi kahekiibiline Radeon R9 295X2.

Pärast uue tipptasemel GM200 GPU-l põhineva uue videokaardi Nvidia Geforce GTX Titan X sünteetiliste testide tulemuste analüüsimist, aga ka mõlema diskreetsete videokiipide tootjate teiste videokaardimudelite tulemusi, võime järeldada, et videokaart, mida me täna kaalume, peaks olema turu kiireim, konkureerides AMD tugevaima kahekiibilise graafikakaardiga. Üldiselt on see Geforce GTX Titan Black hea järgija - võimas ühe kiib.

Nvidia uus graafikakaart näitab sünteetikas üsna tugevaid tulemusi - paljudes testides, kuigi mitte kõigis. Radeonil ja Geforce'il on traditsiooniliselt erinevad tugevused. Paljudes testides olid Radeon R9 295X2 mudeli kaks GPU-d kiiremad, sealhulgas suurema üldise mälu ribalaiuse ja tekstureerimiskiiruse tõttu ning arvutusülesannete väga tõhusa täitmisega. Kuid muudel juhtudel võidab Maxwelli arhitektuuri tippgraafikaprotsessor tagasi, eriti geomeetrilistes testides ja tessellatsiooninäidetes.

Päris mängurakendustes on aga kõik pisut teisiti, võrreldes "sünteetikaga" ja Geforce GTX Titan X peaks näitama kiirust, mis on märgatavalt kõrgem kui ühe kiibiga Geforce GTX 980 ja veelgi enam Radeon R9 290X. . Ja uudsust on raske võrrelda kahe kiibiga Radeon R9 295X2 - kahel või enamal GPU-l põhinevatel süsteemidel on oma ebameeldivad omadused, kuigi need suurendavad õige optimeerimise korral keskmist kaadrisagedust.

Kuid arhitektuursed omadused ja funktsionaalsus on selgelt Nvidia esmaklassilise lahenduse kasuks. Geforce GTX Titan X tarbib palju vähem energiat kui seesama Radeon R9 295X2 ning energiatõhususe poolest on Nvidia uus mudel väga tugev – see eristav tunnus Maxwelli arhitektuur. Ärge unustage Nvidia uue toote suuremat funktsionaalsust: seal on DirectX 12 funktsioonide taseme 12.1 tugi, VXGI riistvarakiirendus, uus MFAA antialiasing meetod ja muud tehnoloogiad. Turu vaatenurgast rääkisime juba esimeses osas – eliitsegmendis ei sõltu nii palju hinnast. Peaasi, et lahendus oleks mängurakendustes võimalikult funktsionaalne ja produktiivne. Lihtsamalt öeldes oli see kõige parem.

Lihtsalt selleks, et hinnata uudsuse kiirust mängudes, määrame oma materjali järgmises osas Geforce GTX Titan X jõudluse meie mänguprojektide komplektis ja võrdleme seda konkurentide jõudlusega, sealhulgas hindame õigustust. uudsuse jaehinnast entusiastide vaatevinklist ning uuri ka juba mängudes, kui palju kiirem on Geforce GTX 980.

Asus ProArt PA249Q monitor tööarvutile firma poolt Asustek Firma poolt pakutav Cougar 700K klaviatuur tööarvutile Puuma

Peamine järeldus: GeForce GTX TITAN X on meie aja kiireim ühekiibiline mängugraafikakaart. NVIDIA uus lipulaev on piisavalt kiire, et nautida sujuvalt kaasaegset 3D-meelelahutust Full HD ja WQHD kõrgeimate graafikaseadetega. Tõsi, seda saab teha ka GeForce GTX 980. "Oot, aga 4K?" - küsib lugeja. Jah, kuigi nimetasin artiklit "Esimeseks Ultra HD jaoks", kuid kaasaegsete maksimaalsete graafikakvaliteedi seadetega mängude osas demonstreerib GeForce GTX TITAN X ainult tinglikult mängitavat FPS-i taset. Ühekiibiliste videokaartide seas on see aga parim näitaja. Seetõttu on minu jaoks isiklikult just GeForce GTX TITAN X esimene videokaart, mis on tõesti võimeline vastama nii kõrge resolutsiooniga virtuaalseid ruume vallutada sooviva mänguri nõudmistele. Mõnel juhul peate seadetesse süvenema. Kuid juba paar neist "titaanidest" suudavad ohjeldada kõiki tulevasi järglasi. Kui ainult draiverid ja optimeerimine ei valmistaks pettumust. See on aga eraldi artikli teema.

Just 12 GB videomälu annab GeForce GTX TITAN X jaoks suure turvavaru. Muidugi ütleb keegi õigusega, et selline maht on üleliigne. Seesama Assassin’s Creed Unity 4K resolutsioonis, mitte väga-väga maksimaalsete graafikakvaliteedi seadete juures, “sööb aga ära” videokaardilt juba 5-6 GB videomälu. See on peaaegu pool. Seetõttu (ja me oleme seda selgelt näinud) võib isegi mitme 3D-kiirendi ülikallitel kimpudel olla kitsaskoht 4 GB GDDR5 näol. Nii et praegu Ultra HD-ga mängimiseks peab teil olema teatud varu.

Nagu alati, osutus NVIDIA viide heaks asjaks. Videokaardil on korralik ülekiirendamise potentsiaal. Aurustipõhine jahuti jahutab tõhusalt 250-vatist kiipi. Töötab lärmakalt, kuid üsna talutav.

Muidugi, kui NVIDIA oleks selle videokaardi välja andnud eelmise aasta septembris (ja mitte ~1000 taala eest - autori märkus), siis oleks vau-efekt minu meelest tugevam välja tulnud. Kas peaksime aga olema üllatunud aastate jooksul välja töötatud NVIDIA skeemi üle? Hind on GeForce GTX TITAN X ostu kõige tugevam piirav tegur. Meie riigis, kus on käes järjekordne majanduskriis, seda enam.

Lõpetuseks märgin vaid ära, et "rohelised" on jõudluslati päris kõrgele tõstnud, milleni tulevasel AMD lipulaeval (Radeon R9 390X?) tuleb jõuda vähemalt status quo taastamiseks. Või tehke midagi lähedast jõudluses, kuid märgatavalt suurema eelarvega. Nõus, seda on väga huvitav jälgida.

NVIDIA GeForce GTX TITAN X graafikakaart võitis toimetajate valiku auhinna.