Архитектурата на Nvidia Ampere ще бъде следващото голямо ъпгрейд за графични процесори от Team Green и ще намери своя път в предстоящите графични карти GeForce RTX 3080 Ti, RTX 3080, RTX 3070 и RTX 3060. Или може би Nvidia ще ни хвърли отново всички криви и ще промени номерата на моделите. Както и да е. Графичните процесори трябва да заемат високо място в нашата йерархия на GPU и списъка с най-добрите графични карти. Ampere идва към потребителите, а изпълнителният директор на Nvidia Йенсен Хуанг разкри центъра за данни, фокусиран върху A100 на 14 май, като ни даде да опитаме какво предстои. Ето какво знаем за Ampere, включително потенциални спецификации, дата на пускане, цена, функции и много други.
Първо, важно е да се отбележи, че всички слухове и течове за изминалата година или така са непотвърдени и всички твърдения за ценообразуване са пълни измислици / предположения. Извън GA100, Nvidia A100, DGX A100 и свързаните с тях части не е публикувана конкретна информация. Никоя GPU компания не публикува подробности за цените месеци преди пускането на продукта. Nvidia е много добре насочена към това, върху което работи, и преходът от архитектурата на Тюринг към Ампер ще бъде особено голям за компанията. Например графичният процесор GA100 не е същият като потребителските модели и няма хардуер за проследяване на лъчите, така че докато можем да преценим къде Nvidia може да отиде в други графични процесори на Ampere, нищо не е сигурно.
Ние сме толкова развълнувани от всички за GPU архитектурата на следващото поколение на Nvidia, но също така искаме да отделим факта от фантастиката. Има скъпоценно малко от първите, които могат да бъдат доказани, и потенциално много от последните, така че вземете всичко със зърно сол. Нека също така да отбележим, че Ampere е критичен за Nvidia, на много нива. Наскоро, в своето съобщение за лаптопи Super Spring, Nvidia разкри, че са продадени „15 милиона RTX графични процесора“. Това звучи хубаво, но по дяволите, ако това не изглежда ужасно малко за GPU архитектура, която съществува повече от 18 месеца.
Проблемът е, че Nvidia обикновено не предоставя твърди данни за броя продадени единици. Настоящото проучване на Steam Hardware сочи, че има около четири пъти повече GTX 10-серийни графични процесори сред природата, отколкото RTX 20-серийни графични процесори, но статистическите данни зад изследването на Steam са в крайна сметка непрозрачни, така че не можем да бъдем твърде сигурни за реалните цифри , Независимо от това, отношението на мнозина с RTX 20-серията беше да „изчакат и да видят“, като съветът на мъдреца е, че първото поколение на всяка нова технология – хардуер за проследяване на лъчи, в този случай – може да е интересно, но второто поколение ще бъде откъдето наистина излита.
Ampere проследява лъчите Gen2, с други думи и след сравнително бавен старт за хардуер за проследяване на лъчите и RTX 20 серията (от наша гледна точка), Ampere има какво да докаже. RTX 3080, RTX 3070 и т.н. (което ги наричаме засега) трябва да осигурят не просто по-добра производителност в игрите, използващи традиционните техники за изобразяване, но драстичното увеличаване на производителността на проследяване на лъчите би отворило вратите за постигане на повече неща RT ефекти, без да се подобрява ефективността.
Nvidia GeForce RTX 3080 и Ampere с един поглед:
- До 128 SMs / 8192 GPU ядра (за GA100)
- Графичните процесори трябва да са много по-бързи от RTX 20-серията
- Първата 7nm част на Nvidia трябва да бъде много по-ефективна от Turing
- Дата на издаване: Очакваме да видим Ampere през 2020 г., вероятно ще падне
- Цена: RTX 3080 вероятно ще струва около $699 – $799 (но се надяваме да е по-ниска)
The Ampere Architecture in GeForce RTX 3080
С първоначалното съобщение за GA100 и Nvidia A100 зад гърба ни, някои неща бяха изяснени. От една страна, Nvidia ще продължи да разполага с две отделни линии на графични процесори, едната насочена към центровете за данни и задълбоченото обучение, а другата върху графиката и игрите. Промените, направени с центъра за данни GA100, могат или не могат да се предложат на другите графични процесори на Ampere, но ето какво знаем за архитектурата на Ampere досега.
Първо, Ampere е много повече от обикновен свиване на матриците на Тюринг от 12 nm до 7 nm. Основният градивен елемент на графичните процесори на Nvidia се нарича Streaming Multiprocessor (SM). Неговият аналог на AMD е Compute Unit (CU) и на високо ниво е сравнително безопасно и лесно да се сравняват графичните процесори на двете компании въз основа на SMs спрямо CU. Архитектурата на Turing внесе много промени в SM конфигурацията и е сигурен залог, че Ampere ще внесе допълнителни промени.
Turing добавя RT ядра и тензорни ядра, за проследяване на лъчите изчисления на пресичане на лъчи / триъгълници и изчисления FP16 в дълбочина. Отвъд ядрата на RT и Tensor, ядрото на CUDA е основният хардуер на графичния процесор в графичните карти на Nvidia. За Turing, Nvidia премина от 128 CUDA ядра на SM до 64 CUDA ядра. Turing също добави специален целочислен (INT) тръбопровод към всяко ядро на CUDA, което дава възможност за едновременни изчисления INT и FP (с плаваща запетая). Преди това едно ядро на шейдъра ще трябва да премине от FP към правене на INT, което намалява общата ефективност и пропускателна способност. Ядрата на Turing CUDA също добавиха поддръжка за бързо изчислени математически изчисления (FP16), които основно удвояват изчислителната мощност на FP32, но с по-малка точност – FP16 е полезен за някои видове изчисления.
Ние наистина кондензираме всичко, което се промени с Turing тук, но в допълнение към горното имаше промени в кеша L1 / L2, поддръжка за засенчване с променлива скорост (VRS), мрежести шейдъри, Texture Space Shading (TTS), Multi- Преглед на рендеринга (MVR) и подобрения на едновременно многопроектиране (SMP). Повечето от тях вече са част от официалния API на DirectX 12 Ultimate и също имат поддръжка във VulkanRT. О, и хардуерът на NVENC получи значително обновяване, което добави хардуерно ускорено кодиране и декодиране на по-високи резолюции и повече кодеци като VP9 и HEVC.
С GA100 Nvidia надгражда архитектурата Volta GV100 от края на 2017 г. Няма RT ядра, но има най-малко големи промени в ядрата на Tensor. Освен това има много SMs: GA100 има 128 SMs с 8192 FP32 CUDA ядра, 8192 INT32 CUDA ядра и 4096 FP64 CUDA ядра. Най-важното е, че GA100 има 54 милиарда транзистори, 2,56 пъти повече от GV100, с размер на матрица от 826 мм квадрат, който е само с 1,3% по-голям от GV100.
Голяма част от допълнителните транзистори трябва да преминава към нови функции. GA100 „само“ разполага с 52% повече SMs и GPU ядра. Знаем, че кешът на L2 е по-голям, а ядрото на Tensor от трето поколение (Volta е 1-ви ген, Turing е 2-ри ген) добавя поддръжка както за операции TF32, така и за FP64. И двете ще се окажат жизненоважни за центъра за данни, докато FP64 обикновено не се използва с потребителски графични процесори (поне не за целите на игрите). Като цяло Nvidia казва, че ядрата на Tensor в GA100 са два пъти по-бързи от тези в GV100, въпреки че има половина повече ядра, така че това е 4X относителна скорост.
GA100 също има два допълнителни HBM2 канала на разположение в сравнение с GV100, въпреки че един от тях е деактивиран в понастоящем доставките на решения Nvidia A100. Допълнителните функции включват поддръжка на многоинстанционен графичен процесор, което позволява на GA100 да функционира като до седем отделни по-малки графични процесора, поддръжка на ускорение на спарите (друга функция на центъра за данни), а скоростта на NVLink вече е 600 GBps, три пъти по-бърза, отколкото в GV100.
Спецификации на потенциалните ампери
За разлика от Big Navi на AMD, Nvidia няма обявени свързвания на конзолата с хардуерни спецификации, но с GA100 разкриваме, че имаме какво да продължим по отношение на решенията с по-нисък спектър Ampere, които ще влязат в карти като RTX 3080. Има и пчела предполагаеми течове през последните шест месеца, които както обикновено трябва да се приемат със здравословна доза скептицизъм.
Най-големият проблем е, че всички празни досега изглежда са били с GA100 графични процесори, което не влиза в потребителските графични карти. Някои от технологиите, като подобрените ядра на Tensor, могат да се спуснат в потребителските модели (с модификации като ускорение на FP64), но хардуерът на GeForce RTX 30 серия абсолютно ще има поддръжка за проследяване на лъчите.
Понастоящем Nvidia разполага с най-малко три графични процесора на Ampere, които ще бъдат пуснати през 2020 г. до началото на 2021 г., а потенциално още три допълнителни решения на Ampere ще излязат през следващата година. Най-горният модел може да е само за задълбочено обучение и HPC решения, но останалите ще влязат в GeForce и Quadro карти. Ето какво говорят слуховете, заедно с някои от нашите собствени спекулации – в таблицата има много въпросителни.
Nvidia Ampere / GTX 30-Series Potential Specifications
GPU | GA100 | GA102 | GA103 | GA104 | GA106 | GA107 |
Graphics Card | Nvidia A100 | GeForce RTX 3080 Ti? | GeForce RTX 3080 | GeForce RTX 3070 | GeForce RTX 3060 | GeForce RTX 3050 |
Process (nm) | 7 | 7 | 7 | 7 | 7/8? | 7/8? |
Transistors (billion) | 54 | 30? | 22? | 16? | 12? | 9? |
Die Size (mm^2) | 826 | ~500? | ~367? | ~267? | ~200? | ~150? |
SMs | Up to 128 | Up to 84? | Up to 60? | Up to 40? | Up to 30? | Up to 20? |
GPU Cores | 8192 | 5376? | 3840? | 2560? | 1920? | 1280? |
RT Cores | None | 84 | 60 | 40 | 30 | 20 |
Tensor Cores | 512 | 336 | 240 | 160 | 120 | 80 |
Boost Clock (MHz) | 1410 | 1750 | 2000 | 1900 | 2000 | 2000 |
VRAM Speed (Gbps) | 2.43 | 18 | 18 | 18 | 16 | 16 |
VRAM (GB) | 48 max | 16 | 12 | 10 | 8 | 8 |
Bus Width | 6144 max | 512 | 384 | 320 | 256 | 128 |
ROPs | 192? | 128 | 96 | 80 | 64 | 32 |
TMUs | 512 | 672 | 480 | 320 | 240 | 160 |
GFLOPS FP32 | 23101 | 18816 | 15360 | 9728 | 7680 | 5120 |
RT Gigarays | N/A | 42? | 34? | 22? | 17? | 11? |
Tensor TFLOPS (FP16) | 739 | 602 | 492 | 311 | 246 | 164 |
Bandwidth (GB/s) | 1866 | 1152 | 864 | 720 | 512 | 256 |
TBP (watts) | 400 | 250? | 225? | 200? | 160? | 120? |
Launch Date | May 2020 | Fall 2020 | Fall 2020 | Fall 2020 | Winter 2021 | Spring 2021 |
Launch Price | $199K for DXG A100 | $1,499? | $799? | $549? | $349? | $199? |
Най-големият и лош графичен процесор е A100, където сме изброили максималните спецификации. Той има до 128 SMs, от които в момента са активирани само 108, но бъдещите варианти вероятно ще имат пълната конфигурация на GPU и RAM. Въпреки това, GA100 няма да бъде потребителска част, подобно на GP100 и GV100, преди да са били само за използване на центрове за данни.
Спускайки се към чиповете, които вероятно ще се използват в картите от серия GeForce RTX 30, GA102 ще бъде горната конфигурация. Чухме слухове (приемете с огромна помощ на сол), че тя може да има до 84 SMs и 16GB GDDR6, а версиите на Quadro ще удвоят VRAM. Каквото и да има реалният графичен процесор, той вероятно ще бъде близо 50% по-бърз от сегашния RTX 2080 Ti с типична производителност и чухме, че проследяващите лъчи ядра са преработени, за да осигурят значително повишаване на производителността. Дори и с добавените функции, чипът все пак ще бъде доста по-малък от сегашния TU102, благодарение на 7nm.
Останалите чипове напредват надолу по линията, като GA103 идва следващият. Nvidia може да се предлага с персонализирани чипове за всеки графичен процесор, както е показано в таблицата, или може да използва събрани GA103 чипове за RTX 3070, подобно на това, което е направено в миналото. Обаче очакваме набор от SM конфигурации, които сме оценили в горната таблица. Производителността следва часовниците SM и GPU, като и двата ще бъдат настроени според нуждите.
Nvidia доставя 8GB VRAM с висок клас графични процесори с GTX 10-серия и RTX 20-серия, и ние очаквано очакваме да преминем към 12GB този следващ кръг – или може би не. Не приемайте оценките на VRAM като нищо друго, а просто грубо предположение. Очакваме обаче по-високи часовници на GDDR6 от Ampere, с 18 Gbps вероятно на най-бързите графични процесори и 16 Gbps на части от по-ниско ниво. Nvidia може също така да продължи с 14 и 12 Gbps на бюджета и средния клас карти. Въпросът е дали 8GB VRAM ще бъде „достатъчен“ за следващото поколение игри, тъй като вече има игри, които се приближават до използването на 8GB VRAM.
Носят се слухове, че Nvidia ще направи пълен стек от проследяващи графични графични процесори с Ampere. Там, където Тюринг разполага с лъчево проследяване на RTX 20-серия и не-лъчево проследяващо GTX 16-серия, Ampere може да обедини характеристиките, подобни на GTX 10-серията. Ако този слух се окаже правилен, очакваме още едно увеличаване на цените на бюджета и средния клас за графични карти, като най-малко скъпите карти струват поне 200 долара. Всичко по-долу ще остане за хардуер и интегрирана графика от предишно поколение.
Таблицата също оставя някои ясни разлики в цените, които могат да бъдат запълнени с междинен хардуер, например RTX 3060 Ti и RTX 3050 Ti. В миналото Nvidia е забавила пускането на графичните процесори с по-ниско ниво с 6-12 месеца, така че 3050 поне вероятно е за една година. Графичните процесори с по-ниско ниво също могат да бъдат произведени на 8nm или 7nm технология на Samsung, тъй като в момента капацитетът на TSMC 7nm до голяма степен е изключен. Това не трябва да има голямо значение, но ще трябва да изчакаме допълнителни подробности.
Със сигурност има много неясност в горните потенциални спецификации, така че не приемайте нищо като евангелска истина все още. GA100 е известно количество; всичко останало е във въздуха в момента. Предвиждаме официално съобщение за поне няколко ампера графични процесори за потребителите до юли или август въз основа на това как Nvidia внедрява Pascal през 2016 г.
Досега говорихме за предстоящите графични процесори на Ampere като RTX 3080 Ti, 3080, 3070 и 3060 и всички индикации са, че Nvidia ще се придържа към познат модел за идващите графични процесори. Миналата година писахме за подаване на Nvidia за търговски марки на 3080, 4080 и 5080 в Европейския съюз, за да блокира слуховата марка RX 3080 от навигационните процесори на AMD. AMD не успя да използва RX 3080 (независимо дали някога е възнамерявал да пробва това или не е ясно), но очакваме Nvidia да го направи.
Ами суфикси като „Super“ или „Ti“, все пак – ще видим ли RTX 3080 Super или 3070 Ti? Ще дадем това голямо, дебело „може би“ (вероятно), макар че стартовите прозорци ще варират в обхвата на графичните процесори на Ampere. Настоящият брандинг на Nvidia изглежда работи добре, така че се надяваме да не реши да поправи онова, което не е нарушено. RTX 3080 Ti би трябвало да се превърне в халогенния продукт за потребителски карти на Ampere, вероятно с някаква форма на Titan за онези, които са без портфейли.
Nvidia Ampere и RTX 3080 Дата на издаване
Може би най-големият въпрос – и друг въпрос с много несигурност – е кога RTX 3080 и други графични процесори на Ampere ще стартират. 2020 г. изглеждаше дадена преди няколко месеца и напълно очаквахме да чуем поне нещо на GTC 2020 през март. Откриването на Nvidia A100 по време на основния текст на Jensen предполага, че останалата част от състава ще бъде обявена по-скоро, отколкото по-късно. Забавянето на COVID-19 със сигурност се случва, но очакваме графичните карти на GeForce RTX 30 серия да пристигнат тази есен, а не да се промъкнат в 2021 година.
Исторически Nvidia обикновено прави постепенно изстрелване. Първо излиза най-бързият графичен процесор, след това стъпката надолу, после още една стъпка надолу. Разбира се през годините, разбира се. GTX 1080/1070 стартира първи, като GTX 1080 Ti пристигна почти година по-късно. RTX 2080 Ti и 2080 от друга страна стартираха в рамките на седмица една след друга, последвана от 2070 на следващия месец и 2060 три месеца след това.
Ampere изглежда, че ще бъде подобен на старта на Pascal, тъй като съобщението GP100 предшестваше детайлите от серията GTX 10, но реалните графични карти на Pascal бяха по-лесно открити от хардуера на центъра за данни. Очакваме обаче, че потребителските части ще следват модела на Тюринг, което означава, че RTX 3080 Ti и RTX 3080 ще излязат основно по едно и също време, като RTX 3070 ще излезе един месец или по-късно. Междувременно RTX 3060 вероятно ще се появи най-рано през януари 2021 г.
Колко ще струва RTX 3080?
Една ръка, един крак – следващ! Но сериозно, в таблицата с прогнозни характеристики, ние изброихме собствените си предположения относно ценообразуването. Вероятно сме прекалено оптимистични, тъй като Nvidia може да извърви много различен маршрут. Наблюдава се постоянно увеличение на цените на поколенията от пускането на серията GTX 900.
GTX 970 беше част от $329, GTX 1070 беше $379 – $449, а RTX 2070 скочи до $499- $599 при старта. RTX 2070 Super върна малко назад до $499, което все още е $120 повече от предишното поколение. Или бихме могли да разгледаме картите Ti: $649 за 980 Ti, $699 за 1080 Ti и $1199 за 2080 Ti. 2080 Ti трябваше да има карти на трети страни, започващи от $ 999, но дори и сега, повече от 18 месеца по-късно, такива карти е почти невъзможно да се намерят на склад.
Добрата новина е, че пазарът се е променил доста след дебюта на RTX 20 серията. По принцип нямаше конкуренция от AMD в горната част на йерархията на GPU за RTX 2080 и RTX 2080 Ti – дори сега GTX 1080 Ti има тенденция да съвпада или да надвишава частта на AMD с най-висока производителност. Но когато RTX 3080 и Ampere стартират, има голям шанс AMD да разполага и с части за Big Navi / RDNA 2 / Navi 2x на разположение или скоро. Това може да означава конкурентно представяне, както и подобен набор от функции.
Nvidia е известна със своята агресивна бизнес тактика. Част от ниската цена на GTX 970 несъмнено благодарение на AMD имаше конкурентни R9 290 / 290X части, които ще пристигнат само месец или по-късно. Всъщност няма значение дали Big Navi стартира точно преди или непосредствено след Ampere; Така или иначе, Nvidia ще иска да запази преднината си в отличното си представяне, като същевременно остава конкурентен по отношение на удар за долара.
Всичко това води до нашите цени. Съмнително е, че Nvidia ще върне обратно към цените до преди RTX, особено с преминаването към по-скъпата 7nm литография на TSMC, но времето и обстоятелствата около RTX 3080 и Ampere стартират по подобен начин, че е малко вероятно Nvidia да продължи след значително по-високи цени. Е, с изключение на картите RTX 3080 Ti и Titan, които вероятно ще са много глупаво, ако слуховите характеристики и производителността се окажат правилни.
Също така си струва да се отбележи, че Xe Graphics на Intel ще се присъедини към специализирания пазар на графични карти тази година, най-вероятно през лятото или началото на есента. Не е известно колко бърза ще бъде Xe Graphics, но може да има до 512 варианта в ЕС – което вероятно би означавало 4096 графични процесора „ядра“. Това е достатъчно, за да повдигнете вежди и може всъщност да предизвика AMD и Nvidia на пазара от висок клас. Ще знаем повече през следващите месеци.
Долната линия
Както при Big Navi на AMD, най-добрият съвет в момента е да изчакате и да видите какво всъщност се материализира. Има много спекулации – включително тук – за това какво RTX 3080 и Ampere ще внесат на масата, но в крайна сметка трябва да получим официални спецификации и цени, а след това да стартираме собствени тестове.
Надяваме се и очакваме, че Ampere ще бъде мащабен скок в производителността на GPU, със и без проследяване на лъчите. Ако Nvidia удвои проследяването на лъчите, също е възможно RTX 3060 да може да съвпадне или да надвиши производителността на RTX 2080 Ti в игри като Minecraft RTX, където RT ядрата са изтласкани до краен предел.
Ampere със сигурност ще бъде по-бърз и по-ефективен от сегашните Turing графични процесори на Nvidia – само 7nm ще гарантира това. Цените и ефективността в реалния свят обаче са това, което наистина има значение. Предстоящите стартирания GPU от трите основни играчи със сигурност ще бъдат вълнуващи.
Информацията е взета от – https://www.tomshardware.com/news/nvidia-rtx-3080-ampere-all-we-know