
Новые видеокарты AMD на архитектуре RDNA 5 получат улучшения в сфере параллельного выполнения команд — теперь GPU смогут чаще исполнять по две инструкции одновременно, включая более сложные операции с тремя операндами, благодаря расширенной поддержке новых инструкций в LLVM. Это повысит эффективность шейдерных блоков и увеличит производительность при вычислениях с одинарной точностью, что особенно важно для игр и нейросетевых технологий.
Впервые с RDNA 3 видеокарты AMD получили функцию dual-issue execution — возможность запускать две команды за такт, однако строгие ограничения на сочетание операций снижали преимущество. Новое расширение под названием VOPD3 в RDNA 5 позволит свободно обрабатывать трёхоперандные команды, включая ключевую для вычислительной мощности FMA (fused multiply-add) инструкцию. В LLVM появился патч с добавлением инструкции V_FMA_F32, что прямо указывает на поддержку этих возможностей в грядущем поколении GPU.
Разгрузка шейдерных блоков позволит снизить время ожидания тактов и повысить использование исполнительных ресурсов внутри GPU, что улучшит общую производительность. Для геймеров это значит более стабильные и высокие показатели кадров в сложных сценах, а для задач нейросетевого апскейлинга и генерации кадров — более эффективное использование вычислительных ресурсов без необходимости увеличения тактовой частоты или числа вычислительных блоков.
Технические ограничения на объединение инструкций часто становятся бутылочным горлышком для роста IPC (instructions per clock) на уровне аппаратуры. Устранение таких ограничений на этапе планирования компилятора — прямой ход к повышению производительности без дополнительного усложнения аппаратной части. Это особенно актуально в условиях конкуренции с NVIDIA, которые давно активно развивают подобные методы оптимизации исполнения в своих архитектурах Ampere и Ada Lovelace.
Пока RDNA 5 остаётся в разработке, главными маркетинговыми преимуществами AMD, возможно, станут увеличенное число ядер и рост тактовых частот, более заметные для потребителей. Но архитектурные улучшения, которые позволят GPU стабильнее достигать заявленной производительности FP32, станут базой для более масштабных оптимизаций и технологических достижений в будущих видеокартах.