После ранних обещаний о том, насколько хорошей может быть архитектура графического процессора Intel Xe3, благодаря разбивке Intel по изменениям, реализованным во всем, в прошлом месяце нам наконец удалось протестировать ее должным образом в виде ноутбука Panther Lake. И знаешь что? Это является хороший. На самом деле очень хорошо.
На бумаге это должно быть само собой разумеющимся. Intel Arc B390 поддерживает только 1536 шейдеров, но с 16 МБ кэш-памяти второго уровня и тактовой частотой Boost 2,5 ГГц это намного более мощный процессор, чем большинство интегрированных графических процессоров.
С этой целью я использовал GPUPerfTest от Nemez, изящный небольшой проект, который разработчик любезно передал набору тестов Chips and Cheese, и после компиляции последнего репозитория на GitHub я приступил к сравнению трех графических процессоров плюс еще один для пущей убедительности.
Этот дополнительный графический чип представляет собой первое поколение архитектуры Intel Xe — Arc A770 на базе Alchemist. Вместо того, чтобы радикально менять внутренние компоненты с каждым обновлением, Intel просто консолидировала то, что работало хорошо, и улучшила слабые места, поэтому во многих отношениях Xe3 — это просто хорошо доработанный Xe.
Пиковая производительность шейдера
Давайте начнем с рассмотрения пиковой производительности очень распространенной команды рендеринга графики: объединенного умножения-сложения, или сокращенно MADD. С помощью этой единственной команды процессор возьмет два значения, умножит их вместе, а затем прибавит результат к третьему значению. Он постоянно используется при рендеринге графики, поэтому здесь важен хороший результат.
В тесте повторяется пропускная способность инструкций для ряда различных форматов данных, и я выбрал те, которые здесь наиболее подходят (хотя INT8 и INT16 вызывают гораздо меньшее беспокойство в играх, чем FP32, FP16 и INT32).
Теперь важно понимать, что результат сильно зависит от количества шейдеров и их тактовой частоты. Например, RTX 4050 имеет 2560 ядер CUDA с частотой до 1,8 ГГц, что обеспечивает теоретическую пиковую пропускную способность FP32 чуть менее 9 терафлопс.
Как вы можете видеть, RTX 4050, который я использовал, значительно ниже этого пика, но это потому, что это всего лишь версия мощностью 75 Вт, поэтому она, вероятно, не сможет поддерживать тактовую частоту в режиме Boost достаточно долго. Кроме того, сам тест не работает в теоретически идеальном мире, поэтому между реальностью и бумагой всегда будут некоторые различия.
Arc B390 должен иметь производительность около 7 или 8 терафлопс при FP32 и удвоить эту цифру при FP16. Как и RTX 4050, ему далеко до этих цифр, но обратите внимание, как он держит Arc A770 в поле зрения? Это «маленький» iGPU, не уступающий полноразмерной видеокарте с графическим процессором площадью 400 квадратных миллиметров.
Пропускная способность кэша и памяти
Следующий тест, который я провел, по существу измерял пиковую пропускную способность данных для разных размеров данных, при этом все шейдеры графического процессора были заняты получением указанных данных. Не только полезно увидеть, насколько хорошо процессор может снабжать свои логические блоки информацией, но также дает четкое представление о размерах кэша.
Там, где линии переходят от ровных к опущенным носу, отмечается приблизительная граница размера различных размеров кэша. Не совсем так, потому что драйверы часто немного забавно относятся к тому, как они интерпретируют инструкции Vulkan (API, использованный для теста), а в некоторых случаях кеш представляет собой регулируемую общую память, а не фиксированный размер.
Чем больше конвейеров имеет графический процессор, тем выше будет начальная пропускная способность, поэтому A770 с 4096 шейдерами намного превосходит крошечные B390, 780M и RTX 4050. Однако тактовая частота кэшей также имеет значение, и именно поэтому Xe3 iGPU так хорошо справляется со своими задачами по сравнению с маленьким чипом Nvidia.
Но это впечатляет еще больше, если учесть, что в B390 относительно мало шейдеров. Да, у них довольно высокая тактовая частота, но получение 6 ТБ/с из кэша L1 предполагает, что у него очень широкая внутренняя шина данных. Этого можно было ожидать от большого dGPU, а не от крошечного iGPU.
Однако есть один сюрприз: насколько плоха Radeon 780M в тесте. AMD использует умную, хотя и сложную систему кэширования для максимизации потока данных через графический процессор, но вы бы не подумали об этом, глядя на эти результаты. Я подозреваю, что проблема в том, что этот конкретный iGPU принадлежит Asus ROG Ally, устройству, которое получает обновления драйверов очень медленно.
Задержка кэша и памяти
Наличие большой внутренней пропускной способности — это хорошо, но если системе кэширования графического процессора требуется много времени для ответа на запросы данных, то все, что она сделает, — это остановит конвейеры шейдеров, которые запросили указанные данные (конечным результатом будет снижение производительности).
Итак, последний тест, который я провел, изучал задержку кэша: время в наносекундах между выдачей запроса данных и доставкой данных. Здесь важна архитектура, но также важна и тактовая частота. Как и раньше, когда линии меняются с ровных на восходящие, вы можете оценить размер кэшей.
В случае с Arc B390 он имеет довольно быстрый кэш L1, но на самом деле он показал самые низкие задержки L2 среди всех протестированных мной чипов, что значительно уступает RTX 4050 и Arc A770. К сожалению, последние этапы графика показывают самую большую слабость Xe3: использование LPDDR5x.
В то время как Arc A770 и GeForce RTX 4050 используют выделенные модули GDDR6, Arc B390 вынужден использовать системную память для своей видеопамяти, и LPDDR5x не только немного медлителен (с точки зрения задержек), но и этой памяти приходится конкурировать с инструкциями от остальной части системы.
Однако обратите внимание, насколько малы задержки видеопамяти у A770 по сравнению с RTX 4050, несмотря на то, что используется точно такой же тип и скорость GDDR6? Конечно, B390 хуже (и намного хуже по сравнению с 780M, который также использует общий для системы LPDDR5x), но он превосходит во всех отношениях, пока запросы данных не попадают в DRAM.
Сильные и слабые стороны Xe3
Трех небольших микротестов недостаточно, чтобы получить полное представление о внутренней работе процессора, но их достаточно, чтобы понять, что хорошо, а что плохо в архитектуре Xe3 в Arc B390.
По сути, это все хорошо, но одно: отсутствие выделенной видеопамяти. Или, скорее, насколько хорошо драйверы и встроенное ПО Intel в настоящее время обрабатывают потоки данных между общей системной памятью и iGPU. Использование быстрого LPDDR5x обеспечивает приличную пропускную способность, но задержки DRAM не совсем велики, и я подозреваю, что это мешает Arc B390 полностью раскрыть свой потенциал в некоторых играх.
Но только представьте себе большой графический процессор Xe3 в настоящей дискретной видеокарте с большим количеством высокоскоростной памяти GDDR7. Это, безусловно, заставит AMD и Nvidia беспокоиться, если он когда-либо выйдет на рынок, но Intel не торопится выводить что-то подобное на рынок. Ходят разговоры о том, что вариант Xe3, X3P, будет использоваться для следующего поколения видеокарт Intel Arc, но Team Blue хранит молчание по этому поводу.
Архитектура хороша, даже великолепна; он просто заслуживает лучшего дома, чем процессор для ноутбука, каким бы хорошим он ни был.
Лучшие игровые установки 2026 года


