新闻 资讯 金融 知识 财经 理财 科技 金融 经济 产品 系统 连接 科技 聚焦 栏目首页
首页 > 知识 > > 正文

关注:游戏优化 pu游戏优化加速软件

2023-04-25 17:07:38来源:互联网

哈喽小伙伴们 ,今天给大家科普一个小知识。在日常生活中我们或多或少的都会接触到游戏优化(pu游戏优化加速软件) 方面的一些说法,有的小伙伴还不是很了解,今天就给大家详细的介绍一下关于游戏优化(pu游戏优化加速软件) 的相关内容。


(资料图片)

游戏优化(普游戏优化加速软件)原创太平洋电脑网2019-07-27 00:22:57

1CPU 1的多核优化难度有多大?

【PConline杂谈】随着AMD锐龙的横版空的诞生,电脑CPU进入多核冲击时代。在同系列产品中,我们公司一直采用的是核心翻倍空。据透露,英特尔下一代CPU的i3将配备4核8线程——这样的CPU,三年前的名字是i7。在高端系列中,核战争更令人恐惧。在售的12核24线程AMD锐龙3900X足以让人倒吸一口凉气,而即将上市的3950X则配备了16核24线程。好几个帧的粉丝都表示把持不住,喊yes根本停不下来。

但是,多核CPU玩游戏会更快吗?不一定。排除频率和架构IPC的差异,在某些情况下,多核CPU玩游戏会更慢——比如在某些情况下,AMD新出的12核3900X在某些游戏中比8核3700X还慢。

测试表明,具有更多内核和更高频率的3900X在某些情况下的性能不如3700X。

我们知道从规格上看,3900X完全压倒3700X,别说多了四个核心,就连频率都更高(3.8/4.6GHz vs 3.6/4.4GHz),三级缓存翻倍(64MB vs 32MB)。那么为什么多核游戏速度更慢呢?今天就从这个现象来说一下CPU和游戏优化。

游戏的多核优化难度有多大?

先说多核游戏的优化。当我们谈到游戏优化的时候,我们绕不开多核的支持。什么游戏针对多核优化,什么游戏只能难单核,多核围观,一直是玩家津津乐道的话题。为什么游戏在优化多核上有问题,而视频压缩等应用却能充分利用多核?这和游戏的运行机制有关。

为什么游戏喜欢用单核?

像视频压缩这样的任务可以很容易地并行执行。比如一个线程压缩一段优优资源 *** ,另一个线程压缩另一段,多个内核协同工作。最后,压缩所有片段,压缩完整的视频。但是游戏的运行一般是线性的,一步的操作往往与前一步紧密相关,很难充分利用多线程。

核心在渲染和转码的时候很好用,游戏就不一定了。

举个例子,在FPS游戏中,如果玩家被击中并造成伤害,那么伤害结果就和子弹的弹道有关。在计算伤害之前,需要计算子弹的弹道。这只能在一个线程中完成,不可能通过多个线程同时计算出子弹的弹道和伤害。游戏要想充分利用多核,就需要巧妙地把计算任务拆分成多线程。例如,不同的线程负责物理碰撞、AI行为等。技术门槛比较高,还得多下功夫。基于此,仍有大量游戏未能充分利用CPU的所有核心。

支持多核一定要优化好吗?

随着时代的发展,越来越多的游戏愿意在多线程优化上发力。比如前几年我们经常看到“i3完全无声”的情况,现在游戏大作把门槛提高到了4核,双核i3已经很尴尬了。但是12核3900X的性能不如8核3700X。为什么?

出现这种情况主要是因为CPU核心调度不合理。瑞的建筑很特别。每四个内核封装成一个CCX,每两个CCX封装成一个CCD。内核之间的通信可以跨越CCX甚至CCD,但CCX和CCD之间的通信会有延迟。

Zen2架构,可以看到核心的拓扑结构——CCX——CCD。

换句话说,如果一个程序可以调用多个内核,会出现以下情况。

1.被调用的多核在同一个CCX,延迟最小;

2.被叫的多核跨CCX,但是在同一个CCD里,所以延迟;

3.所谓多核跨越CCX和CCD,延迟更大。

比如一个游戏可以调用四个核心,理想的情况自然是在同一个CCX中调用四个核心,可以获得更佳的性能。然而,实际上,对多个内核的代码调用并不一定那么智能,很可能无法识别哪些内核位于同一个CCX上。因此,游戏可能会调用位于不同CCX和CCD的多个内核,从而导致额外的延迟和性能损失。

知道了这一点,就能解释为什么有时候3900X的游戏性能甚至比3700X还要低。3900X封装了两个CCD,每个CCD有两个CCX,每个CCX有四个内核。原来的总数是4x2x2=16芯,屏蔽四芯后得到12芯。而3700X只有一个CCD,包括两个CCX,总共4x2=8个内核。可以看出3900X比3700X多了一个CCD,多了一个可能造成额外延迟的情况。如果游戏发挥不出3900X的多核优势,那么3900X略逊于3700X也在情理之中。

Windows 10 1903中Zen架构的优化之一是内核的调度逻辑,它首先调用同一个CCX中的内核。

因此,即使游戏针对多核进行了优化,也需要在核心调度上付出更多努力,才能达到更佳性能。很高兴微软已经意识到了相关问题,并在Windows 10 1903中做了一次优化。系统将优先调度同一CCX中的内核,以避免交叉CCX造成的延迟。如果想充分发挥AMD锐龙处理器的性能,还是要升级到Windows 10 1903。

2CPU单核性能真的是挤牙膏?

单核CPU优优资源网的性能真的是挤牙膏吗?

有人认为,目前CPU在频率方面很难有性能上的突破,架构也很难进一步提高效率。核心堆是提高性能的唯一方法。有朋友从英特尔的“挤牙膏”中论证了这一观点,认为CPU的同频性能已经停滞多年,而AMD的Zen2架构,虽然效率较上一代大幅提升,但也只是赶上了竞争对手的水平。几年前用4核CPU玩游戏和现在用4核CPU玩游戏,在体验上似乎没有区别,这也是一个有力的证据。但事实是这样吗?

其实这种观点是片面的。CPU之所以在几年前的一些测试和游戏中表现出色,是因为这些测试和游戏并没有对新CPU的指令集进行优化。近年来,新CPU的一大价值在于增加了AVX、AVX2、TSX等指令集。如果代码调用相应的指令集,它可以更有效地利用像FMA这样的浮点加乘混合单元,减少空闲的CPU流水线,并大幅提高性能。

这些都是近十年来一直在增加的指令集,不是说没有核堆或者挤牙膏。

以著名渲染软件Cinebench为例。这是一个DIY玩家相当熟悉的CPU测试工具。与旧版本的Cinebench R15相比,最新版本的Cinebench R20增加了对AVX指令集的支持。凭借CPU对AVX指令集的良好支持,同样的渲染项目在Cinebench R20中运行的速度甚至是Cinebench R15的两倍以上!这表明新的指令集可以大大提高性能。

Zenyou资源网2的单核性能提升这么多,很大程度上是因为AVX2的性能提升很大。

支持AVX或更新版本的指令集已经逐渐成为渲染、视频压缩和科学计算等专业领域的规范。著名的Linux发行版Fedora 32甚至计划不支持没有AVX指令集的CPU。但是,仍然有大量的游戏没有跟进新的指令集,如AVX,只支持旧的SSE。自然,用新CPU运行这些游戏和旧CPU差别不大。在指令集支持方面,游戏还是缺乏对CPU的适当优化。

著名的游戏性能测试组件3DMark已经意识到了这一点。在新的Time Spy极限测试项目中,加入了AVX、AVX2甚至AVX512指令集支持,调用AVX512指令集的成绩是SSE3的两倍以上。

像AVX这样的新指令集在实际游戏中变得越来越重要。比如《刺客信条:奥德赛》甚至不支持没有AVX指令集的CPU(因为太激进了,又得兼容老CPU)。比如一些使用D加密的游戏,需要FMA3指令集解密才能正确运行,早期的“神U”e 1230v 2只能发呆;如果你是PS3模拟器玩家,你也体验过TSX指令集下的性能飞跃。

育碧的新作《刺客信条》曾经不支持没有AVX指令的处理器,新游戏会越来越重视高级指令集。

总的来说,大部分游戏的指令集优化还是不够。在没有指令集优化的情况下,老CPU和新CPU的游戏性能拉不出太大的差别。但支持新指令集是游戏对CPU优化不可回避的环节。只有使用新的指令集,新的CPU才能显示出应有的价值。希望更多游戏优化新CPU指令集。

(在讲故事时)待后处理的事物

无论是增加CPU内核的多线程,还是使用新的指令集来提高SIMD性能,都可以大大提升CPU的性能。就消费市场而言,AMD似乎更走多核路线,而英特尔则致力于实现新的指令集。但无论是哪种发展方向,都需要相应的软件来优化,才能充分发挥CPU应有的性能。

不再是不修改一行代码就能发挥新CPU全部性能的时代了。多核和高级指令集受限于缺乏游戏支持的现状,不得不沦为“为未来而战”。CPU不是挤牙膏,游戏对CPU的优化远没有结束。希望以后能看到更多能发挥CPU真正威力的游戏。

\

关键词:

热点