
磐镭显卡质量不错。
磐镭RTX3070Ti白铠显卡特色外观注定这是一款可以打造白色主题的高端显卡,通体白色可容入各种白色主机中。
性能强悍:RTX3070Ti性能对比RTX3070综合大概有8%左右的提升,性能更强,本身属于高端游戏显卡,可满足用户畅玩2K游戏大作的需求,如果是网游,更是能轻松战4K。
RTX战未来:RTX3070Ti是采用GA104核心的第二张卡,采用NVIDIAAmpere架构设计,相较于上一代的NVIDIATuring架构,实时光线追踪以及DLSS技术进行了升级,对于游戏以及创作者帮主更大。
磐镭介绍
服务器型显卡:守恒、高端游戏显卡:白铠墨甲、中端游戏显卡:干将莫邪(铸剑)、办公多屏显卡:顺而美、RGB电竞内存:镭刃、笔记本显卡拓展坞:镭凌LinKX。
品牌理念:专注专业、精诚协作、开放成长。品牌价值观:以人为本、勇于创新、质量为先、诚信为荣。服务理念:务实创新的服务精神,谦虚谨慎的服务态度,专业优质的服务团队,洞察敏锐的服务意识。
回顾年初的CES2021展会,NVIDIA将NVIDIAAmpere架构带到了笔记本电脑,发布了RTX30系列笔记本电脑GPU,而到了2021年5月11日,NVIDIA进一步完善产品线,发布了RTX3050Ti和RTX3050笔记本电脑GPU,让NVIDIAAmpere架构进入主流价位的笔记本电脑市场中。
更有意义的是,GeForceRTX3050Ti和RTX3050笔记本电脑GPU还是首代支持光线追踪、DLSS的在NVIDIAx50系列产品,能让更多 游戏 玩家享受到先进技术带来的 游戏 体验提升。
目前,PConline评测室收到了一台机械革命Z3Air,机身厚度只有205mm,重量仅196kg。作为一款低功耗的轻薄 游戏 本,机械革命Z3Air是首批搭载GeForceNVIDIARTX3050Ti笔记本电脑GPU的 游戏 本,GPU功率最大可达95W,同时也配备了最新的英特尔第11代酷睿i7-11800H处理器,硬件配置是2021年这个价位段 游戏 本的主流搭配。至于本篇评测,就用这款产品作为代表,来测试GeForceRTX3050Ti笔记本电脑GPU这款面向主流价位的产品,在轻薄 游戏 本中的综合性能表现。
测试前先来看一下规格参数,GeForceRTX3050Ti笔记本电脑GPU采用了完整的GA107-775-A1核心,拥有20组SM单元、CUDA数量为2560个,并配备4GBGDDR6显存、位宽为128bit,TGP功耗最大为80W(不开启DynamicBoost20)。定位稍低的GeForceRTX3050笔记本电脑GPU同样采用了GA107-775-A1核心,但经过了一定阉割,SM单元为16组,CUDA数量为2048个,同样配备128bit位宽的4GBGDDR6显存。
至于其他特性和功能方面,即便GA107-775-A1只是NVIDIAAmpere架构的入门级核心,但GeForceRTX3050和GeForceRTX3050Ti笔记本电脑GPU依旧拥有第2代RTCore和第3代TensorCore,这也是实现光线追踪和DLSS技术的硬件级基础。具体规格方面,RTX3050Ti笔记本电脑GPU拥有80个TensorCore和20个RTCore。
在239版本GPU-Z中,已经可以准确识别出GeForceRTX3050Ti笔记本电脑GPU的详情参数信息。
打开NVIDA控制面板中,可以进一步查看GeForceRTX3050Ti笔记本电脑GPU的产品信息,可以发现例如ResizableBAR、DynamicBoost20、WhisperMode20等先进技术也都没有被阉割掉。而在开启DynamicBoost20后,GeForceRTX3050Ti笔记本电脑GPU的最大功率上限可达到95W(80W 15W)。
当然硬件的实际性能释放要参考 游戏 本的散热设计,在26 的室内环境中,将机械革命Z3Air切换为狂飙模式、使用FurMark对其进行单烤压力测试,通过监控显示GeForceRTX3050Ti笔记本电脑GPU的功耗释放可达75W左右。
而同时开启AIDA64FPU FurMark双烤压力测试,机械革命Z3Air可输出约55W 70W,也能基本发挥出GeForceRTX3050Ti笔记本电脑GPU的性能。
先使用3DMark对GeForceRTX3050Ti笔记本电脑GPU进行理论性能测试:
对比之前的测试数据,可以发现在5项传统测试中,我们可以看到GeForceRTX3050Ti笔记本电脑GPU相比于GeForceGTX1650笔记本电脑GPU有超过50%的性能提升,接近上一代的甜品级的RTX2060笔记本电脑GPU。
前面提到过,得益于第2代RTCore与第3代TensorCore,GeForceRTX3050Ti笔记本电脑GPU获得了对光线追踪与DLSS技术的支持,下面还是用3DMark测试下理论性能。
在PortRoyal项目中,GeForceRTX3050Ti笔记本电脑GPU的分数为897,相比于GeForceRTX2060笔记本电脑GPU普遍3000 的分数有较大差距,原因或许是因为4GB显存在测试中发生了瓶颈。
另外在3DMark自带的NVIDIADLSS功能测试中,运行相同的画面,关闭DLSS前平均帧数为399FPS,开启DLSS后平均帧数为1189FPS,提升较为明显。
实际 游戏 方面,此次 游戏 测试分为光栅化和光追/DLSS性能测试两部分,选择了《孤岛惊魂5》、《战争机器5》、《中土世界:战争之影》、《全面战争:三国》、《古墓丽影:暗影》、《控制》等几款有代表性的3A大作。这些 游戏 对于此前的GTX1650 游戏 本,如果不降低特效设置,很难在1080P分辨率下做到流畅运行。下面来看一下搭载GeForceRTX3050Ti笔记本电脑GPU的机械革命Z3Air实测表, 游戏 测试前更新至47168驱动版本。
1光栅化性能测试
《孤岛惊魂5》设置为极高特效,机械革命Z3Air的平均帧数为89FPS、最低帧数为74FPS。
《战争机器5》将所有设置都拉到超高,关闭垂直同步和最小帧数限制,机械革命Z3Air的平均帧数为715FPS,GeForceRTX3050Ti笔记本电脑GPU同样没有造成瓶颈。
《中土世界:战争之影》,设置为最高特效,运行自带的基准性能测试,机械革命Z3Air的平均帧数为74FPS。
前面的3款 游戏 ,搭载GeForceRTX3050Ti笔记本电脑GPU的机械革命Z3Air都获得了超过60FPS的平均帧数,接下来测试《全面战争:三国》。在极高特效下,机械革命Z3Air运行《全面战争:三国》战斗场景基准测试平均帧数为514FPS,也基本符合预期。
《刺客信条:英灵殿》是《刺客信条》系列的第12部主要作品,对GPU的性能提出了极高的要求。在开启中等画质的情况下,GeForceRTX3050Ti笔记本电脑GPU的4GB显存容量并不会产生瓶颈,因此机械革命Z3Air运行自带的性能评估可以获得平均71FPS的帧率表现。
2 光追/DLSS性能测试
接下来是光追和DLSS性能的测试,我们选用了《古墓丽影:暗影》,《控制(Control)》,《先驱者(Outriders)》和《使命召唤:战区》来进行测试。
在《古墓丽影:暗影》中将光线追踪阴影质量调整为超高,运行基准测试平均帧数为35FPS,达到了基本流畅的水平。
随着NVIDIA逐步推进光线追踪与DLSS,目前已经有越来越多的 游戏 支持这两项技术。例如由Remedy工作室开发,505Games负责发行的第三人称冒险 游戏 《控制(Control)》。为了发挥出RTCore的性能,《控制(Control)》中加入了NVIDIA推出的多种光线追踪渲染特效,例如透明和不透明反射,间接漫反射,以及接触阴影等。
考虑到GeForceRTX3050Ti的规格,在使用机械革命Z3Air测试《控制(Control)》时光线追踪预设为“中”,并勾选“NVIDIA超高取样”选项开启DLSS20(渲染解析度为1280 720)。
从测试结果可以看出,《控制(Control)》这款 游戏 开启光追时对硬件配置还是有较高的要求,不过在开启DLSS20技术后,机械革命Z3Air的帧数提高了60%左右,幅度可谓是相当显著!在基本不损失画质的前提下,还能够满足60FPS的较高帧率。
而除了《控制(Control)》外,目前市面中支撑DLSS的3A大作已经越来越多,这也为NVIDIAAmpere架构的GeForceRTX3050Ti笔记本电脑GPU提供了更大的用武之地。例如在 游戏 《先驱者(Outriders)》中,默认开启预设的超高特效,如果不开启DLSS,机械革命Z3Air的运行帧数只能在60FPS边缘,交战时就会面临画面掉帧,而开启DLSS并选择平衡模式后,平均帧率则获得了进一步提升,绝大多数场景下都能稳定70FPS以上的帧率。
《使命召唤:战区》对硬件的优化较为出色,即使不开启DLSS,机械革命Z3Air凭借酷睿i7-11800H GeForceRTX3050Ti笔记本电脑GPU依旧能在对战中满足超过60FPS 的平均帧率,当然开启DLSS后则获得了超过20%的进一步帧率提升。
除了 游戏 性能之外,我们还对搭载GeForceRTX3050Ti笔记本电脑GPU的机械革命Z3Air的专业性能和生产力进行测试。
SPECviewperf2020测试结果如下:
对于更广大内容创作者经常使用的Adobe三件套(Photoshop、Lightroom、PremierePro),本次使用UL公司出品的Procyon专业基准测试脚本进行展现:
ULProcyon提供了照片编辑基准测试,该基准测试使用Lightroom来导入、处理和修改选定的图像。在测试的第二部分中,Photoshop的照片将被进行多次编辑和图层效果。本次测试的Lightroom版本为102、Photoshop版本为2231。总成绩为7544、子项目ImageRetouching图像润色分数为6917,BatchProcessing批处理分数为8230。
除了照片编辑基准测试外,ULProcyon还提供了视频编辑基准测试,该基准测试使用PremierePro将视频项目文件导出为通用格式。每个视频项目都包括各种编辑编辑、调整和效果。基准分数基于导出视频所需的时间。这也是能够让GPU编解码器发挥出巨大作用的工作负载。
从测试结果中可以看出,凭借着GeForceRTX3050Ti笔记本电脑GPU的NVIDIAAmpere架构所支持的新一代NVENC编码器和NVDNC解码器,机械革命Z3Air在进行H264和H265视频出方面都有着较高的效率。
此外,GeForceRTX3050Ti笔记本电脑GPU还支持NVIDIABroadcast直播应用程序,通过此应用可将笔记本电脑转换为直播工作室,原理是通过调用NVIDIAAmpere架构的第3代TensorCore,用AI算法对外部环境进行优化,让直播变得更加轻松;最新的12版本还新增了AI增强下的房间回声消除和视频噪点消除等功能,并更新了音频降噪功能,可有效消除猫、狗和昆虫的声音,最终幅提高直播时的音视频质量。
打开NVIDIABroadcast直播应用程序,提供三个选项,非常直观。首先是麦克风和扬声器的噪音消除功能(也可选择房间回音消除beta),能够有效提高录制音频的效果。
除了麦克风和扬声器优化外,NVIDIABroadcast直播应用程序还能对摄像头录制效果进行优化,例如TensorCore的算法带来背景模糊、背景消除、背景更换等功能,功能强大又易于上手。
不开启特效:
开启背景删除:
开启背景更换:
目前搭载GeForceRTX3050Ti和RTX3050笔记本电脑GPU的 游戏 本已经陆续上市发售,截至目前型号已经超过140款,本次评测的机械革命Z3Air就是其中之一。
通过评测数据可以直观发现,相比于此前的x50系列GPU,全新的GeForceRTX3050Ti笔记本电脑GPU性能提升非常显著,甚至可以接近Turing架构甜品级RTX2060笔记本电脑GPU的性能,结合最新的处理器,让主流价位的 游戏 本运行大部分3A 游戏 都能在1080P分辨率下获得良好的帧率表现,以及较为出色的生产力性能,这都是以往搭载GTX1650笔记本电脑GPU的中低端 游戏 本无法提供的。
对于想体验最新NVIDIAAmpere架构的用户来说,搭载GeForceRTX3050Ti笔记本电脑GPU的新品 游戏 本,有很大的购买价值;当然,考虑到次一级的GeForceRTX3050笔记本电脑GPU也采用了GA107核心,且规模保留较为完整,估算下来性能损失不大,性价比更为出色,是购机预算较低玩家的性价比之选。
华硕b660能搭显卡3050。3050显卡搭载NVIDIAAmpere架构,采用了GA106-150核心处理器,以及8GBGDDR6显存,并配备用于光追的第二代RTCore和用于DLSS和AI的第三代TensorCore。除显卡外,想要轻松驾驭各类游戏大作,你还需要一块拥有强悍性能的主板与之搭配华硕B660主板。
华硕b660搭配显卡3050优势
华硕b660搭配显卡3050采用了最新的12nm制程以及Ampere架构,虽说材质单元和光栅单元数量和上代产品持平,不过RTX3050的CUDA单元实现了大幅提升,从1280个提升到2560个,同时显存也从4GBGDDR5升级到了8GBGDDR6,性能和容量都同样提升明显。
可以玩但会很卡的。
我的1050经过几天的折腾,终于能够流畅运行了,关键的事,还不是所有都最低,以前我进去第二章第一个镇的时候3步一卡,改了以后随便溜达,非常流畅。主要说我的设置吧,让所有低端显卡也能愉快游戏。
NVIDIA在CES 2022大展上,公开了新款卡皇GeForce RTX 3090 Ti。其拥有10752个流处理器,基本频率为1560 MHz,加速频率为1860 MHz,配有24GB的GDDR6X显存,速率达到21 Gbps,加上384位的显存位宽,理论显存带宽超过了1 TB/s,这将是GeForce显卡 历史 上首次跨过1 TB/s的带宽。NVIDIA表示,GeForce RTX 3090 Ti单精度浮点性能为40T FLOPS,达到了目前Ampere架构显卡的最高水平。其TDP提高到450W,同时也是第一款采用新型PCIe 50外接供电接口的显卡。不过,GeForce RTX 3090 Ti的身上其实还有些有趣的事情,接下来我们扒开它看一下。
完全体的GA102核心这次终于来了,它仍然沿用了从NVIDIA Pascal架构开始定下的GPC-TPC-SM层级架构,完全体的GA102核心一共具有7组完整的GPC,每组GPC包含6组TPC,每组TPC包含2组SM,所以完整的GA102核心拥有84个SM单元。
而且在Ampere架构中,每个SM单元拥有的CUDA核心数现在为128个,这就使得GeForce RTX 3090 Ti一共拥有10752个流处理器的超大规模。但是,与之前的GeForce RTX 3090相比,GeForce RTX 3090 Ti主要只是多了些流处理器吗?并不是这样。
我们先来看一下GeForce RTX 3090 Ti与TITAN RTX、GeForce RTX 3090和GeForce RTX 3080 Ti规格参数对比:
从定位上来说,GeForce RTX 3090 Ti以及GeForce RTX 3090都是上代TITAN RTX的继任者,上一代TITAN RTX的定位是面向AI和数据科学的解决方案,不过从目前这一代来看,TITAN这个系列似乎是被砍掉了,于是GeForce RTX 3090 Ti以及GeForce RTX 3090被录入了GeForce阵容,但是他们的目标群体很明确——面向8K 游戏 玩家及重度创作者,而这两者之中,其实更加偏向于重度创作者用户。
如果说GeForce RTX 3090定位是生产力工具的一个鲜明的特点是24GB大容量的GDDR6X显存的话,那么GeForce RTX 3090 Ti在这上又渐进了一步,那就是其显存配置不仅容量大,而且支持ECC纠错码了,这是笔者个人认为GeForce RTX 3090 Ti相比GeForce RTX 3090区别最大的两个地方之一。同时这也让GeForce RTX 3090 Ti看着很像设计与可视化解决方案领域的专业卡——RTX A6000。
但是GeForce RTX 3090 Ti与RTX A6000各有长处,RTX A6000的典型特点是可以配备最高达48GB的显存容量,但是GeForce RTX 3090 Ti的特点是配备了比RTX A6000更快的显存——GDDR6X。相对来说,设计与可视化生产流程更加偏重于需求大容量,而 游戏 需要低延迟,所以对显存速度也有要求,越快越好,当然, 游戏 的分辨率以及贴图质量也影响着显存容量的需求。
所以这里我们可以看到一个GeForce RTX 3090 Ti一个无出其右的点——那就是它的显存特点综合了GDDR6X的“快”、24GB的“大”容量以及支持ECC纠错码的“稳”,可以说是一个没有短板的多面手。
驱动的控制面板中有显存的ECC开关,默认是关闭的,对于创作软件来说开ECC会增加稳定性,而对于 游戏 用户来说,就不用打开了,由于多了一步纠错码计算,会稍微影响性能,默认不动就好。
上面说显存支持ECC纠错码是笔者个人认为GeForce RTX 3090 Ti相比GeForce RTX 3090区别最大的两个地方之一,而第二个地方并不是更多的流处理器,而是频率。
对于GeForce RTX 3090的GA102-300和GeForce RTX 3090 Ti的GA102-350这样的大核心来说,同时拥有高频是比较难的,因为即使可以高频,它也会面临功耗和发热的难题,毕竟随着频率的提升,功耗与发热是以超越线性的比例提升的,这也是为什么我们看到每一代的旗舰卡往往频率并不是同架构中最高的。
而这次的GeForce RTX 3090 Ti确实令人惊讶,它的Boost频率达到了1860MHz,相比GeForce RTX 3090的1695MHz提高了大约10%,相比较而言,流处理器单元只不过提高了不到3%而已。
在GeForce RTX 3090身上,显存带宽已经来到了936 GB/s,距离1 TB/s大关只差临门一脚了,这最后一脚由谁来实现呢?当然是NVIDIA自己,于是这一次于猛兽尽头更进一步的GeForce RTX 3090 Ti终于实现了超越1 TB/s的显存带宽,达到了1008 GB/s,这是GeForce显卡 历史 上第一次跨过1 TB/s的带宽。
而且除了这个第一,GeForce RTX 3090 Ti也是第一款采用新型PCIe 50外接供电接口的显卡。
同样的,基于新一代Ampere架构的GeForce RTX 3090 Ti显卡也具有这一代Ampere显卡的一些通用特性,并且相比上一代Turing架构有很大的进步。
GeForce RTX 30系显卡上的SM单元相比GeForce RTX 20系的,最大变化是加倍了针对传统计算的FP32单元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架构中,NVIDIA整数型(INT32)和单精度浮点型(FP32)两种不同的数据类型交给两种不同的ALU进行计算。不过现代 游戏 应用中最为常见的还是FP32,因此为了提高计算效率NVIDIA在NVIDIA Ampere 架构上引入了可同时支持INT32或FP32两种数据类型的新ALU。也就是说,现在有两条不同的数据路径,一条能够同时处理整数或者单精度浮点,另一条则单纯处理处理单精度浮点计算。
负责进行实时光线追踪运算的专用硬件单元RT Core在NVIDIA Ampere 架构上也更新到了第二代,最主要是增加了动态模糊的加速运算支持。NVIDIA在其中新加入的插值算法可以在保证动态模糊精确性的同时提高了实时光线追踪效率,官方表示最高可达8倍于上代的速度。另外在基础的BVH计算上,第二代RT Core也可以比第一代快2倍。
Tensor Core这个负责运行AI计算的硬件单元在NVIDIA Ampere 架构上也升级到了第三代。其实之前发布的A100计算卡上已经用上了新的第三代Tensor Core,它能够提供比第二代Tensor Core高出4倍的效能,不过 游戏 卡上面的Tensor Core进行了一定的精简,其FP16 FMA计算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core带来的更强劲AI运算有些什么用呢 答案就是DLSS。随着GeForce RTX 30系显卡一同发布的,还有DLSS的更新版 - DLSS 8K。顾名思义,DLSS 8K就是通过深度学习技术将画面分辨率拉伸至8K的新版DLSS,具体来说就是把1440P的画面拉伸至4320P,像素数量跨越了整整9倍。
再之后就是HDMI 21这个备受期待的新输出端口了。在HDMI 21之下,显卡可以用单线材做到8K60Hz或者4K120Hz的输出。对于想用大尺寸电视打 游戏 的玩家来说是一个不错的福音。
华硕TUF RTX 3090 Ti O24G GAMING显卡的外观与这一代TUF显卡的设计基本相同,同样采用了金属整流罩搭配低调的暗色花纹设计,并配置有金属背板,保护PCB的同时也可以辅助散热。另外整流罩的表面采用了两种工艺进行加工,分别是磨砂工艺和拉丝工艺。
显卡散热器配备的是三把约10cm直径的Axial-Tech轴流风扇,此款风扇采用双滚珠轴承,扇叶末端带有风扇环,可以形成比普通扇叶更高且更具导向性的风量和风压,并且具有低温自动停转的功能。另外值得一提的是,位于中间的风扇在旋转方向上与另外两把是相反的,这样的设计可以有效减少风扇相互之间的气流干扰,同样是有利于提升散热效果的。
华硕TUF RTX 3090 Ti O24G GAMING显卡的金属背板表面采用拉丝工艺处理,厚度约为2mm,可以保护显卡PCB不会因为重力而弯曲,尾端有进行开窗,可以让散热风流更好地通过,以增强散热器以及背板的散热效果。显卡的总体长度为324cm,高度为127cm,厚度为59cm,相当于3槽厚度。
显卡采用的并非是传统的PCIE供电接口,而是新式PCIe 50外接供电接口设计,即16Pin供电接口。这是这张卡在外观方面与其他GPU型号的显卡相比非常独特的一点,同时为了保证与老式电源的兼容性,华硕TUF RTX 3090 Ti O24G GAMING显卡也提供了一条12Pin转3个8Pin的转接线。
由于显卡上是16Pin供电接口,而转接线是12Pin,用户可能担心用3个8Pin转12Pin的供电线接在显卡的16Pin供电接口上会不会有影响,这点其实可以放心,那个4 Pin的信号接口目前是不影响的。
PCIe 50外接供电接口的发展经历了一个过程,NVIDIA在GeForce RTX 30系列显卡发布的时候推出了12Pin接口,可以提供最大600W的供电,而不久前英特尔发布ATX 30和ATX12VO 20规范则往前推进了一步,将接口定为16Pin,其中12Pin负责供电,另外4Pin负责信号传输,用于电源与PCIe 50显卡直接通信确定供电极限。
不过之前ATX 30和ATX12VO 20规范说的“新款线材接头会标出对应的额定功率,分别有150W、300W、450W和600W四档”这次还没看到,手里的线材上面并没有标注功率信息。
看完了供电接口,我们再看显示器接口方面,显卡提供了3个DP 14a接口和2个HDMI 21接口,比大多数显卡都多提供了1个HDMI 21接口,对于用户进行多屏输出的话有更好的兼容性。
显卡的供电接口旁边有个开关,可在显卡的双BIOS中进行切换,两个BIOS分别对应性能模式和静音模式,笔者拿到卡的默认状态是性能模式,后面的测试也会在这个模式下进行测试以反映大多数用户的实际使用情况。
最后,另外一个在外观方面与其他GPU型号的显卡相比非常独特的一点就是NV Link接口了。
华硕TUF RTX 3090 Ti O24G GAMING显卡的主体散热采用用了6根6mm直径的热管,使用回流焊工艺与底座以及散热鳍片结合;鳍片则可以分成前后两大区域,除了GPU本身外还照顾了显卡前后的VRM供电区域,整体散热面积非常大;底座则为纯铜镀镍设计,表面进行了镜面打磨,可让散热器表面与GPU芯片更好的接触,以提升导热效率。
并且它还有一根热管把显卡PCB左侧的供电MosFET的热量传递面积最大的那组鳍片上,而且也有通过导热贴与主散热器互联,能把热量传递到主散热器,同时底部采用一体化设计,能做到一定程度的热量均衡。
显卡背板除了加固保护PCB的作用之外,其上面也贴有导热胶,可以将显存和供电电路的部分热量引导至背板上,起到较好的辅助散热效果。
显卡使用的是GA102-350核心,具有GA102核心完整的规格,共有84组SM单元,一共10752个流处理器。
周围有12颗美光的GDDR6X显存,型号为美光的D8BZC,单颗2GB容量,32-bit位宽,12颗一共组成24GB 384-bit的显存规格。
显存这次的变化是相比于GeForce RTX 3090很重大的一点变化,新款2GB颗粒取代GeForce RTX 3090的1GB颗粒可以让GeForce RTX 3090 Ti配备的显存颗粒数量限制在12个,于是可以全部都安放在PCB正面,通过散热器高效散热,这简化了显卡的设计,而且降低了显卡背面的散热需求。
笔者至今都对之前GeForce RTX 3090的背面高发热记忆犹新,GeForce RTX 3090由于背面的显存发热量比较大,对显卡整体散热设计提出了较高的要求,不少用户也为此苦恼,而GeForce RTX 3090 Ti的2GB颗粒可以降低显卡背面发热情况。而且与GeForce RTX 3090相比的话,新的显存颗粒数据速率也提高了,从195Gbps提高到了21Gbps。
PCB上除了GPU和显存外,剩余空间基本上都用于布置供电元件,GPU的左右两侧都有供电电路,一共是21相,其中18相给GPU核心供电,3相为显存供电。供电部分的mosFET均是芯源系统(MPS) 的MP86957,供电控制方面主要是1颗芯源系统(MPS) 的MP2891来负责。
通过GPU-Z可以看到,华硕TUF RTX 3090 Ti O24G GAMING显卡的基础频率为1560MHz,Boost频率为1920MHz,相比公版方案1860MHz的频率OC了60MHz,显存等效数据速率为21Gbps。
通过GPU-Z还可以看到待机状态下风扇转速为零,这是由于前面说过的华硕TUF RTX 3090 Ti O24G GAMING具有风扇智能启停功能。
此外,华硕TUF RTX 3090 Ti O24G GAMING的默认温度上限是83摄氏度,玩家可以选择向上解锁到90摄氏度,功耗上限默认为450W,玩家可以选择向上解锁到最大516W。
测试平台如上表所示,主板采用的是ROG STRIX Z690-A GAMING WIFI D4吹雪主板,内存用两根芝奇 皇家戟 DDR4-3600 16GB组成双通道,其中BIOS设置方面,除了开启XMP让内存运行在3600MHz频率上之外,同时在主板BIOS中打开Resizable BAR的支持,其他均采用默认设置。
代表各款GPU型号的显卡分别是:华硕TUF RTX 3090 Ti O24G GAMING,Boost频率1920MHz;NVIDIA GeForce RTX 3090 Founder Edition,Boost频率1695MHz;讯景XFX Radeon RX 6900 XT海外版,Boost频率2365MHz。
这次的电源要特别介绍一下,因为它自带一根16Pin的原生线,用于适配新的GeForce RTX 3090 Ti显卡,对于之前已经购买了雷神2代1000W及以上和雷神1代1200W及以上的用户,可以像之前申请Z690的LGA 1700扣具一样在网上申请,华硕就会给老的ROG雷神用户补发16Pin线材。
我们以3DMark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11 游戏 中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12 游戏 中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3DMark显卡单项的得分。
基准测试方面,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度为10%,而与Radeon RX 6900 XT比较仍然是随着渲染压力不同呈现出不同的结果,在渲染压力最小的FireStrike项目中,Radeon RX 6900 XT的跑分是最高的,比GeForce RTX 3090 Ti还要高,随着渲染压力越来越大,GeForce RTX 3090 Ti的优势就越来越大,到了Time Spy Extreme项目已经是GeForce RTX 3090 Ti呈现大幅领先,而且带有光追的Port Royal项目更是拉大了差距。总的来说,6个项目的平均值结果是GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度为7%。
传统光栅化 游戏 画面测试这部分均将 游戏 画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质,《赛博朋克2077》为默认不开启光线追踪的预设中最高一档),默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用 游戏 自带的Benchmark输出结果。
传统光栅化 游戏 画面测试中,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度为85%,在《赛博朋克2077》、《孤岛惊魂6》和《战争机器5》中差距超过了10%,分别帧数高了125%、108%和12%。
GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度为16%,在《赛博朋克2077》、《全面战争:三国》和《纪元1800》中差距最大,GeForce RTX 3090 Ti相比Radeon RX 6900 XT分别高了30%、24%和25%。
光追 游戏 画面测试方面,光线追踪效果均设为“高”,由于DLSS以及FSR等分辨率拉伸技术的算法并不一样,最后的画面效果也不一样,为了保持测试的准确性,保证同样的画面结果,这些测试均不开启DLSS以及FSR等分辨率拉伸技术。
光追 游戏 画面测试方面,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度为106%,在《赛博朋克2077》、《光明记忆》和《边境》中差距较大,GeForce RTX 3090 Ti分别帧数高了138%、12%和144%。
GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度为40%,在《赛博朋克2077》、《看门狗:军团》和《边境》中差距最大,GeForce RTX 3090 Ti相比Radeon RX 6900 XT分别高了105%、65%和86%。
这部分就没有Radeon RX 6900 XT的成绩了,Radeon RX 6900 XT即使借助FSR目前也无法胜任8K光追 游戏 。这部分均将 游戏 画质设置为预设里面的最高画质设置(《地铁:离去》选择Ultra画质),开启光线追踪效果至“高”(《赛博朋克2077》的预设最高画质已经开启了光线追踪效果,这部分不再变动),打开DLSS至超级性能模式,默认不是全屏的手动改为全屏,默认开启了垂直同步的手动关闭垂直同步,除此之外其他选项均为默认设置,均采用 游戏 自带的Benchmark输出结果。
8K光追 游戏 画面测试中,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度为12%,在《赛博朋克2077》、《地铁:离去(增强版)》、《光明记忆》和《古墓丽影:暗影》中差距较大,分别帧数高了124%、132%、128%和125%。
GeForce RTX 3090 Ti适合重度创作者,原因主要是其大容量的显存配置,所以这里对比的显卡不是同样容量的GeForce RTX 3090,而是GeForce RTX 3080 Ti,同时由于测试的重度创作项目文件较大,需要大容量的内存容量才能全部正确的载入,故而又加了两根16GB内存组成了64GB的总容量。Blender的部分由于Windows 11下出现bug,故而是在Windows 10下对比的,其他项目都是在Windows 11下对比的。
GeForce RTX 3090 Ti与GeForce RTX 3080 Ti相比,在创作方面的体验区别还主要不是一个快一些一个慢一些的区别,而是面对一些大的项目的时候,直接一个是可以正常工作,而另一个则会因为显存容量不够出现项目无法继续进行、或者直接程序报错的情况,对于创作流程影响很大。
在Blender里面,这次测试的素材加载之后,由于显存不够用,GeForce RTX 3080 Ti在执行渲染的时候直接报错,提示显存不够。
而GeForce RTX 3090/3090 Ti则可以正常完成工作流程。
在Davinci中,本次测试的是一个8K RED RAW素材,在为素材添加了一些效果之后,GeForce RTX 3080 Ti已经不能正确的播放,显存占用慢慢变高直至溢出掉后清空,然后软件会提示显存不足而报错。
而GeForce RTX 3090/3090 Ti则可以在同样的效果设置下正常完成播放预览。
OctaneRender的情况也和前面差不多,GeForce RTX 3080 Ti在渲染的过程中出现橙色的“OCC”提醒,即显卡的显存不足,渲染调用了内存作为临时存储。可以看到GeForce RTX 3080 Ti的显存占用到87GB显存,还向内存借了69GB。
而GeForce RTX 3090/3090 Ti则很轻松,大约185GB的项目数据全部可以放在显存中,这也导致它渲染起来特别的快。
可以看到由于显存不足导致渲染时间天壤之别,GeForce RTX 3080 Ti总共用了479秒,差不多8分钟才渲染完成。而GeForce RTX 3090 Ti只需要15秒就完成。
通过我们手中的PCAT套件,可以分别精确地测量显卡PCI-E、外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。
统计功耗测试的结果算出,这张华硕TUF RTX 3090 Ti O24G GAMING的整卡待机功耗平均为324W,满载功耗平均为4482W,峰值功耗到过472W。对于这样级别的显卡功耗来说,电源的话如果平台其他部件的功耗不高那么可以850W的电源来带动,如果其他部件的功耗也较高建议至少1000W的电源起步。
我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5 左右)下进行测试,测试环境温度约为211 。待机温度是开机以后记录10分钟,满载温度则是完成3DMark Time Spy压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。
这张华硕TUF RTX 3090 Ti O24G GAMING具有风扇待机停转的功能,所以待机状态下全靠被动散热。经过十分钟的待机测试,从开始的376摄氏度上升到424摄氏度左右,10分钟待机过程中最热点温度则是最低是开始的463摄氏度,偏后段是508摄氏度。
将功耗上限和温度上限解锁到最高之后,经过多番手动超频尝试,GeForce RTX 3090 Ti最终在核心频率+150MHz,GDDR6X显存数据速率+2Gbps下完成超频。这个状态下,这张华硕TUF RTX 3090 Ti O24G GAMING能顺利通过3DMark的Time Spy Extreme项目测试并且分数最高, 此时这张卡的Boost频率为2070MHz,显存等效频率为23Gbps。这张华硕TUF RTX 3090 Ti O24G GAMING在超频状态下运行3DMark Time Spy Extreme项目的GPU得分与默频状态下GPU得分的对比如下表所示。
在这个幅度之下,华硕这张GeForce RTX 3090 Ti O24G GAMING在Time Spy Extreme中的显卡得分为11994分,比默频时高81%左右,对于卡皇级别的大核心来说,很恐怖了。
总的来说,GeForce RTX 3090 Ti的定位大体与之前的GeForce RTX 3090差不多,面向8K 游戏 玩家及重度创作者,不过GeForce RTX 3090 Ti全方位超越GeForce RTX 3090,相当于就是将目前顶级的消费级显卡再向上推进了一步,给了目前消费者对于最顶级的GPU的一个新选择。
而对于4K及以下分辨率的 游戏 环境来说,其实最推荐的还是GeForce RTX 3080 Ti,GeForce RTX 3080 Ti已经可以满足4K下顶级的 游戏 体验,并且就价格来说,也是相当合适的,GeForce RTX 3080 Ti整张卡的各方面设计也是面向 游戏 设计的。对于GeForce RTX 3090 Ti,相对来说还是推荐创作用途,只不过它也提供很好的 游戏 性能,但是用于创作用途的话,它的价值发挥的更大,显存带纠错码(ECC)的特性也可以发挥出来。
显卡迷你天梯榜 (完整显卡天梯榜)
GeForce RTX 3090 Ti的450W功耗也是不可忽视的点,不过这个功耗也是频率大幅度提升的结果,由此也带来强大的性能提升。综合来说,对于一张售价几乎15万元起步的显卡来说,它注定是少数人的囊中之物,而且就边际效用来说,对于 游戏 玩家也完全不如GeForce RTX 3080 Ti更合适。总的来说,这张卡看起来展示意味很重。
结合最近英特尔的锐炫A系列移动端独显以及AMD或许将不久后要推出Radeon RX 6x50 XT系列显卡,而NVIDIA后面的新显卡发布估计就是要等到下一代的GeForce RTX 40系列再见面了,这中间很长一段时间显卡市场的焦点可能会落在英特尔和AMD身上,故而笔者认为这次GeForce RTX 3090 Ti的推出是NVIDIA想传递出一个信息,那就是——在显卡领域,即使我暂时“隐市”,你们也不要忘记还有如此一座难以逾越的高山存在。
最后,有点意思的是,从目前的环境来看,GeForce RTX 3090 Ti或许是最近两年来最有可能用户能在首发日前后就能以建议零售价买到的显卡产品。目前笔者从华硕得到的消息是其TUF系列的GeForce RTX 3090 Ti显卡如果是公版频率的话,那么售价就是建议零售价的14999元,如果是TUF系列的OC版显卡,售价稍高一点为15499元(也就是本次测试的这张显卡),更高端的STRIX系列则是16499元。
并且,华硕表示价格会被锁定,不会再涨价,对于用户来说这可能是最近两年关于显卡价格听到的最好的消息了,没有之一。能。
一、GeForce RTX 3060 Ti外观
在外包装上,GeForce RTX 3060 Ti与前几款发布的显卡相同,NV标识性的极简风格,方方正正的硬纸盒子,主色调以黑色为主,辅以玫瑰金色纹路。
相比RTX 3080的推拉式散热,RTX 3060 Ti采用推式风扇设计,显卡前端的风扇将热空气从机箱背部支架排出;显卡尾部直接由正面导流罩和大量的外露散热鳍片组成,形成中空状态,风扇依旧会将热气通过散热鳍片向上排出。
二、NVIDIA Ampere架构中的RTX 3060 Ti
NVIDIA GeForce RTX 3060 Ti采用了NVIDIA Ampere架构,我们首先来看一下RTX 3060 Ti的提升。第二代RTX架构 Ampere下的3060 Ti相较于初代的Turing RTX架构,NVIDIAAmpere架构在算力上有着成倍的增长,这一点在RTX 3060 Ti中依旧有体现,每个时钟执行2次着色器运算,而Turing为1次,RTX 3060 Ti的着色器性能达到162 TFLOPS单精度性能,而Turing为72 TFLOPS。NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量,RT Core达到316 RTTFLOPS,而Turing为217 RT TFLOPS。全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达1296 TensorTFLOPS,而Turing为574 TensorTFLOPS。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)