3dvcache叠层缓存技术_有谁知道cache的发展过程

㈠ AMD官宣Zen5芯片架构，将配备V-Cache技术，对此你有何期待

我比较期待看到Zen5芯片所带来的具体性能的提升，同时也非常期待检测Zen5芯片的性能稳定性。

在Zen5芯片之前，我们通常所使用到的一般是Zen4芯片和Zen3芯片。在此之前，芯片的工艺已经可以缩小到了5纳米和7纳米左右，我们经常所提到的国产芯片的工艺一般在10纳米以上。从某种程度上来说，5纳米基本上已经是芯片工艺的极限了，如果能够把5纳米进一步缩小到1纳米的话，芯片对各类电子设备的提升将会非常大。

AMD将发布Zen5芯片架构。

在和英特尔竞争的过程当中，AMD有望率先发布Zen5芯片架构，并且把3纳米的Zen5芯片率先采用在处理器上。如果能够做到这一点的话，Zen5芯片将会对处理器的整体性能提升至少25%以上，甚至可以提高到50%。因为Zen5芯片的工艺相对比较复杂，所以Zen5芯片会全心配备V-Cache 技术，这会进一步提高V-Cache 技术的稳定性。

㈡有谁知道cache的发展过程

纵观PC系统和CPU二十年的发展，随着半导体加工工艺水平的不断提高，CPU和存储器的性能都有了很大的提高。
CPU频率的提高，必然要求系统中存储器的存取速度要提高，还要求其容量要增大。主存储器DRAM容量的提高还是比较快的，但是DRAM读取时间的提高却很慢。从而在速度上与CPU主频的提高产生了极不相配的情况，这样会影响整个系统的性能。二十年来，CPU设计的问题之一就是解决高速CPU和低速DRAM之间的平衡或匹配问题，以求系统性能的整体提高。
在它们之间加入高速缓冲存储器Cache，就是这个问题的解决方案之一。
Cache随CPU的发展而不断改变，可以概括为：从无到有，由小到大，先外后内，纵深配备，软硬兼施。初期的CPU没有Cache，在80386时期出现外部Cache；80486时期开始有内部仅8kB的Cache。Cache的分级也由L1和L2级，发展到L0和L3级的纵深配备；Cache的大小由当初的8kB，直到Merced的1～2MB。为了更好地利用Cache，还专门配有缓存控制指令。
本文回顾了在过去的二十年中，Cache技术的发展历程，并对PC其它设备使用Cache技术作了简单陈述。 PC初期无需Cache在八十年代初，由于CPU主频很低，DRAM的存取时间甚至快于CPU存取时间，因此无需Cache。例如，当时PC机采用8088CPU，系统主频为4.77MHz，一个基本总线周期为4拍，即840ns。此时64kB的DRAM存取周期200ns，造成DRAM等待CPU的执行的局面，无需Cache。
在PC/AT机采用80286CPU后，系统主频增加到10MHz，1个基本总线周期为2拍，即200ns。此时必须用读取时间为100ns的DRAM。在采用25MHz的80386DX时，一个基本总线周期为2拍，即80ns，当时已没有速度相匹配的DRAM可用。解决方案有2种：一种是在基本总线周期中插入等待，降低CPU的处理能力；另一种是采用内部和外部Cache，使用SRAM芯片以提高存储器的读取速度。80386没有L1 Cache80386初期主频为20MHz。Intel公司十分重视80386的设计制造，把它定位于“新一代个人电脑架构”，想把一些新技术设计在芯片中。但由于当时工艺所限，内置高速缓存的芯片体积过大，造成成本上升，同时工期有限，几经权衡，最后决定在80386芯片不设置高速缓冲存储器，可以生产另外的Cache，以配合80386运作。
尽管人们意识到CPU主频的增加与内存DRAM存取时间过慢的矛盾已愈加突出，但因条件所限，80386内部没有L1 Cache，只有外部的Cache。80486出现Cache80486是由80386CPU加80387数字协处理器以及8kB Cache构成。
当CPU的时钟频率继续增加时，外部Cache的SRAM芯片速度也要相应提高，这样会增加系统成本，为此在设计80486时采用了内部Cache。
80486芯片内由8kB的Cache来存放指令和数据。同时，80486也可以使用处理器外部的第二级Cache,用以改善系统性能并降低80486要求的总线带宽。Cache可以工作在80486所有的操作模式：实地址模式、保护模式和X86模式。对Cache的操作是由系统自动进行的，对程序员透明。而在多处理器系统中，可能要求系统软件的干预。对于一般的计算机，在系统CMOS设置中均有Cache使用模式的设置。
80486内部Cache是一个4路组相联Cache，在主存储器中给定单元的数据能够存储在Cache内4个单元中的任何一个。这种4路相联方式是高命中率的全相联Cache和快速的直接映像Cache的一种折衷，因而能进行快速查找并获得高的命中率。Peutium的分离L1 Cache和L2 CachePentium处理器采用了超标量结构双路执行的流水线，有分支预测技术。
由于Pentium设计有2条并行整数流水线，可同时执行2条命令。整数单元的潜在处理能力实际可增加一倍，处理器也需要对命令和数据进进双倍的访问。为使这些访问不互相干涉，Intel把在486上共用的内部Cache，分成2个彼此独立的8kB代码Cache和8kB数据Cache，这两个Cache可以同时被访问。这种双路高速缓存结构减少了争用Cache所造成的冲突，提高了处理器效能。Pentium的Cache还采用了回写写入方式，这同486的贯穿写入方式相比，可以增加Cache的命中率。此外，还采用了一种称为MESI高速缓存一致性协议，为确保多处理器环境下的数据一致性提供了保证。Pentium Pro内嵌式L2 Cache为使Pentium Pro的性能超过Pentium,必需使用创新的设计方法。Pentium Pro使用了新的超标量和级流水线技术，包括无序执行、动态分支预测和推测执行的动态执行新技术。它可以使CPU在一个时钟周期执行3条微操作。CPU并行处理速度的加快，意味着它同时处理指令和数据的数量增加，为不使CPU处于等待状态，需要重新设计Cache。
Pentium Pro在片内第一级Cache的设计方案中，使指令Cache与数据Cache分别设置。指令Cache的容量为8kB，采用2路组相联映像方式。数据Cache的容量也为8kB，但采用4路组相联映像方式。Pentium Pro采用MESI(修改、排他、共享、作废)协议来维持Cache和主存储器之间的一致性。通常，人们总以为，像Pentium Pro这样的3路超标量结构的微处理器会采用更大容量的片内第一级Cache和更大的第二级Cache。然而，Intel公司的设计者却选择了另一条设计思路——设计一种Cache存储阶层结构，使得能够从一个Cache流动到另一个Cache，而不用阻塞执行。
Pentium Pro采用了内嵌式或称捆绑式L2Cache，大小为256kB或512kB。此时的L2已经用线路直接连到CPU上，益处之一就是减少了对急剧增多L1 Cache的需求。L2 Cache还能与CPU同步运行。即当L1 Cache不命中时，立刻访问L2 Cache，不产生附加延迟。为进一步减少因要访问的信息不在高速缓冲中时所带来的性能损失，Pentium Pro的L1和L2都设计成非锁定型。即当哪个Cache中没有CPU所需的信息时，它不妨碍后面访问Cache的处理过程。Cache可以直接处理最多4次的Cache缺页情况，借助CPU的内存有序缓冲区可以顺序保存最多12次的内存访问。非锁定型Cache适用于Pentium Pro的乱序执行核心，因为在可能引发流水线延迟的长等待内存操作期间，这些Cache可以让CPU继续运行。
Pentium Pro的如此捆绑封装，带来器件成本提高。一方面专用的L2 cache芯片成本高，另一方面两个不同功能的芯片只有放在一起联结后才能最后测试其性能的完整性。而当其中有一个有缺陷时，两个芯片都被报废。在以后的Pentium Pro产品中，又将L2 Cache从芯片中去掉。Pentium MMX容量增大的L1和L2CachePentium MMX是能运行多媒体指令MMX的高能奔腾处理器。Pentium MMX具有改进的分支预测和增强型流水线技术，并将L1 Cache容量增加到32kB，L2 Cache为512kB。
Pentium MMX的片内L1数据和指令的Cache，每个增到16kB，4路相联。较大的独立内部Cache、减少平均内存存取时间，同时提供对近期所用指令和数据的快速存取，性能因此得到提高。数据Cache支持采用回写方式更新内存。
由于CacheL1容量的增大，使当时的应用程序运行速度提高了10％左右。PentiumⅡ设有双独立总线连接L2 CachePentiumⅡ是Pentium Pro的改进型，具有MMX指令，使用动态执行技术，采用双独立总线结构。PentiumⅡ同样有2级Cache，L1为32kB(指令和数据Cache各16kB)是Pentium Pro的一倍。L2为512kB。
Pentium Ⅱ与Pentium Pro在L2 Cache 的不同是由于制作成本原因。L2 Cache已不在内嵌芯片上，而是与CPU通过专用64位高速缓存总线相联，与其它元器件共同被组装在同一基板上，即“单边接触盒”上。双独立总线结构就是：L2高速缓存总线和处理器至主内存(Processor－to－main－memory)的系统总线。 PentiumⅡ处理器可以同时使用这两条总线，与单一总线结构的处理器相比，该处理器可以进出两倍多的数据,可允许 PentiumⅡ处理器的L2高速缓存比Pentium处理器的L2高速缓存要快1倍。随着 PentiumⅡ处理器主频的提高，L2高速缓存的速度也将加快。最后，流水线型系统总线可允许同时并行传输，而不是单个顺序型传输。改进型的双重独立总线结构，可以产生超过与单总线结构三倍带宽的性能。另外，在PentiumⅡ中，采用了ECC技术，此技术应用到二级高速缓存中，大大提高了数据的完整性和可靠性。
为开发低端市场，曾在 PentiumⅡ的基板上除去L2，牺牲一些性能，制造廉价CPU。这就是最初的Celeron处理器。以后的Celeron仍加有较小的片上L2 Cache，其大小为128kB。PentiumⅢ的L2 Cache增大PentiumⅢ也是基于Pentium Pro结构为核心，在原有MMX多媒体指令的基础上，又增了70多条多媒体指令。它使用动态执行技术，采用双独立总线结构。
PentiumⅢ具有32kB非锁定L1 Cache和512kB非锁定L2 Cache。L2可扩充到1～2MB，具有更合理的内存管理，可以有效地对大于L2缓存的数据块进行处理，使CPU、Cache和主存存取更趋合理，提高了系统整体性能。在执行视频回放和访问大型数据库时，高效率的高速缓存管理使PⅢ避免了对L2 Cache的不必要的存取。由于消除了缓冲失败，多媒体和其它对时间敏感的操作性能更高了。对于可缓存的内容，PⅢ通过预先读取期望的数据到高速缓存里来提高速度，这一特色提高了高速缓存的命中率，减少了存取时间。Merced设有L0即将推出的第7代处理器Merced主频可达1GHz。很明显，对Cache的要求更高了。为此，lntel本着“大力提高执行单元和缓存间数据交换速度”的思想，在芯片内开发新的Cache，并增加L1 Cache的容量，来平衡CPU和DRAM间的速度。
为此，在Merced的片上最接近执行单元旁再设另一处Cache，称为L0缓存，是指令/数据分离型。由于L0Cache在物理位置上比L1离执行单元更近，布线距离的缩短，使它与执行单元间的数据交换速度比L1还快，可以进一步提高工作主频。
同时，还要在芯片内部配置超过1MB的大容量L1 Cache。芯片内部Cache比外部Cache更易于提升与执行单元间的数据传送速度。内部Cache的加大，执行单元不易发生“等待”。现行的内部Cache容量仅为32kB～128kB。内部Cache容量的增加会引起芯片面积增大，提高制造成本。但大部分公司认为，由于内部Cache容量增大而导致成本的上扬，可以用制造技术来弥补。与Cache相配合的缓存控制指令为进一步发挥Cache的作用，改进内存性能并使之与CPU发展同步来维护系统平衡，一些制造CPU的厂家增加了控制缓存的指令。如Intel公司在PentiumⅢ处理器中新增加了70条3D及多媒体的SSE指令集。其中有很重要的一组指令是缓存控制指令。AMD公司在K6－2和K6－3中的3DNow!多媒体指令中，也有从L1数据Cache中预取最新数据的数据预取指令(Prefetch)。
PentiumⅢ处理器的缓存控制指令，用于优化内存连续数据流。针对数据流的应用需要对以前的Cache运作方式进行了改进，减少了一些不必要的中间环节，节省了时间，增加了CPU数据总线的实际可用带宽，也提高了Cache的效率。
有两类缓存控制指令。一类是数据据预存取(Prefetch)指令，能够增加从主存到缓存的数据流；另一类是内存流优化处理(Memory Streaming)指令，能够增加从处理器到主存的数据流。这两类指令都赋予了应用开发人员对缓存内容更大控制能力，使他们能够控制缓存操作以满足其应用的需求。
数据预存取指令允许应用识别出所需的信息，并预先将其从主存中取出存入缓存。这样一来，处理器可以更快地获取信息，从而改进应用性能。为了进一步削减内存延迟，内存访问还可以与计算机周期保持流水操作。例如，如果一个应用需要计算一些数值以供3D图形使用，当它在计算一个值的同时就可以预取下一个需要计算的数值。
内存流优化处理指令允许应用越过缓存直接访问主存。通常情况下，处理器写出的数据都将暂时存储在缓存中以备处理器稍后使用。如果处理器不再使用它，数据最终将被移至主存。然而，对于多媒体应用来就，通常不再需要使用这些数据。因此，这时将数据尽快地移到主存中则显得至关重要。采用了PentiumⅢ处理器的内存流优化处理指令后，应用程序就能让数据搭乘“直达快车”，直接到达主存。当数据流直接到达主存时，处理器负责维护缓存的一致性。因为这种方式避免了为数据流留出空间清空缓存的当前内容，从而也提高了缓存的利用率。
总而言之，缓存控制指令改进了进出处理器的数据据流，使处理器保持其高速率运作。通过这些指令(同时还需要一些专为其设计以使其发挥优势的软件)，商业用户可以在操作系统和图形设备驱动程序中感受其性能优势。Cache在PC中其它设备的应用Cache作为一种速度匹配技术，不仅用在提高CPU对内存的读写速度上，而且也用在CPU结构的其它部分和PC系统中。
PC的显示系统中，由于3D应用的迅猛发展，大量的显示内存使用着高速缓存技术，如前台缓存、后台缓存、深度缓存和纹理缓存等。
PC的磁盘系统中，为提高内存对磁盘(主要是硬盘)的读写速度，就要建立磁盘高速缓存。因为DRAM内存的存取速度对CPU来说较慢，但对磁盘的存取速度却是很快的。这是因为磁盘存储系统包含有磁头的机械运动，而机械运动无法跟传送电信号的电子速度相比。此外，磁头中电与磁的信号转换也对速度有影响。这样，为了提高磁盘存取速度而采用Cache也就顺理成章了。硬盘Cache无需使用高速的SRAM，它只需在内存(DRAM)中划出一个区域，作为专用的磁盘缓冲区，采用一定的数据结构，即可实现磁盘存取的Cache技术。它的过程也是把即将访问的数据整块地拷贝到高速缓存区中，然后内存再到高速缓存中去逐个读取数据。由于数据在RAM空间内部传送要比在RAM与磁盘间传送快得多，系统由此提高了存取速度。
硬盘的Cache可以放在常规内存中。不过，为了不占用宝贵的用户程序空间，通常是把它设在扩展内存或扩充内存里。硬盘Cache是由人们共知的SMARTDRIVE.EXE文件自动建立的，用户只需在AUTOEXEC.BAT与CONFIG.SYS中加入相应的命令行就成了。
在较慢速的其它外围设备和内存的数据交换中，在网络通讯中,都需要使用Cache技术。推而广之，凡是在传输速度有较大差异的设备之间，都可以利用Cache的速度匹配技术。结束语PC中的Cache主要是为了解决高速CPU和低速DRAM内存间速度匹配的问题，是提高系统性能，降低系统成本而采用的一项技术。随着CPU和PC的发展，20年来，现在的Cache已成为CPU和PC不可缺少的组成部分，是广大用户衡量系统性能优劣的一项重要指标。据预测，在21世纪初期，CPU主频加快发展的趋势，加上内存DRAM的存取时间也会提高，从系统的性价比考虑，Cache的配备仍然是重要的技术之一。

㈢ amd无限缓存怎么开

AMD无限缓存开启方法:

进bios，进入advanced。

在advanced的PCI settings里面找到above 4G Deconding。

将选项选择为Enabled。

打开之后就会有个 Re-Size BAR Support，也一样的打开，选择auto就行了。

AMD RDNA2架构的一个独特亮点就是加入了无限缓存(Infinity Cache)，只需不高的显存位宽、带宽即可满足性能需求，而且容量越大、游戏分辨率越高，效果越明显。

下一代的RNDA3架构必然延续这一设计，并继续做大，而在锐龙、霄龙准备加入3D堆叠缓存的同时，RDNA3也会效仿。

据曝料，AMD RDNA3架构会融入3D堆叠的无限缓存，而且容量最高达512MB，是目前的整整4倍。

总结如下：

Navi 31大核心拥有完整的512MB，Navi 32、Navi 33会分别精简到384MB、256MB。

至于显存，预计它们会分别是256-bit、192-bit、128-bit的位宽，继续使用GDDR6，而不需要上更高频率的GDDR6X。

不过值得一提的是，Navi 31本身还会采用MCM双芯整合封装方式，等于每个核心的无限缓存还是256MB。

㈣什么是3D V-NAND

3D V-NAND这是作为闪存芯片（NAND)制造的新技术，3D V-NAND主要从结构方面对闪存芯片进行了改进。在之前的闪存芯片中，采用的都是2D平面设计的存储单元（Cell）技术。使用3D V-NAND技术之后，则将闪存芯片中的晶体管竖了起来，然后用绝缘体和控制栅极环绕包围这这些晶体管，这样就形成了一个“站立”起来的同轴结构体。将这些同轴结构体一层层向上堆叠，形成多层结构，就构成了3D V-NAND的基本形态。

㈤ Vcache是什么

Vcache是一个有趣东西，它完全是Windows应用编程人员的创造物。多年前(大约在Windows 3.1推出时)，微软公司觉得将计算机系统内存分成两部分(即存储器和高速缓存器)是一个好主意。"存储器"就是我们通常在提到RAM时所联想到的部分，它是存储那些需要用于当前运行程序的数据。"高速缓存器"常被称为"vcache"，它是保存磁盘高速缓存信息的内存部分。就此需要特别说明的是，这两部分不能共享相同的RAM，但是它们都能够拒绝存储冗余数据 - 因此通常你可以禁止系统内存中有两个相同数据的复本。由于当Windows在处理数据时，它清理vcache空间的性能欠佳，因此会吞噬很多额外资源.

㈥ AMD Ryzen 7 5800X3D被开盖：玩家宣称核心温度不会达到90°C

一般来说，很少玩家会对AMD Ryzen 5000系列处理器动手去进行开盖，因为芯片通过钎焊方式固定在了集成散热器（IHS）上，以提高导热性。如果玩家冒然行动，很容易对CCD核心造成破坏。当然，也不乏勇士选择这么做，比如Hardwareluxx社区的发烧友Fritzchens Fritz，过去曾对AMD Ryzen 5 5600X开盖后拍下内核照片。

早些时候，AMD推出了Ryzen 7 5800X3D，这是第一款、也是迄今为止唯一一款采用3D垂直缓存（3D V-Cache）技术的消费级处理器，为CCD带来额外的64MB 7nm SRAM缓存，使得这款Zen 3架构处理器的L3缓存容量由32MB增加到96MB，容量达到了原来的三倍。由于3D垂直缓存芯片是安装在对应CCX上面的，所以相比于普通的AMD Ryzen 5000系列处理器，想对Ryzen 7 5800X3D进行开盖显然难度更大。

近日，有玩家就尝试这么做，而且成功了。这位玩家还表示，成功开盖后，Ryzen 7 5800X3D的核心温度不再达到90 C，似乎解决了原有的严重积热问题。至于这个温度在什么工作负载，以及什么样的散热条件下得到，玩家并没有说明。

不过有一件事情是肯定的，就是未来想对具备3D V-Cache技术的Ryzen 7000系列处理器进行开盖，操作起来会更加艰难。由于AMD在新款Ryzen 7000系列处理器的集成散热器上进行了切口处理，以腾出位置安放电容，这样的设计显然也让处理器开盖的难度增加了。此前网络上曾曝光这款Zen 4架构处理器的集成散热器，似乎是以开盖方式取得，不过泄露者没有透露更多的信息。

㈦ pc-20200806BNNO啥型号

AMD发布了锐龙6000系列移动端处理器全线产品，全新一代处理器最明显的产品特点就是升级了Zen 3+架构和6nm制程，并且内置RDNA 2架构核显，同时也将会全面支持DDR5内存和PCIe 4.0通道、USB 4协议和Wi-Fi 6E网络。AMD召开了CES 2022线上发布会。本次发布会上，AMD带来诸多的新款处理器，包括全新的锐龙6000系列移动端处理器、首款基于3D V-Cache缓存技术打造的R7 5800X 3D处理器。

㈧ 3DV是什么意思呢

3DV标准主要由3DV和3DP组成，3DV和3DP是由3DVSTAR等多家3D企业针对3D视频播放和3D图片显示特性制定的一种视频标准和文件封装，它们分别对应了视频格式封装(3DV)和图片格式封装(3DP)，3D视频或图片由两路或多路视频画面组成，在传统数码设备上解码及播放和显示都有技术瓶颈，它的出现从技术上解决了诸多的技术问题，能让解码软件或硬件正确识别为3D图像，减少了传统3D数码设备上客户繁琐的设置和操作，能让更多的手持电子设备对立体视频进行高效实时的立体播放和显示；能让立体视频中的两个甚至多个视角的画面进行解码，并且简单的利用软硬件即可分别控制显示给对应的3D显示设备；可以利用解码后数据可以控制筛选的特点进行实时的2D/3D显示切换。 3DV标准由于是针对手持电子数码产品制定的技术标准，所以在后续的产品开发中可以将诸多的3D播放应用于产品中，例如通过软件判断产品系统语言利用3DV多音轨实现自动播放为客户需要的语音，利用软件将外挂或者内封装的字幕显示为出屏悬空等，总之，在众多的发起企业的共同努力下，相信3DV格式的支持将成为3D数码产品必不可少的组成部分

3dvcache叠层缓存技术

与3dvcache叠层缓存技术相关的内容