除了45nm工艺上的改进外,依托全新的45nm工艺,Penryn还在微架构上做出以下的改进和增强。

从架构上看,除了45nm工艺带来的电气改进之外新的Penryn微架构主要有5方面的改进:
Intel Wide Dynamic Execution(Intel宽动态执行)方面的改进着实从基础上提升了处理器的运算性能,包括快速16进制除法器、更快速的操作系统基础支持、增强的Intel虚拟化技术三个部分。(与桌面平台相关的主要是16进制除法器)

虽然除法也可以用乘法来代替,不过单独的除法指令、除法运算器部件显然可以提升效能,Penryn架构搭载了新的16进制除法部件,可以提供目前最顶级的除法性能。传统的2进制或者4进制除法只能在每个时钟处理1位或者2位数据(2个位就能表示4个数,也就是4进制的意思),而Penryn 16进制除法器可以每个时钟处理4位数据(4个位就能表示16个数),可以大大提升包括整数、浮点在内的除法性能,并大大优化了平方根的运算,而且Penryn的除法器的Early-out构造可以以极低的延迟输出结果,最小值需要6个时钟周期。
Intel Advanced Smart Cache(Intel先进智能缓存)则进一步提升了缓存性能,以符合未来多核心的趋势,其包括了更大容量的缓存以及更多路的缓存关联。

Intel Advanced Smart Cache其实就是L2缓存方面的改进,Penryn处理器家族的L2缓存容量得到了提升,双核心版本将拥有最多6MB、四核心将拥有最多12MB的L2缓存,比上一个版本增大了50%。并且在容量提升的基础上,Penryn还把L2 Cache的Associativity关联性由上一代的16路提升到了24路,令L2缓存存取的平均潜伏期得到了进一步的下降。
Intel Smart Memory Access(Intel智能内存存取)提升了装载数据的速度,包括强化的存储转发结构和更高的总线带宽设计。


除了更快的1600MT/s总线可以提供更高的存取速度之外,Penryn架构还提供了Improved Store Forwarding强化存储转发特性,通过新的64位载入指令,提升了内存之间、核心之间等的存储转发性能。
Intel Advanced Digital Media Boost(Intel先进数字媒体增强)则是对数字媒体的一系列优化、增强,包括了SSE4指令集的加入,以及全新的Super Shuffle Engine超级传送引擎。

Penryn搭载的47条SSE4.1特别为多媒体而优化,在相关应用方面可以提升100%多的性能(DivX 6.6 Alpha编码测试),在图形、图像方面也有着不小的提升。关于SSE4指令集的比较详细的分析,可以参看:IA32多媒体指令集革命 Intel SSE4前瞻。
Super Shuffle Engine超级传送引擎

Super Shuffle Engine其实是加速SSE相关数据的传输转移过程,包括打包、解压、对齐、宽进位等操作,都可以通过Super Shuffle Engine来加速,从而可以在每个时钟周期内完成128位的操作。这个加速是完全硬件的,不需要软件的变动。
Intel Intelligent Power Capability(Intel智能电源特性)则是充分发挥新制程的特点,降低总体能源的消耗,包括了深层关机技术和增强的Intel动态加速技术(该项改进主要针对移动平台)。
| 第1页:为酷睿充电,“超级45”通俗诠释P.. | 第2页:从10微米到45纳米,英特尔处理器.. |
| 第3页:40年重大突破,高K栅介质金属栅.. | 第4页:改良酷睿微架构 5点主要性能明显.. |
| 第5页:8年后最重要更新,SSE4指令让Penr.. | 第6页:45nm技术,如何让Penryn更加省电? |
| 第7页:我们的测试:QX9650综合性能全面.. | 第8页:我们的测试:功耗爆降,四核=双核 |
| 第9页:神奇!超级45,了解你身边的45 |