尼克‧斯塔姆强调,其实不只是构架与制程的更新,NVIDIA在Pascal上还投注了高度的工艺技术心血,让该构架达到前所未有的效益。他透露,原本Pascal构架芯片在开发初期的增幅时脉只能达到1325MHz,但是在整体电路布局最佳化的努力之下,最后达到1733MHz,提升了30%之多。因此工艺技术的投入,是不亚于新构架与新制程的关键之一。
GTX 1080采用代号GP104的图型处理器核心,由72亿晶体管构成,搭载2560个单精度浮点数CUDA核心,提供约9TFLOPS的单精度浮点数运算性能。由于是针对3D图形处理应用,因此倍精度浮点数运算性能只有单精度的1/32,比例比高效能运算用途的Tesla P100采用的GP100核心低很多(1/3),不过GP100的晶体管高达153亿个,两者的规模相差很大。
在Preemption(抢占式多工)的部分,Pascal首度支持像素(Pixel)单位的多工切换,GPU可以在绘制多边形内部单一像素时暂停此一工作切换到其他工作,之后再切回来继续处理。DX12数值计算则能以线程单位切换,CUDA运算则是能以更细微的指令为单位切换。切换的延迟低于100微秒(100µs,即万分之一秒)。藉由高速多工切换的特性,Pascal在VR应用下能更快速在图形处理与非同步时间调整(Asynchronous Timewarp)两个工作之间切换,减少性能闲置。