集成显卡是一种内置于处理器的GPU(图形处理器)。集成显卡处理图形/视频时并不需要独立的存储空间,而是与CPU(中央处理器)共享系统内存。
早期集成显卡是将显示芯片及相关电路集成在主板上,是“处理器+南桥+北桥(图形核心+内存控制+显示输出)”三芯片集成的模式。通常情况下,集成显卡多指代核芯显卡,核芯显卡将图形核心整合在处理器当中,精简为“处理器(处理核心+图形核心+内存控制)+主板芯片(显示输出)”的双芯片模式,进一步加强了图形处理的效率,有效降低了核心组件的整体功耗。
截至2024年,市场上的集成显卡厂商主要是
英特尔(英特尔)和
AMD两大公司。集成GPU适用于典型的PC程序,如Web浏览、社交媒体等。以及如电子表格、编辑文档和
项目管理软件等资源
轻量级工作。集成显卡常用于看重尺寸和
能源效率的设备,例如
笔记本电脑、
平板电脑、智能手机和一些
台式机等。
发展历程
主板集成显卡
早在1995年以前就有集成的图形控制器问世,矽统
sis6204是第一颗针对Intel(英特尔)处理器、应用于PC的集成图形控制器,与北桥芯片集成在主板上,它为后来的图形处理器集成在主板上提供了理论基础。矽统的SiS6204最高
分辨率支持到1280x1024 1680万色的集成VGA,以及带
视频解码器接口(Philips SAA 7110)的64位bitBLT引擎,支持色彩空间转换、视频缩放、色键视频覆盖等。
1998年,
英特尔(英特尔)公司的i740
独立显卡问世,但是却经历了市场失败,Intel(英特尔)便将目光转向集成显卡市场,于1999年发布了自己的首颗位于北桥芯片内部的集显,推出了i810
芯片组,其中的i752集显是i740独显的技术迭代。1999年
SGI(硅图,Silicon Graphics Inc)自己设计的Cobalt集显,采用UAM同一
内存架构,让GPU与CPU能够共享系统内存。
2002年5年,
英特尔(英特尔)进一步推出了集成“Extreme Graphics”的i845G/E芯片组,i845G中核心频率为200MHz,在i845GE中核心频率为266MHz,效能接近
英伟达(英伟达)的Geforece2 MX 200
独立显卡,Extreme Graphics集显支持DVMT技术,可从系统中动态调用内存,从最开始能调用8MB一直XP中可调用48MB。后来Intel(英特尔)对Extreme Graphics进行改良,发布了Extreme GraphicsⅡ,集成在i865G
芯片组中,核心频率为266MHz,并且支持DX8api,其中i865G芯片组开始引入DR400
内存,并支持双通道内存技术,有效解决了
带宽不足的问题,Extreme GraphicsⅡ集显的效能也达到了GF2 MX 400独显的水准。
英特尔(英特尔) ExtremeⅡ图形核心采用一条像素管线,含有两个纹理贴图单元,支持双线性、三线性和各向异性纹理过滤,每次最多渲染四个纹理,采用动态内存分享技术。同时EGⅡ在
显卡内存的划分方面不同于以往的图形核心。可以从
主存储器中划分一部分作为独立显存,不是以往的系统自动划分,这样更有利于显存的应用,最大可以共享64MB的内存。
2004年6月21日,随着Sonoma迅驰的推出,英特尔摒弃了以前的Extreme Graphics
图形处理器的命名方式,把915GM集成的显卡芯片称为Graphics Media Accelerator,也就是第一代GMA(Graphics Media Accelerator)集显,简称GMA900。 GMA900在
英特尔(英特尔)910GL 高速芯片组家族和移动式Intel(英特尔)915高速芯片组家族得到应用。GMA900集成显卡内建4条渲染管线,工作频率为333MHz,可以支持DirectX 9和OpenGL 1.4以及PS2.0、VS2.0。GMA900帮助Intel(英特尔)在2005年第一季度图形芯片市场占据了43.1%的份额。之后的GMA950拥有400MHz的核心频率,4条渲染管线,像素填充率为1.6 GP/s。它具有高品质的3D设置,Intel(英特尔)集成
图形处理器是没有顶点处理单元的,这部分需要由CPU来完成。GMA950提供了高品质的
材质贴图单元,它提供了VLD/iDCT允许双倍Intel(英特尔)高精度MPEG回放。相较于上一代GMA900它的性能要强6%~10%左右。
而Intel(英特尔) GMA X3000的显示核心为DX9兼容,支持Pixel Shader 3.0和Vertex Shader 3.0,并且以硬件方式支持Vertex Shader 3.0,而不是像GMA900和950那样是软件模拟方式。X3000图型核心最大的改进就是终于采用了硬件T\u0026L引擎,而非之前的软件T\u0026L引擎,使得在游戏的应用方面更加广泛。同时还支持HDR,核心频率为667MHz。在输出方面,X3000图型核心支持VGA输出,可以通过ADD2附加卡实现HDMI、DVI、UDI、复合和S-Video输出。其中HDCP是否支持将由主板厂商或者ADD2附加卡厂商决定。
英特尔(英特尔) GMA X3000图型核心最大支持2048x1536
分辨率,其中包括
720p/
1080i/1080p。GMA X3100性能上与GMA X3000相同,但是只支持到DirectX9.0c
CPU集成显卡
2006年
AMD收购ATI之后,提出制造“真正的集成GPU”概念,命名为“Fusion”的计划,试图将GPU与CPU集成到同一块芯片上,但以当时的技术基础并未即刻实现。到2011年初,AMD推出了Fusion APU。AMD的APU基于Bobcat架构将CPU和GPU内核完全融为一体的单芯片方案,让内核之间的数据交换效率更高。Fusion APU主要由x86架构的CPU核心、DirectX 11 SIMD引擎阵列、UVD高清视频引擎、数据
总线和DDR3
内存控制器等几个模块封装在一个核心内构成。
而在2010年
英特尔(英特尔)取消主要承载GPU芯片的主板
北桥,将32nm工艺的CPU die与45nm工艺的GPU die放到了同一封装内,开创了融合处理器的先河。CPU首度集成了GPU芯片,采用了Westmere架构。CPU与GPU融合之后,英特尔为整合在处理器中的GPU芯片取名为
核芯显卡。推出的HD Graphics核显有23个EU(执行单元),最高核心频率900MHz,43.2GFLOPS算力,能够以最高40fps速率解码H.264 1080p视频。HD Graphics核显还支持DirectX 10.0/OpenGL 2.1、深入增强硬件顶点处理、支持分级Z和快速Z清空、针对Windows 7系统优化、共享内存最多1.7GB、支持动态频率调整(仅限移动版)。Intel HD Graphics核显的集成核心在处理器中通过FDI通道发挥作用,以适配专为整合了GPU核心的处理器设计的HM55、HM57主板,而其中的Display单元被整合在PCH(也就是新“南桥”芯片)中,GPU核心则经过这一个特设的通道与PCH中的Display单元链接,再由Display单元将图像输出到外接的显示设备上。
2011年,Sandy Bridge架构处理器问世,采用第二代HD Graphics核显。HD Graphics 2000/3000分别拥有6个、12个EU可编程着色器,核心频率提升至850MHz,并可根据负载分别自动提升至1100MHz、1350MHz。除了核显更进了一步之外,GPU和CPU也真正放到了同一颗die上。
核芯显卡自2010年后在近十年的时间内不断提升,Intel(英特尔)在这过程中接连推出了性能媲美入门级
独立显卡的Iris、Iris Plus锐炬核显。
工作原理
集成显卡的工作原理是执行生成用于显示的渲染图像所需的专用工作负载。工作内容包括视频、3D图形以及操作系统的桌面加载等,所有这些都在集成显卡内进行处理,然后发送到
计算机的显示器。
使用者与PC交互时软件会生成需要直观显示的数据,例如电子表格更新或视频游戏中移动的角色。数据中包括绘制形状、颜色、纹理和其他图形元素的指令,CPU收集这些指令并将其发送到集成显卡中进行数据处理。集成显卡接收数据后先进行几何处理,其中CPU发送的几何形状、位置和其他属性在虚拟3D空间中进行处理,之后集成
显卡进入渲染阶段。然后GPU继续对场景中的对象进行纹理处理,在渲染和纹理计算完成后,GPU将执行光栅化的过程,将3D场景转换为2D 图像,最终结果是一个可以输出到显示器的2D帧。最后一步将生成的帧发送到连接的显示器,集成显卡生成具有每个像素的颜色和强度值的视频信号,并通过视频
电缆将其发送到连接的显示器。显示器使用此信息相应地照亮其像素,从而在屏幕上产生最终的图像。
GPU(
图形处理器)所采用的核心技术有硬件
坐标转换与光源、立体环境
材质贴图和顶点混合、纹理压缩和凹凸
映射贴图、双重纹理四像素256位渲染引擎等。
优点
集成显卡处理器具有多种优势。相较于
独立显卡,集成显卡在空间、成本和能效方面有更大的优势。它们能够为常见任务(例如网页浏览、4K 电影流式传输和休闲游戏)处理显卡相关数据和指令。集成显卡的标准化,使它在
兼容性方面也有较好的表现。而主板上带有完全集成GPU的CPU可实现更薄更轻的系统,降低功耗并降低系统成本。
降低成本
将GPU集成到CPU的硅空间中不会增加太多成本,同时可以降低系统其他部分的成本。因此,使用集成GPU的系统比使用独立显卡的系统便宜。
节省空间
在
笔记本电脑领域,通过将GPU集成到CPU封装中,可以缩小笔记本电脑体积,且不再需要额外的硬件支持来提供冷却、供电和连接完全独立的
芯片封装。
降低功耗
现阶段的集成显卡均内置于处理器中,因此降低了功耗,产生的热量更少,从而延长了电池的续航时间。且管理单个集成芯片的功耗比平衡两个独立芯片的需求要容易得多,由于GPU和CPU紧密集成,GPU也适合于CPU的TDP(热设计功率)。
提升效能
核芯显卡将图形核心与处理核心整合在同一块基板上,构成一颗完整的处理器。这种智能处理器架构设计上的整合缩减了处理核心、图形核心、
内存及
内存控制器间的数据传输时间,有效提升处理效能并大幅降低
芯片组整体功耗,缩小了核心组件的尺寸,为笔记本、
一体机等产品的设计提供了更大选择空间。
缺点
由于集成显卡的空间有限、没有独立的
显卡内存,如果显卡运行需要占用大量内存空间,那么整个系统运行会受限,此外系统内存的频率通常比
独立显卡的显存低很多。且集成显卡不能对其进行硬件升级。而配置核芯显卡的CPU的价格通常比较高,在运行大型游戏时性能不如中高端独立显卡强,需要降低特效甚至关掉特效。
应用领域
集成GPU应用于嵌入式系统、智能手机、个人电脑和
工作站。同时在超级计算和高性能环境中也发挥着重要作用。因此集成GPU在应用方面可以细分为游戏、
云计算、工作站、
人工智能和无人驾驶车辆;以工业垂直领域划分,它可以细分为汽车,媒体和娱乐,航空航天和国防,建筑和消费电子产品。集成显卡目前在
笔记本电脑市场方面应用于
超薄笔记本,用于降低笔记本功耗和压缩笔记本尺寸。
GPU运用领域
集成显卡核心GPU在早期主要用于加速实时3D图形应用程序,例如游戏。如今的GPU可编程性更高,相较于传统图形渲染更适用于各种应用程序,图形技术被也更广泛地应用于其它
计算机领域。
GPU在游戏中能够以2D和3D方式渲染图形,但同时适用于运行分析、
深度学习和
机器学习算法。GPU在运行某些计算时比传统CPU的运算速度快10倍至100倍。当今的许多深度学习技术都依赖于与CPU配合使用的GPU,利用了GPU在图形处理工作负载中提供的加速计算能力,其依赖于GPU运算时高度并行的特性(例如图像识别)。
市场销售
分析机构的报告指出,在2010年全球销售的笔记本电脑中,有39%使用了集成显卡。而至2019年,在集成显卡领域
英特尔(英特尔)占据了主导地位,通过
核芯显卡Intel(英特尔)在显卡市场占据了70%的市场份额。但是随着
AMD在集成GPU的APU逐渐发展,以及集成显卡总体市场的下滑,Intel(英特尔)在集成显卡市场份额上也逐渐呈下滑趋势。在包括集成显卡和
独立显卡等各种形式的整体GPU市场,2021 年第一季度,Intel(英特尔)以 68% 的市场占有率排名第一,AMD 排名第二,占有率为17%,第三为
英伟达,占有率为15%。
至2022年,Intel(英特尔)依靠PC中集成显卡的优势在显卡市场上的市占率仍为最高,2022年第四季Intel(英特尔)虽下降了1.1%,但市占率仍高达约71%, AMD第四季度增加了0.4%至12%,NVIDIA(英伟达)则增加了0.68%至17%。截至2022年第四季度,Intel(英特尔)依旧是全球PC GPU市场的最大供应商。
发展趋势
2023年的
英特尔在研究更有效的路径跟踪渲染技术,使集成GPU实时运行路径跟踪。通过
计算机模拟捕捉光线的反射的图形技术GGX、更有效的3D环境中闪光的表面的方法以及马尔可夫链
混合模型让渲染技术实现更高效的实时照明输出。这三项技术能够改进路径跟踪渲染的核心原理,包括光线跟踪、阴影和采样,提高集成GPU的实时路径跟踪性能。
集成显卡核心GPU也已经发展成为更通用的处理器,与其他计算机组件并行工作以处理越来越多的应用程序,特别是
人工智能(AI)和
机器学习(ML)任务。
而GPU性能的三大决定因素为主频、
微架构、API(Application Programming Interface)应用程序接口。其中主频由GPU的制程决定。先进的制程能够提高
晶体管密度,降低晶体管成本,保持GPU die体积不变的同时提高其性能。以及先进的制程能够提升处理器的效能,在性能不变的情况下,减少发热或在保持发热不变的情况下,提升主频来提高性能。
GPU的微架构升级趋势一是通过增加晶体管数量、增加运算单元数,包括其中的流处理器单元、纹理单元、光栅单元等。二是提高GPU的AI运算能力,例如,
英伟达的图灵架构相较于帕斯卡架构新增加了光追单元和
张量单元,分别处理实时
光线追踪和人工智能运算。