当AI芯片设计团队因封装技术限制无法集成更多HBM内存,或者因互连密度不足导致计算性能遇到瓶颈时,是否感到先进制程带来的优势被封装环节拖累?这种"制程先进、封装滞后"的矛盾,正是高性能芯片开发中*棘手的挑战之一。
台积电的3DFabric先进封装技术平台,特别是CoWoS(Chip-on-Wafer-on-Substrate)系列技术,正在彻底改变这一局面。从支持3.3倍光罩尺寸的CoWoS-S到预计2027年实现9.5倍光罩尺寸的CoWoS-L,封装能力正在以超越摩尔定律的速度发展,为AI和HPC应用提供了前所未有的系统级集成解决方案。
CoWoS技术本质上解决了多芯片集成的物理限制问题。传统的单芯片封装方式无法满足现代AI加速器对高带宽内存(HBM)和计算核心紧密集成的需求。CoWoS通过硅中介层或有机中介层,实现了逻辑芯片、HBM存储器及I/O元件的三维集成,成为NVIDIA GPU及各种AI加速器的核心封装方案。
性能需求驱动是CoWoS发展的首要动力。AI训练和推理任务需要极大的内存带宽来支持大规模参数模型,而CoWoS封装能够将HBM内存与计算核心的距离缩短到毫米级别,显著减少了信号延迟和功耗。目前CoWoS-S已经支持3.3倍光罩尺寸的硅中介层,能够集成多颗HBM与逻辑芯片。
经济效益考量同样关键。虽然CoWoS封装增加了制造成本,但通过提高集成度和性能,降低了整体系统成本。对于需要大量HBM的AI芯片,CoWoS提供了**的性能密度和成本平衡点。
技术扩展性也是重要因素。CoWoS技术具有良好的扩展性,能够适应不同尺寸和复杂度的芯片组合,从移动设备到数据中心服务器都能找到合适的CoWoS解决方案。
CoWoS-S:硅中介层方案
CoWoS-S基于硅中介层技术,提供*高的互连密度和性能:
当前能力:支持3.3倍光罩尺寸,集成8个HBM堆栈
技术特点:采用硅通孔(TSV)技术实现高密度垂直互连
应用场景:主要用于NVIDIA、AMD等高端AI加速器
发展路线:向更大尺寸和更高集成度发展,预计2027年达到9.5倍光罩尺寸
CoWoS-R:有机中介层方案
CoWoS-R采用RDL中介层,平衡性能与成本:
材料优势:使用聚合物和铜布线,具有更好的机械柔性
尺寸优势:支持比硅中介层更大的interposer尺寸
成本优势:制造成本低于CoWoS-S,适合对成本敏感的应用
性能特点:互连密度和带宽低于CoWoS-S,但仍显著优于传统封装
CoWoS-L:混合方案
CoWoS-L结合了CoWoS-S和CoWoS-R的技术优点:
技术架构:使用RDL中介层与局部硅互连(LSI)
性能平衡:局部硅互连保留高密度布线优势,RDL提供尺寸弹性和成本控制
功能扩展:集成了LSI、嵌入式DTC(深沟槽电容)和IVR(集成电压调节器)等功能
发展计划:2026年推出5.5倍光罩尺寸,2027年达到9.5倍光罩尺寸
为了更清晰了解各CoWoS技术的特点,以下是关键参数对比:
| 参数 | CoWoS-S | CoWoS-R | CoWoS-L |
|---|---|---|---|
| 中介层材料 | 硅 | 有机材料 | 混合材料 |
| 光罩尺寸 | 3.3倍(当前)→9.5倍(2027) | 更大尺寸支持 | 5.5倍(2026)→9.5倍(2027) |
| 互连密度 | *高 | 中等 | 高 |
| 成本水平 | 高 | 低 | 中等 |
| HBM支持 | 8个(当前)→12+个(2027) | 适中 | 12+个(2027) |
| 特殊功能 | 基础功能 | 基础功能 | LSI、eDTC、IVR集成 |
这一对比显示,不同CoWoS变种各有优势,芯片设计团队需要根据具体的性能、成本和尺寸要求选择合适的封装方案。
**步:芯片设计与规划
在芯片设计阶段就需要考虑封装要求:
芯片布局:优化芯片布局以适应CoWoS封装的结构特点
接口设计:设计适合高密度互连的芯片接口
热分析:提前进行热分析,确保封装后的散热可行性
信号完整性:考虑封装对信号完整性的影响,提前进行仿真
第二步:中介层设计与制造
根据芯片需求设计和制造中介层:
材料选择:根据性能要求选择硅、有机或混合材料
布线设计:设计高密度互连布线,确保信号传输质量
TSV制作:对于CoWoS-S,需要制作高质量的硅通孔
测试验证:对中介层进行充分的测试和验证
第三步:芯片与中介层集成
将芯片集成到中介层上:
**定位:确保芯片在中介层上的**定位
微凸块连接:使用微凸块技术实现芯片与中介层的连接
质量控制:严格控制连接过程的质量,避免缺陷产生
初步测试:完成集成后进行初步功能测试
第四步:基板集成与封装
将集成好的模块封装到基板上:
基板选择:选择适合的基板材料和结构
*终集成:将中介层模块集成到基板上
密封保护:进行适当的密封和保护处理
*终测试:完成所有测试,确保封装质量
第五步:系统级测试与验证
进行全面的系统级测试:
性能测试:测试封装后的性能是否达到设计要求
可靠性测试:进行温度循环、机械应力等可靠性测试
兼容性测试:测试与其它系统组件的兼容性
长期稳定性:评估长期使用的稳定性和可靠性
NVIDIA GPU系列
NVIDIA的AI加速器广泛采用CoWoS技术:
H100系列:采用CoWoS-S封装,集成多个HBM3内存堆栈
B100系列:预计采用更先进的CoWoS-L技术,支持更多HBM4堆栈
性能提升:通过CoWoS实现的内存带宽提升直接转化为AI训练性能提升
AMD Instinct系列
AMD的MI300系列AI加速器采用CoWoS技术:
芯片组合:集成CPU、GPU和HBM内存于单一封装
技术组合:结合CoWoS和3D Fabric平台多种技术
性能优化:通过高密度互连优化芯片间通信性能
自定义AI加速器
许多云服务厂商开发自定义AI加速器:
Google TPU:采用类似CoWoS的先进封装技术
AWS Inferentia:使用CoWoS技术提高集成度和性能
Microsoft Maia:为AI工作负载优化的CoWoS封装方案
边缘AI设备
CoWoS技术也开始向边缘设备扩展:
尺寸优化:开发更小尺寸的CoWoS变种适合移动设备
能效提升:通过集成降低功耗,适合电池供电设备
成本优化:通过技术创新降低CoWoS成本,扩大应用范围
热管理挑战
高密度集成带来严重的散热问题:
解决方案:采用新型热界面材料(TIM),如Metal TIM材料将封装热阻降低至Gel TIM材料的3/20
创新设计:设计分层散热结构,优化热传导路径
液冷集成:开发直接液冷解决方案,提高散热效率
制造良率提升
大尺寸封装对制造良率提出挑战:
工艺优化:持续优化工艺参数,提高各步骤的良率
检测技术:采用先进检测技术早期发现和排除缺陷
冗余设计:在关键区域设计冗余结构,提高整体良率
信号完整性
高速信号传输面临完整性挑战:
仿真优化:通过精细仿真优化信号传输路径
材料创新:开发低损耗介质材料,减少信号衰减
屏蔽技术:采用有效屏蔽措施减少信号间干扰
成本控制
先进封装成本较高影响普及:
规模化:通过规模化生产降低单位成本
设计优化:优化设计方案,减少不必要的功能
材料替代:开发成本更低的替代材料
尺寸继续扩大
CoWoS封装尺寸将继续扩大:
短期目标:2027年达到9.5倍光罩尺寸
长期愿景:向晶圆级系统集成(SoW)发展,实现40倍光罩尺寸
技术挑战:需要解决大尺寸带来的机械应力和热应力问题
功能集成增加
从单纯互连向功能集成发展:
IVR集成:集成电压调节器,提高电源效率
光子集成:集成硅光子组件,实现光互连
传感器集成:集成温度、压力等传感器,实现智能监控
新材料应用
新材料的应用将改善性能:
低k介质:开发更低介电常数的介质材料,减少信号延迟
高k介质:用于电容集成,提高集成密度
二维材料:探索石墨烯等二维材料在互连中的应用
异构集成深化
支持更复杂的异构集成:
不同制程芯片:支持不同工艺节点的芯片集成
不同功能芯片:集成数字、模拟、射频等不同功能芯片
不同材料芯片:支持硅、化合物半导体等不同材料芯片集成
**数据视角:根据行业数据,CoWoS产能已从2023年的每月1.2万片提升至2024年底的每月3.5万至4万片,并计划在2025年进一步翻倍。尽管如此,面对NVIDIA H200/B100、AMD MI300等高端AI加速器的巨大需求,CoWoS产能依然吃紧,成为AI芯片出货的关键瓶颈之一。那些能够早期获得CoWoS产能的AI芯片企业,将在市场竞争中获得显著的时间优势和技术优势。到2027年,随着9.5倍光罩尺寸CoWoS-L的量产,单个封装将能够集成12个以上的HBM堆叠,计算能力提升超过7倍,这将进一步推动AI训练和推理性能的飞跃提升。
本站为注册用户提供信息存储空间服务,非“爱美糖”编辑上传提供的文章/文字均是注册用户自主发布上传,不代表本站观点,版权归原作者所有,如有侵权、虚假信息、错误信息或任何问题,请及时联系我们,我们将在第一时间删除或更正。