本文最初于 2016年7月18号发布于笔者的公众号。
本文是 王川: 摩尔定律还能走多远? (四) — 并行计算的威力
的续篇.
(1)
对半导体芯片生产过程不熟悉的人, 常会问这样一个问题:
为什么芯片的密度要两年才翻一番? 为什么不可以更快一点, 两年翻两番, 三番? 为什么我们不能够一下子从 100 纳米跨越到 10 纳米? 而要漫长的十几年才能完成这个过程?
对这个问题的简单回答是: 如果一个人要吃七个馒头才能饱,为什么不可以先直接去吃第七个馒头?
(2)
摩尔定律从另外一个角度看,实际上是个生产成本的经济问题.
这都是为了钱.
(下图来自电影”华尔街”: “小屁孩, 这都是为了钱.其它是闲扯”)
图片
芯片密度的增加,本质上是降低单个晶体管的生产成本和功耗,使终端产品在市场上更有竞争力.
只有终极市场的利益驱动,才会推动厂家投入大量资金, 到新的生产技术里面.
这个资金规模需要多大呢?
1980年,一个普通晶圆厂的造价大约一亿美元.
2010开工的台积电的半导体晶圆厂, Fab 15, 总共造价累计约九十五亿美元.
有专家估算,到2020年,建造一个最新的晶圆厂,成本要增加到一百五十亿美元以上.
芯片生产厂房的建立为什么如此昂贵?
芯片的生产工艺,随着技术更新换代,越发复杂.其生产过程包括上千个步骤, 水电消耗极大. 大型晶圆厂占地面积一般至少十几万平方米, 一天用水接近两万吨, 耗电量超过三十兆瓦.
(3)
生产过程中最昂贵的部分,是一个叫做”学习曲线”的东西.
厂房内的每个机器都可能有几百个控制旋钮,每个旋钮都需要设定在正确的位置.最关键的一小部分设置,需要不断的长时间的人工尝试, 获得反馈, 再优化. 这需要一个高度专业化训练的科学家和工程师团队,长时间奋战调试才能完成.
晶圆厂的生产需要有足够的产能规模来调试,调试需要时间,时间就是金钱.
晶圆厂生产的芯片,有个概念叫做良率 (Yield),就是质量合格的芯片占一个晶圆上芯片总数的比例.生产调试的过程,就是提高良率的过程,良率越高,单位芯片的成本就越低.
而最终芯片的单位成本, 和芯片的累计产量的关系, 就是所谓的”学习曲线”.如下图.
图片
学习曲线通常用这个数学公式表示:
Y = a X^b
这里 Y 是累积单位产品的平均生产成本, a 是第一批产品的生产成本, X 是累计生产产品的总数, b 是负数,其绝对值越大,代表着学习曲线的进步速度越快.
“学习曲线”作为工业生产中的概念, 在上个世纪三十年代,由波音的工程师 T. P. Wright 最初提出. 他发现,飞机制造费用,随着生产数量增加,不断下降.
比如第一架新飞机成本是一亿美元,第二架就可能降到八千万,第四架降到六千四百万,单个飞机的制造成本随着累计生产数量的每次翻番而下降20%.
为什么生产成本会不断下降? 原因包括: 1.生产流程和零部件的标准化. 2. 工人效率提高. 3. 错误减少. 4. 材料浪费减少等等.
这个规律, 在许多其它传统制造业的生产中,也有体现.
在半导体生产这个游戏中, 胜者属于累计生产规模最大的厂家,因为”学习曲线”决定了:
最低的成本来自最大的累计生产规模.
(4)
从一个晶圆厂的晶片生产成本的下降曲线,到过去五十年摩尔定律的进步曲线,实际上可以看成是”学习曲线”规律在芯片行业的自然体现.
支持”学习曲线”和摩尔定律前进的最主要的动力,是人们对于芯片的不断增长的海量需求.
更大的内存芯片存储文件/照片/录像/歌曲, 更快的芯片传输更多的数据,能耗更小的芯片增加电池的待机时间.
这些需求,和它后面的实实在在的购买力,才能推动更多资金投入半导体行业的研发.
全世界半导体芯片的销售额,从1990年的五百五十亿美元, 增长到2015年的三千多亿美元.
建设一个晶圆厂的成本,从八十年代初的一亿美元,到九十年代中期的十亿美元,到2020年预计的一百五十亿美元.芯片市场有多大,就可支撑相应规模的晶圆厂.
而”学习曲线”促成的单个晶体管生产成本/价格的下降,又催生新的更多的应用和需求,进一步扩大半导体的市场,吸引更多的资金投入研发,形成一个良性循环.
图片
但这些进步的完成,需要在现有半导体产业生态系统内, 一个个馒头地吃. 指望另辟蹊径, 直接吃第七个馒头就饱了,是不符合客观规律的.
从经济学的角度看,只要这个良性循环继续不受干扰地运作,就会自然有大量资金的持续投入,摩尔定律在工程上遇到的各种挑战,终将被克服.