本文最初于 2016年7月27日发布于笔者的公众号。
本文是
王川: 摩尔定律还能走多远? (五) – 这都是为了钱
的续篇.
(1)
2012年七月,半导体制造业发生了一件大事: 三家芯片生产的巨头,英特尔/台积电/三星, 集体为半导体光刻业的巨头, 荷兰公司艾司摩尔 (ASML), 承诺支付累计十三亿欧元的研发费用,帮其承担部分新技术开发的风险.
三家公司同时还以每股接近 40 欧元的价格注资购买了 ASML 大约23%的股票. ( 四年后的2016年七月, ASML 股价在 96 欧元左右.)
ASML 获得的资金, 主要用于加快 450 毫米晶圆片相关的器材和下一代极紫外线光刻技术 (EUV)的研发.
光刻工艺,占芯片生产成本的接近一半. 为了保证半导体产业链的技术发展,继续按照摩尔定律的路线图前进,芯片巨头们赤膊上阵,直接注巨资给器材商加速研发,这是第一次.
这同时也应了中国的一句老话: 有钱能使鬼推摩(尔).
只要终极市场有需求,只要有源源不断的资金注入,所有工程挑战,都是最终可以被克服的.
(2)
半导体行业未来的发展,还会吸引多少钱来推摩(尔定律)呢?
咨询公司普华永道2015年的一份报告预测,全球半导体行业的产值将从 2014年的三千三百亿美元增加到2019年的四千三百亿美元. 但是他们当时的模型,主要是假设半导体在工业生产,汽车/电车和物联网上的需求增长,而没有考虑到在人工智能应用上的爆发.
摩尔定律的进一步发展, 对于人工智能意味着什么?
如果你还记得我的这篇文章
王川: 深度学习有多深? (十七) — 衡量GPU的计算能力
里面提到, 英伟达的 DGX-1 的超算系统,在训练 alexnet 的包含六千万个自由参数的神经网络模型时,只需两个小时.
粗略地推算,对于一个包含一百亿个自由参数的神经网络模型的训练,DGX-1 需要耗费三百多个小时, 接近两周的时间. 而根据丹麦学者 Bente Pakkenberg 2003 年的论文的估计,人脑皮层等价于一个有着一百五十万亿个自由参数的神经网络.要想模拟和人脑一样复杂度的模型,需要的计算能力要在 DGX-1 的一万五千倍左右.
IBM 为首的团队,正在研发下一代的超级计算机 Summit,预计 2018年初面世.这个超算系统预计计算速度将达到 二十万 FLOPS, 这相当于DGX-1 系统的 43 FLOPS 速度的五千倍.
这个计算能力,应当可以部分模拟和人脑一样复杂的神经网络系统,并且通过主动的自我学习获得和人脑一样复杂的抽象思考能力, 而不只是简单的听说读写.
IBM Summit 的成本大约三亿两千万美元, 假设其使用寿命长达十年,那么每个小时计算成本高达三千美元.考虑到该系统耗电约 15 兆瓦时,假设一度电电费是 5 美分,一个小时电费就要 750 美元.
一个小时成本接近四千美元,听上去很贵.但是如果把这个数字横向比较:
美国前总统克林顿一小时演讲费: 二十五万美元
克林顿的女儿 Chelsea Clinton, 在密苏里大学的一小时演讲费: 六万五千美元
美国五百强上市公司 ceo 平均薪酬一年一千三百万美元,按照一年两千小时工作时间, 折合时薪大约六千五百美元.
硅谷普通工程师,假设基本薪水二十万美元, 加各类健康保险和股票的福利对于雇主的成本约三十万美元,折合时薪约一百五十美元.
这些成功人士面对的竞争, 将是一个:
孜孜不倦可以24小时连续学习工作/不用吃饭喝茶上厕所的工作狂.
上知天文/下知地理/会多国语言/思维缜密/反应迅速/高度理性/见人说人话见鬼说鬼话的智者.
不会罢工/请假/跳槽/内耗/出卖领导, 并且每年根据摩尔定律自觉降薪30%的模范雇员.
亚马逊的创始人贝索斯曾经说过, “你的利润率就是我的机会” (Your magin is my opportunity). 只要世界上还有人靠出卖智力获得高额利润,就会有资金推动人工智能及其背后的芯片技术的研发,与其正面竞争.
(3)
如果你还记得这篇文章
王川: 摩尔定律还能走多远? (二)
以史为鉴,正是因为大量资金的支持,才使得英特尔找到”高介电常数”的材料,在45纳米芯片生产时,解决了栅极漏电的问题.
同样是因为大量资金的投入,FinFET 的技术在22 纳米的芯片生产中实现,极大缓解了短沟道效应下的漏电问题.
当栅长在2020年以后缩小到 5纳米时,一种可能, 是出现目前大家没有想到的工程解决方案, 跳过测不准原理的限制.
另外一种可能,就是当一个维度走到极限时,从另外一个维度提升产品性能, 达到等价的效果.
就像这两篇文章中提到:
王川: 摩尔定律还能走多远? (三) – CPU 的内存瓶颈
王川: 摩尔定律还能走多远? (四) — 并行计算的威力
CPU 时钟频率走到尽头,就在内存架构的设计上努力.
单项计算任务的速度无法提高,就通过提升网络交换器和内存传输的带宽,加大系统的并行度.
硬件架构的优化达到极致,就在软件设计上下功夫.
平面太挤了, 就转向三维.
图片
(上图为 AMD 和三星联和开发的新一代三维/高带宽/低能耗的内存)
(4)
如果从更长远的历史视角看, 按照未来学家 Ray Kurzweil 的话说, 摩尔定律只是几百年来, 人类的计算技术, 从算盘, 到手摇机械计算机,到继电器, 到真空管, 晶体管, 进而到大规模集成电路的演变, 在过去五十年的自然体现.
经济规律在计算技术地发展中, 自然地选择了脱颖而出的大规模集成电路.但如果硅基的集成电路在未来某个时间点,计算能力走到极限,同样的经济规律会自然地选择,在那个时候涌现出来的, 最经济的技术方案.
这个未来方案会是什么? 会是砷化镓为材料的集成电路? 会是量子计算机? 或者以DNA分子为基础的新的计算架构?摩尔定律还能走多远?
现在无法预知.但是如果你相信,计算通讯能力在人类经济和文明的发展中将发挥越来越大的作用,那么更多的资金将会继续推动计算技术的研发,那么摩尔定律在未来还会走很远,