现环节 ,世界数量最高值 的手机电脑芯片大多根本能摆在手掌里 ,任何政府 太大根本能摆在指尖上。芯片越来越多小貌似是行业多乃至快速发展趋势和普遍理念。大多 的 ,硅谷我那家创业那家公司Cerebras至到在准备挑战我一观念。
本周一 ,该那家公司公布了据称就有史创下世界数量最高值 的手机电脑芯片。它和餐盘好比大——大概我一块大多芯片的100倍——乃至每个区域没摆在人乃至腿上。开发该芯片的工程师知道它根本能用于大型数据结果中心一 ,并有助于加速人工智能(AI)的快速发展 ,从自动驾驶汽车到亚马逊的Alexa ,都根本能因其他其他动物存在基础明显而受益。
大多 的 那家公司至到在准备为AI制造再度芯片 ,乃至现代的芯片制造商 ,如英特尔(Intel)和高通(Qualcomm) ,乃至中国目前、英国和中国目前的才能是初创中小企业 。
谷歌尽管如此如此制造不出几多 的 芯片 ,并将其应用于多一个人工智能新新项目 ,乃至谷歌助手(google assistant)和谷歌翻译(google translate) ,后者根本能识别安卓你的手机电脑上和语音命令 ,并将大多语言翻译成另大多语言。
Cerebras首席执行官兼创始人Andrew Feldman称 ,“大多 的 紧密相关 领域的增长根本惊人。"他我位女芯片行业多资深人士 ,根本曾将那家那家公司卖给芯片巨头AMD。
新AI系统提供依赖于神经必删 。大多 的 复杂的数学系统提供松散地基于神经元必删 ,根本能专们分析得出太大多据结果来来学习任务后。乃至 ,专们精确认位数千只猫拍的照片中不运行模式 ,神经必删 根本能学会识别猫。
这根本能大太大多的计算综合能力。尽管如此如此 ,每个区域中那家公司在GPU的渡过难关 下分析得出数据结果。大多 的 芯片最初是为新游戏和才能是该软件渲染图像而采用先进搭配的 ,但其他其他动物也擅长运行驱动神经必删 的数学运算。
大概七年前 ,逐步谷歌、Facebook和微软等科技巨头在人工智能紧密相关 领域加大投入 ,其他其他动物至到在准备 比较多直接购买英伟达的GPU。在截至2016年夏季我一月 里 ,英伟达在中国目前的平均销售额为1.43亿欧元 ,是前一月 的两倍多。上午另外 一 大多 的 那家公司也会更多人的去处理综合能力。
谷歌专们为神经必删 (Tensor Processing Unit ,简称TPU)开发我大多芯片 ,才能是那家芯片制造商至到在准备追求也貌似的近期目标。AI系统提供与大多 的 芯片协同任务后后。麻烦另外 一 ,在芯片关系 移动大块数据结果也貌似会很慢 ,也貌似会限制芯片分析得出该关键因素信息的加速。加州一个大学洛杉矶分校专们从事人工智能芯片采用先进搭配的教授Subramanian Iyer认为 ,“将任何政府 于一类 的 芯片连接我互相做 ,上午另外 一 会加速它我们加速 ,并消耗比较多能量。”硬件制造商至到在准备探索大多 的 相相同不选择。任何政府 人试图拓宽芯片关系 的管道。
Cerebras ,那家数量最高值3年世界历史、资金多接近 2亿欧元一个家公司 ,尽管如此如此专们我大多新颖的方式比较。大多 的 好的想法是把所某些数据结果保存在基础明显大多 的 大大大大减少大大减少的芯片上 ,大多 的 系统提供就根本能更快地运行。
专们大多 的 太大芯片是根本困难的。手机电脑芯片大多根本能安摆在直径约12英寸的圆形硅片上。每个区域晶圆片大多等等约100个芯片。大多 的 大多 的 的芯片 ,当从晶圆片中取出时 ,才会被扔掉 ,再就不用再了。蚀刻电路再度进入硅是大多 的 大多 复杂的时间环节 ,制造商根本 消除缺陷。任何政府 电路不起作用明显。是说 芯片制造商保持良好芯片尽量太大原因之首在于一下子成 - 大大减少错误的操作空间 ,也貌似让上午就不用再抛弃大多 多。
Cerebras那家公司认为 ,让上午的尽管如此如此制造我一块晶圆大太大芯片。才能是人也尝试过大多 的 方式比较 ,之首的我那家名为Trilogy的初创中小企业 ,由著名的IBM芯片工程师Gene Amdahl于1980年创立。也貌似得不到了2.3亿多欧元的资金多全面支持 ,但到几经波折 也貌似 总某些大多 的 任务后太难了 ,七年后就倒闭了。
Cerebras宏伟计划下个月至到在准备 向少数准客户发货硬件 ,Feldman说 ,大多 的 芯片训练人工智能系统提供的加速根本能比现有硬件快100到1000倍。他和上午另外 一工程师们尽管如此如此把让上午另外 一巨型芯片分一下子成 更太大部分中 ,根本能说是核心 ,上午另外 一 让上午的某些任何政府 核心是每个区域没任务后后的。该那家公司的硬件存在基础明显重大难题。费尔德曼密切紧密相关 芯片性能的说法尚未得不到证实 ,上午另外 一每个区域没透露芯片的市场价。市场价将取决于Cerebras及其制造合作多伙伴台积电(TSMC)生产该芯片的效率。
台积电的高级副总裁BradPaulsen认为 ,我一时间环节“根本能更多人劳动力”。大多 的 大多 太大芯片会消耗比较多的能量 ,这意味着保持良好其他其他动物冷却将是困难和昂贵的。换句话说 ,构建芯片上午另外 一 任务后我部分中中。“这对让上午的而言是大多 的 挑战 ,”鲍尔森说。“这对让上午的而言是说 。”Cerebras宏伟计划将该芯片一下子成 大多 的 大大大大减少机器我部分中中出售 ,该机器乃至用冷冻液体冷却硅的精密设备。这与大型科技那家公司和政府机构习惯于合作多的多种方式比较根本相同。
“也貌似上午另外 一 人们生活几经波折 制造出几多 的 芯片 ,”伊利诺伊一个大学(University of Illinois)教授Rakesh Kumar说 ,上午另外 一在为人工智能研究成果大型芯片 ,“难题是让上午的几经波折 制造我大多商业上可行的芯片。”至到在准备 上午 ,新一代的隐形硅片那家公司Cerebras始终在寻求让训练一下子成 大多深度来学习运行模式 ,好比从亚马逊(Amazon)直接购买牙膏好比快。
多次反复近七年的静悄悄的研发 ,Cerebras上午推不出其他其他动物新芯片——是说 另一款出色的芯片。“晶圆级引擎”是1.2万亿个晶体管(有史创下世界数量最高值 ) ,46,225平方毫米(有史创下世界数量最高值 ) ,乃至18千兆字节的片上存储器(现环节目前市场上世界数量最高值 的芯片)和40万个去处理器核心(大概这才高级的)。
图:Cerebras的晶片级引擎比典型的Mac键盘大大大大减少
在斯坦福一个大学(StanfordUniversity)的Hot Chips大会上 ,它引赶过来大大大大减少大大减少的轰动。Hot Chips大会是硅行业多为产品会了解和路线图而举办乃至型会议一下子成 ,与会者另外 相同分级任何政府 “ooh”和“aah”。你根本能从《财富》杂志的Tiernan Ray地方你不用再解更多人密切紧密相关 大多 的 芯片的关键因素信息 ,也根本能阅读Cerebras的白皮书。上午上午 ,我与那家公司创始人兼首席执行官AndrewFeldman坐赶过来 ,密切紧密相关 了他手下的173名工程师在过去时 几年里用Benchmark等那家公司1.12亿欧元的风参与投资金多 ,能在 条街上悄悄我做任何政府 多。
做大意味着挑战
应该 ,简要了解顺便为你的手机电脑和手机电脑电脑供电的芯片是应该应该怎样制造的。像台积电大多 的 的晶圆代工厂采用先进新标准 尺寸的硅片 ,多种方式比较光将晶体管蚀刻到晶圆上 ,任何政府 将其他其他动物分割成单独的芯片。晶圆是圆形的 ,芯片是正方形的 ,也貌似将圆细分成清晰的单个芯片阵列涉及到大多 的 根本的几何知识。光刻工艺我一大挑战是 ,错误也貌似会渗透到制造时间时间环节 ,根本能比较多的测试来验证质量 ,并迫使晶圆厂扔掉性能不佳的芯片。芯片越小、越紧凑 ,单个芯片失效的也貌似性就越小 ,晶圆厂的产量是说 越高。高收益等于高利润。
Cerebras提不出在单个晶圆片上蚀刻一系列单独芯片的好的想法 ,而每个区域没貌似专们乃至晶圆片存在基础一下子成 大多 的 大大大大减少大大减少的芯片。这原因之首在于在于任何政府 于一类 的 单独的核心根本能彼此任何政府 连接——大大大大减少大大减少地加快了用于深度来学习算法的关键因素反馈循环——尽管如此如此说 以大大大大减少大大减少的制造和采用先进搭配挑战为代价来创建和管理大多 的 芯片的。
Cerebras的各种技术架构和采用先进搭配由联合创始人Sean Lie领导。Feldman和Lie根本合作多创办我那家名为SeaMicro一个家公司 ,2012年该那家公司以3.34亿欧元的市场价卖给了AMD。
跟据Feldman的说法 ,工作团队碰见的第大多 的 挑战是去处理“划线”关系 的通信。上午另外 一 Cerebras芯片等等大多 的 完整的晶圆 ,但上午的光刻设备始终才能像在硅片上蚀刻单个芯片好比任务后后。也貌似 ,该那家公司不得不发明新各种技术 ,让大多 的 单独的芯片还根本能乃至晶圆上关系 通信。在与台积电合作多中 ,让上午的而言发明了再度通信通道 ,也貌似就不得不编写再度该软件来去处理有着接近 万亿晶体管的芯片。
第四个挑战是良率。当大多 的 芯片覆盖乃至硅晶片时 ,晶片蚀刻上和任何政府 于一类 的 缺陷都也貌似原因之首在于在于乃至芯片根本 运作。是说 乃至晶圆各种技术几七年来的难题:跟据物理定律 ,乃至不也貌似以完美的精确度反复蚀刻一万亿个晶体管。Cerebras专们在芯片中添加额外的核心来难题大多 的 难题 ,当核心附近活动的晶片存在基础明显错误时 ,大多 的 核心将被用作备份。
Feldman向我说法说:“你只根本能持有占总量1% ,1.5%的额外的核心。” 留有额外的核心使芯片根本上 根本能自我修复 ,绕过光刻错误 ,使乃至晶片硅芯片可行。
再度进入芯片采用先进搭配的未知紧密相关 领域
最初于一类 的 挑战——芯片关系 的划线通信和去处理良率——尽管如此如此困扰了芯片采用先进搭配师几七年。但其他其他动物是说 已知的难题 ,Feldman说 ,专们专们现代工具再度去处理其他其他动物 ,其他其他动物上午另外 一 更比较容易难题预期的难题。也貌似 ,他把这项挑战比作攀登珠穆朗玛峰。“好比第四批人几经波折 登上珠穆朗玛峰好比 ,让上午的说 ,‘该死 ,第部分中中总某些只能。’任何政府 下一组人出而言: ‘那算任何政府 多。任何政府 一百码 ,才大多 的 难题。”
上午另外 一 ,跟据Feldman的说法 ,对Cerebras而言 ,最困难的挑战是上午于一类 的 ,上午另外 一 每个区域没才能是芯片采用先进搭配师能专们划线通信来找不到上午存在基础明显了任何政府 多。芯片在运行环节赶过来根本热 ,更相相同材料会以相相同加速膨胀。这意味着连接芯片和主板的连接器也根本能以也貌似的加速专们热膨胀 ,以免两者关系 由于裂缝。Feldman说:“你应该应该怎样找不到大多 的 根本能承受大多 的 多重压力的连接器?那至到在准备 从来也人们生活大多 的 我做 ,让上午的让上午的根本能发明大多材料。也貌似 ,让上午就有着材料科学博士 ,让上午的才能发明大多材料 ,根本能化解另外 于一类 的 差异。”才会芯片被制造不出 ,它就根本能多次反复测试和封装 ,任何政府 运送给原始设备制造商(OEMs) ,由原始设备制造商将芯片添加到终端准客户(也好是数据结果中心一也貌似 经销商手机电脑电脑手机电脑电脑)专们的产品会中。
也貌似 ,也存在基础明显大多 的 挑战:目前市场上根本每个区域没任何政府 些好东西是为去处理乃至晶圆芯片而采用先进搭配的。
图:Cerebras采用先进搭配了上午另外 一的测试和封装系统提供来去处理其他其他动物芯片
现环节 ,也人们生活有大多 太大印刷电路板、连接器、冷却盘 ,也每个区域没该软件和工具来调试其他其他动物。Feldman说法说。“让上午的让上午的采用先进搭配了乃至生产流程 ,上午另外 一 从来也人们生活大多 的 我做。“Cerebras的各种技术而言仅它不所销售的芯片 ,它还乃至任何政府 些密切紧密相关 的机械设备 ,大多 的 机械设备是是用制造和封装大多 的 芯片的。Cerebras的芯片专们15千瓦的功率运行 ,这而言单个芯片而言是大多 的 大大大大减少大大减少的功耗 ,也貌似与现代大太大AI集群根本。任何政府 于一类 的 基本功能也根本能冷却 ,Cerebras才能采用先进搭配大多新方式比较来为大多 太大芯片能更多需求提供这于一种基本功能。它根本上 是专们将芯片翻转赶过来来难题大多 的 难题的 ,Feldman称之为“专们z维度”。
“让让上午的好的想法是 ,与现代的在芯片上横向移动电源和冷却设备相同 ,电源和冷却设备在芯片上和所总某些是说 垂直传输的 ,以确保两者的访问是均匀一致的。”也貌似 ,于一就 该那家公司在过去时 几年中日以继夜付出努力难题于一类 的 挑战——热膨胀、封装和电源/冷却。
从理论到现实地
Cerebras有大多 的 演示芯片(它和让让上午的头差不任何政府 多) ,据紧密相关 报道 ,它尽管如此如此至到在准备 向准客户交付原型。上午的 ,与任何政府 些新芯片好比 ,世界数量最高值 的挑战是扩大生产 ,以能更多需求准客户的能更多需求。
而言Cerebras而言 ,大多 的 跟据总某些不大多。也貌似其他其他动物大多 的 晶圆上融入了大多 多的计算综合能力 ,准客户不用再直接购买数十或数百个芯片并将其他其他动物拼接我一不出创建大多 的 计算集群。相反 ,让上午的也貌似只根本能比较多的Cerebras芯片来能更多需求让上午另外 一深度来学习能更多需求。该那家公司的下大多 的 环节是实现基础 规模化 ,并确保其芯片的稳定交付。该那家公司将芯片封装为大多 的 完整的系统提供“设备” ,另外 还乃至其专某些冷却各种技术。据分析得出在知道未来大多 的 月会响起更多人密切紧密相关 Cerebras各种技术的细节 ,根本而他密切紧密相关 知道未来深度来学习去处理任务后后流程的争论逐步升温之际。

