工业设计达人圈

222成员
45830人气

申请加入

圈公告

聚集各种设计达人，一起分享交流产品设计、环境设计、传播设计、设计管理。

1.2万亿晶体管史上最大半导体芯片诞生，比最大GPU大56.7倍

920

发布：2019-08-21 12:06:55 来自冷颜温柔冰寒天觅知友会员

之前文摘菌报道了一家印度初创公司打着AI的旗号，干的却是人工的活，还拿到了2950万美元的融资。

但是大部分AI公司拿到融资还是真正去做AI的，比如这家名叫Cerebras的公司，在2016年也获得2500万美元的投资用于开发深度学习硬件设备。

如今，研究终于出了成果。据ventruebeat报道，Cerebras推出了拥有1.2万亿晶体管的史上最大半导体芯片。

看来投资人可以松口气了。

1.2万亿晶体管构建，史上最大芯片

1971年英特尔首款4004处理器拥有2,300个晶体管，最近的Advanced Micro Devices处理器拥有320亿个晶体管。而这款史上最大的芯片Cerebras Wafer Scale Engine拥有1.2万亿个晶体管。

大多数芯片是在12英寸硅晶片上创建芯片集合，并在芯片工厂中批量处理。但Cerebras Systems芯片是在单个晶圆上互连的单芯片。这些互连设计使其全部保持高速运行的状态，因此1.2万亿个晶体管全部一起工作。

通过这种方式，Cerebras Wafer Scale Engine是有史以来最大的处理器，它专门设计用于处理人工智能应用程序。该公司本周正在加利福尼亚州帕洛阿尔托的斯坦福大学举行的Hot Chips会议上讨论这项设计。

此前三星已经制造了一个很大的闪存芯片，即eUFS，拥有2万亿个晶体管。但Cerebras芯片专为流程加工而设计，拥有400,000个内核，42,225平方毫米。它比最大的Nvidia GPU大 56.7倍。

WSE还包含3,000倍的高速片上存储器和10,000倍的存储器带宽。

40万AI优化的计算内核

WSE包含400,000个AI优化的计算内核（compute cores）。被称为SLAC（Sparse Linear Algebra Cores），计算内核灵活，支持编程，并针对支持所有神经网络计算的稀疏线性代数进行了优化。SLAC的可编程性确保内核可以在日新月异的机器学习领域中运行所有神经网络算法。

由于稀疏线性代数内核针对神经网络计算进行了优化，因此它们可实现业界最佳资源利用率——通常是图形处理单元的三倍或四倍。此外，WSE内核包括Cerebras发明的稀疏性收集技术，以及加速稀疏工作负载（包括0的工作负载）的计算性能，如深度学习。

0在深度学习计算中很普遍。通常，要相乘的向量和矩阵中的大多数元素都是0。然而，乘以零是浪费资源，功率和时间的行为。

因为GPU和CPU是密集的执行引擎——引擎的设计是永不遇到0——它们即使在遇到0时也会进行计算。当50%-98％的数据为零时，比如深度学习中的情况，大多数乘法都没有意义。而Cerebras稀疏线性代数内核不会乘以零，所有零数据都会被过滤，直接在硬件中跳过，从而可以释放资源完成其他有用的工作。

更靠近计算的内存

内存是计算机体系结构的关键部分。更接近计算的内存意味着计算速度更快、更低的延迟和更好的数据移动效率。高性能深度学习需要大量计算，并且频繁访问数据。这需要计算内核和存储器之间的紧密接近，这在GPU中并非如此。

Cerebras Wafer Scale Engine则包含更多内核，具有比迄今为止任何芯片都有更多的本地内存，并且在一个时钟周期内可以通过其内核访问18GB的片上内存。WSE上的内核本地内存集合可提供每秒9PB的内存带宽——比领先的GPU多3,000倍的片上内存和10,000倍的内存带宽。

低延迟，高带宽的通信结构

Swarm通信结构是WSE上使用的处理器间通信结构，它以传统通信技术的功耗的一小部分实现突破性带宽和低延迟。Swarm提供低延迟，高带宽的2D网格，可连接WSE上的所有400,000个核，每秒带宽为100 petabits。Swarm支持单字活动消息，可以直接通过接收内核来处理。

路由、可靠的通信和同步在硬件中处理。消息会自动激活每个到达消息的应用程序处理程序Swarm为每个神经网络提供独特的优化通信路径。软件根据正在运行的特定用户定义的神经网络的结构，配置通过400,000个内核的最佳通信路径以连接处理器。

一个Cerebras WSE的总带宽为每秒100petabits，不需要诸如TCP/IP和MPI之类的通信协议。并且该架构中的通信能量成本远低于1焦耳每比特，这比GPU低近两个数量级。通过结合大的带宽和极低的延迟，Swarm通信结构使Cerebras WSE能够比任何当前可用的解决方案进行更快地学习。

解决了大芯片制造的技术挑战

承担计算任务的芯片尺寸在AI应用中非常重要，因为更大的芯片可以更快地处理信息，在更短的时间内得出结果。训练时间的减少，可以使研究人员能够进行更多测试，使用更多数据并解决新的问题。谷歌、Facebook、OpenAI、腾讯、百度都认为，今天人工智能的基本限制是训练模型需要很长时间。因此，训练时间是整个AI行业进步的主要瓶颈。

当然，一般芯片制造商不会生产这么大的芯片是有原因的。在单个晶圆片上，在制造过程中通常会出现一些杂质。如果一个杂质可以导致芯片的故障，那么晶圆片上的多个杂质就会击穿几片芯片。从而导致实际的效益只是实际工作的芯片的一部分。如果晶圆片上只有一个晶片，那么它含有杂质的可能性是100%，杂质会使晶片失效。但是Cerebras芯片是设计成冗余的，所以一个杂质不会使整个芯片失效。

“而设计的人工智能工作，Cerebras WSE包含基本的创新，解决了几十年以来限制芯片尺寸的技术挑战，如cross-reticle的连接性、产量、功率输出和包装，”Cerebras的创始人兼CEO Feldman在一份声明中说，“每一个架构决策都是为了优化人工智能工作的性能，其结果是，Cerebras WSE在功耗和空间很小的情况下，根据工作负载提供了现有解决方案数百或数千倍的性能。”

Linley Group首席分析师Linley Gwennap在一份声明中表示：“Cerebras在晶片规模的技术上取得了巨大进步，在一块硅片上实现的处理性能超出想象。”为了实现这一壮举，该公司已经解决了困扰该行业数十年的一系列工程挑战，包括实现高速模对模通信、解决制造缺陷、封装如此大的芯片、提供高密度电源和冷却。通过将不同学科的顶尖工程师聚集在一起，Cerebras创造了新技术，并在短短几年内交付了一个产品，这是一个令人印象深刻的成就。”

关于Cerebras公司

Cerebras是一家致力于加速深度学习的计算机系统公司，其联合创始人兼首席执行官Andrew Feldman是一位致力于推动计算领域的企业家。

在加入Cerebras之前，他是SeaMicro的联合创始人兼首席执行官，SeaMicro是节能，高带宽微服务器的先驱。SeaMicro于2012年被AMD以3.57亿美元收购。在SeaMicro之前，Andrew曾担任Force10 Networks的产品管理，营销和BD副总裁，后来以8亿美元的价格出售给戴尔计算机公司。在加入Force10 Networks之前，Andrew在RiverStone Networks担任营销和企业发展副总裁，从公司成立到2001年首次公开股，Andrew Feldman拥有斯坦福大学的MBA学位。

Andrew Feldman

网友在twitter上的评论也是众说纷坛，有提问此芯片是否是加速器的独立芯片？

还有关于保持散热、稳定方面的疑问：

多数网友持乐观的态度，认为这是令人印象深刻的第一个芯片，在朝正确的方向迈进！

û0 ñ0 0 0

未登录

200

o p

不是我不联系你：而是你给我的感觉，像是我在打扰你！
1、分手了就不要想我，就当是一个梦，我们毕竟不是各自的港湾，只是过客。2、分手后，我还认识你，不过不再想见你，你过的好，我不会祝福你，你过的不好，我也不会嘲...
来至：职场情感交流圈半世纪童话 ⋅ 827人浏览 ⋅ 一个月前
你去过铜锣湾、兰桂坊吗？现在“冰”成这样……
香港的美味怕是说个三天三夜也说不完你可以到老字号点份早茶套餐或者叉烧饭到藏匿在街头巷尾的小店吃碗咖喱鱼丸和烧卖可以寻觅到各类甜品汤羹再来顿热气腾腾的港式打边...
来至：就是爱旅行圈墨锦倾城染青衣 ⋅ 827人浏览 ⋅ 一个月前
通用与亚马逊合作车辆添加Alexa语音助手
近日，通用汽车已经与科技公司亚马逊达成合作，将在2020年上半年中，将亚马逊的Alexa语音助手添加到雪佛兰、别克、GMC和凯迪拉克等几个品牌的车载信息娱乐...
来至：财经早知道梧桐林的猫女巫 ⋅ 827人浏览 ⋅ 一个月前
钟南山谈抗病毒特效药，称临床试验必须走程序
针对最近热议的抗病毒“特效药”，钟南山昨天表示，临床试验可以加快绿色通道，但必须走程序。“很多实验室找到一个苗头，就希望马上完全进入临床，这个要小心，伦理审...
来至：医药保养交流圈生命一旅程 ⋅ 827人浏览 ⋅ 一个月前
新版《蝙蝠侠》导演发布首批蝙蝠车高清照
据外媒报道，蝙蝠侠的蝙蝠车一直都很酷，而马特·里夫斯版本的或许是当中将这点做到最极致的。日前，这位新版《蝙蝠侠》导演在Twitter上分享了从三个不同角度展...
来至：淘电影社区跟彩虹说午安 ⋅ 827人浏览 ⋅ 一个月前
现在从美工转行学习平面设计还来得及吗？
距离电商的崛起也有好些年了，美工设计行业的竞争越来越大。像近来就有一个做美工的朋友问小编，说他从事美工已经差不多两年，薪资依然没什么变化，想转行做平面设计，...
来至：工业设计交流圈呆梨小仙女 ⋅ 827人浏览 ⋅ 一个月前
又禁了！美为什么对中国无人机这么纠结？其实海豹给出了答案
无人机在人们生活中出现的频率已经越来越高，不论是军事领域还是民用领域，无人机的发展可以说是代表了一种未来的趋势。现在的一些报道我们可以知道，中国在这一方面显...
来至：科技前沿社区清晨的小鹿 ⋅ 827人浏览 ⋅ 一个月前
美国欠我国上万亿美元，若赖账不还怎么办，原来我国早有考虑
作为世界第一军事强国，美国拥有庞大航母舰队，随便出去转一圈也会让其他国家在心里思量一番。即便如此，美国依旧不放松海军建设，目前依旧有新型航母在建，不过，美国...
来至：每日要事南巷旅人 ⋅ 827人浏览 ⋅ 一个月前
出现肚腩怎么办？三个方法，大肚子变成小肚子
很多人应该都有发现，在步入中年后就会有肚腩，在平时大家都会以大腹便便来形容中老年人。不过有很多人很疑惑，为什么自己到中年就会出现肚腩？这种肚腩能不能够减掉？...
来至：养生保健圈小清新范 ⋅ 827人浏览 ⋅ 一个月前
《半条命》原计划在TGA亮相内容：却被临时取消
在TGA 2019颁奖典礼举行以前，主持人Geoff Keighley曾表示大家可以期待《半条命：爱莉克斯》的最新内容，不过昨天我们并没有看到这部作品的演示...
来至：次时代娱乐圈阿爸的小仙女 ⋅ 827人浏览 ⋅ 一个月前
英国首相约翰逊议会“寸步难行”，上街还被人“怼”到结巴
本周对英国首相鲍里斯·约翰逊来说，应该是最糟的一周：党内同僚倒戈、议会惨败，就连亲弟弟也“弃”他的政府而去。而当地时间9月5日，约翰逊造访约克郡利兹时，也免...
来至：财经早知道别摸我的婴儿肥 ⋅ 827人浏览 ⋅ 一个月前
中国院士完成了美国认为不可能完成的任务
在近几十年发生的局部现代战争中，以激光陀螺为核心的惯性技术，已成为不可替代赢得最终胜利的关键。1982年5月的英阿马岛海战，阿根廷空军一架“超军旗”飞机在3...
来至：工业设计达人圈安之素年与昔年 ⋅ 827人浏览 ⋅ 一个月前
面试官：5个苹果分给6位同事，怎么分？80后男士从容作答，被录用
面试官：5个苹果分给6位同事，怎么分？80后男士从容作答，被录用现在社会上的大学生比较多，岗位竞争也比较大，所以公司在招募职员这个方面有了很大的难度，很多的...
来至：职场达人交流圈咪咕猫 ⋅ 827人浏览 ⋅ 一个月前
为何美国40年前不阻止中国发展？白宫官员给出答案，根本阻止不了
从二战结束至今，我国经过几十年发展终于发生翻天覆地变化，军事方面，我国拥有足以保护自己的实力，经济方面，我国更是一跃成为仅次于美国的世界第二大经济国家。眼看...
来至：武器看点生活屁颠屁颠的过 ⋅ 827人浏览 ⋅ 一个月前
中国今年棚改开工量腰斩，十年棚改为何急刹车？
简介：原本受益于棚改扩量和货币化安置政策的地区，一旦棚改缩量叠加货币化安置政策收紧，其房地产市场会如何演变，不得不令业界关注。一份官方数据显示，2019年我...
来至：投资理财论坛圈想待在角落 ⋅ 827人浏览 ⋅ 一个月前
漫威：钢铁蜘蛛战衣坏了谁来修呢？我猜有这几个可能
虽然在电影宇宙中问这种问题稍微有点不合适，但既然有人问就得有人答。其实这个问题也曾经出现在我的脑海里，但因为本来就是电影中的桥段，所以就没怎么在意。《蜘蛛侠...
来至：银河情报局不朽的少年 ⋅ 827人浏览 ⋅ 一个月前
婚姻中，不去表达爱，比不爱更可怕
所谓夫妻，难在茫茫人海里相遇，易在柴米油盐中疏离。很多婚姻，似乎都逃脱不过岁月的摧残。多少夫妻，开始甜蜜幸福，但随着时间的流逝，很多人走着走着就选择...
来至：心理话题圈野区帅叔叔 ⋅ 827人浏览 ⋅ 一个月前
6月1日起，驾考可异地考试，但是另外的新规，却让人不想考驾照
在现在这个社会，如果没有驾照，感觉像是缺少了点什么，并且如今会开车，能开车成了成年人的必备技能之一，所以现在大多数人年龄到了第一件事就是去考驾照，管他能不能...
来至：爱车服务俱乐部鹿萌萌的长睫毛 ⋅ 827人浏览 ⋅ 一个月前
26国联手宣告失败，北斗正式展开“反击”，东方成最大赢家
被全球广泛使用的GPS卫星定位系统由美国研制，组成GPS的24颗卫星信号可覆盖全球。通过精密布局，此系统可实现在地球上任意位置都能观测到该系统上的四颗卫星，...
来至：启航宇宙视野超级小帅哥 ⋅ 826人浏览 ⋅ 一个月前
教你认清婚礼上的卡片一次性点亮个性婚礼主题
要结婚时设计卡片邀请亲朋好友是一个很重要的事，但是卡片要新颖且吸引人确实一件很费神的事。下面为大家整理最新主题婚礼结婚卡片，希望从中能给你带来一些设计灵感。...
来至：技能专长圈小乔印象设计联盟 ⋅ 826人浏览 ⋅ 一个月前