游客发表
来源丨Forbes1yJ 作者丨Rob Toews1yJ 编译丨科技行者1yJ 它是数字时代的基础技术。美国硅谷的智能正推名字就来源于此。在过去的动芯半个世纪里,计算技术的复兴革命改变了社会的方方面面,而半导体技术是人工这场革命的核心。1yJ 自从英特尔在1971年推出世界上第一个微处理器以来,智能正推计算能力一直在以惊人的动芯速度发展。根据摩尔定律,复兴目前的人工计算机芯片比50年前的芯片强大数百万倍。尽管过去几十年来处理能力迅速增长,智能正推但计算机芯片的动芯基本架构直到现在也没有太大变化。芯片的创新很大程度上需要进一步缩小晶体管的尺寸,使集成电路能够容纳更多的晶体管。1yJ 几十年来,英特尔和AMD通过提高CPU性能取得了巨大进步,克莱顿克里斯滕森将其视为“持续创新”。今天,这种情况正在发生巨大的变化。人工智能(AI)引发了半导体创新的“新黄金时代”。——机器学习带来了独特的市场需求和无限的机会,这激发了企业家们第一次重新思考芯片架构的基本原理。1yJ 他们的目标,是设计一种专为AI设计的新型芯片,为下一代计算提供动力,这也是当前所有硬件领域最大的市场机遇之一。1yJ 新的计算范式1yJ 在计算技术发展史上,主流的芯片架构一直是CPU。如今,CPU无处不在,它为笔记本电脑、移动设备和大多数数据中心提供电源。1945年,传奇的约翰冯诺依曼构思了中央处理器的基本架构。值得注意的是,从那以后,他的设计没有太大变化。今天,大多数计算机仍然是基于冯诺依曼理论的机器。CPU的灵活性使其具有多种用途:CPU具有通用性,可以有效执行软件所需的任何计算。虽然中央处理器的主要优点是通用性,如今领先的AI技术需要的,是一种非常特殊且密集的计算。.1yJ 深度学习需要迭代执行数百万甚至数十亿个相对简单的乘法和加法步骤。深度学习以线性代数为基础,线性代数的基础是试错法:随着模型本身的不断优化,在整个神经网络中调整参数、相乘矩阵、重复数字求和。这种重复且计算密集型的工作流程对硬件架构有着重要的要求。“并行化”变得非常重要。“并行化”是指处理器同时执行多个计算而不是一个接一个的能力。1yJ 与之密切相关的是,深度学习涉及大量数据的不断转换,因此保持芯片内存和计算核心尽可能靠近数据位置可以减少数据移动,从而大大提高速度和效率。CPU不足以支持机器学习的独特要求。CPU按顺序处理计算任务,而不是并行处理。中央处理器的计算核心和内存通常位于不同的模块上,并通过带宽有限的通信系统(总线)连接。1yJ 这就造成了数据移动的瓶颈,称为“冯诺依曼瓶颈”。结果,在中央处理器上训练神经网络的效率非常低。随着机器学习的日益普及,传统芯片已经不能满足现代AI算法的要求,这一问题日益突出。1yJ 正如AI专家Yann LeCun最近所说:“如果你能穿越到未来五年或者十年,看看计算机大部分时间都在做些什么的话,我认为很可能是机器学习之类的事情。”.1yJ 这时候就需要GPU来推动AI的繁荣和发展。GPU架构是英伟达在20世纪90年代末为游戏应用开发的。当时,GPU专门用于连续处理大量数据,以高帧率渲染电脑游戏画面。与CPU不同,GPU可以并行运行数千个计算任务。2010年代初,AI领域开始意识到英伟达的游戏芯片其实非常适合处理机器学习算法所需的工作量,于是GPU幸运地找到了新的目标市场。英伟达抓住了这个机会,将自己定位为“AI硬件市场的领先提供商”,并获得了33,354英镑的惊人收入。从2013年到2018年,英伟达的市值增长了20倍。1yJ 然而,正如Gartner分析师Mark Hung所说,“每个人都知道,GPU并没有针对AI工作负载进行优化。近年来,”虽然GPU已经被AI领域广泛采用,但它并非为AI而生。一大批企业家和技术人员开始重新想象计算机芯片,从零开始优化,以释放AI的无限潜力。艾伦凯的话令人难忘:在过去的两年里,“真正认真对待软件的人,应该自己制造硬件。”,出现了五家芯片独角兽公司,许多初创公司的估值高得惊人。1yJ 传统CPU巨头英特尔为了避免颠覆,进行了两次重大收购:2016年4月,以4.08亿美元收购Nervana Systems,2019年12月,以20亿美元收购Habana Labs。未来几年,这种竞争将继续以千亿美元的规模争夺这个市场。1yJ 谁会是下一个英特尔?1yJ 巨大的市场机遇,加上巨大的技术挑战,激发了大量令人惊叹的想法,意图打造一款理想的AI芯片。在新一代人工智能芯片初创企业中,最引人注目的是大脑系统公司。简单地说,大胆的大脑开发了有史以来最大的芯片。最近,大脑的市值达到了17亿美元,从Benchmark、红杉等顶级投资者那里获得了2亿美元。大脑芯片的规格令人难以置信,比典型的微处理器大60倍,是历史上第一个可以容纳超过1万亿个晶体管(准确的说是1.2万亿个)的芯片。1yJ 其片内内存为18 GB,也是有史以来最高的。将所有计算能力封装在单个芯片上,有着非常吸引人的优势:数据传输效率大大提高,内存和处理并置,可以进行大规模并行处理;然而,工程挑战是巨大的。几十年来,制造晶圆级芯片一直是半导体的梦想,但从未实现。大脑公司首席执行官安德鲁费尔德曼(Andrew Feldman)说,“每一条规则、每一个工具和每一个制造设备都是为巧克力饼干大小的正常大小的芯片设计的,我们制造的芯片就像饼干盘子一样大。1yJ 因此,我们必须对每一步进行新的设计。大脑的AI芯片已经投入商业使用:上周,阿贡国家实验室,宣布,将使用Cerebras的芯片来对抗新型冠状病毒。,的另一家公司采用了一种新的芯片设计方法,这就是位于美国湾区的Groq。与大脑相比,Groq的芯片侧重于推理,而不是模型训练。Groq的创始团队拥有世界级的领域专业知识:作为迄今为止最早、最成功的AI芯片之一,谷歌TPU项目的10名原始成员中有8人加入了Groq团队。Groq颠覆了行业的传统观念,正在制作批量为“1”的芯片,即一次加工一个样品。1yJ 根据Groq的说法,这种架构几乎可以在不牺牲性能的情况下实现瞬时推理,这对于自动驾驶汽车等时间敏感型应用非常重要。Groq芯片以软件定义为主,具有独特的灵活性,面向未来。Groq最近宣布,其芯片已经实现了每秒1万亿次运算的速度。如果这是真的,它将成为有史以来最快的单模芯片。还有一家公司,没有一家公司比它有更好的技术眼光,那就是Lightmatter。Lightmatter由几位光子学专家创立,总部位于美国波士顿。1yJ Lightmatter正在构建一个AI微处理器,但它不是由电信号驱动的,而是由光束驱动的。目前,Lightmatter已经从GV、Spark Capital和Matrix Partners筹集了3300万美元来实现这一愿景。根据Lightmatter的说法,这种独特的光学技术使芯片的性能比现有解决方案高出10倍。这个领域还有其他公司值得关注。两家中国公司,——地平线机器人公司和坎布里康科技公司,分别获得了更多的融资和更高的市值。1yJ 位于美国帕洛阿尔托的桑巴诺瓦系统公司也获得了丰厚的资金,技术精湛。虽然关于SambaNova的细节仍然很少,但它的技术似乎特别适合自然语言处理。其他著名的创业公司包括Graphcore、Wave Computing、Blaize、Mythic和Kneron。而且,很多科技巨头已经开始自主研发特殊的AI芯片,比如上面提到的谷歌TPU。谷歌2015年开始开发TPU,引领技术曲线发展;去年12月,亚马逊宣布推出推理AI;大张旗鼓地;与此同时,特斯拉、脸书和阿里巴巴以及其他科技巨头也采取行动,开始在内部开发AI芯片。1yJ 总结1yJ 目前,正在进行一场为即将到来的AI时代开发所需硬件的竞赛。如今,半导体行业有很多创新,这是硅谷成立以来从未有过的,大量资金不断投入其中。未来几年,下一代芯片将塑造人工智能的雏形和轨迹。用Yann LeCun的话说:“硬件能力.鼓励但限制AI研究人员想象和追求的想法。我们可以使用的各种工具都在不断刷新我们的想法,这是我们不得不承认的。”1yJ 未来智能实验室的主要工作包括:建立AI智能系统的智商测评体系,开展世界范围内的人工智能智商测评;开展互联网(城市)云脑研究计划,打造互联网(城市)云脑技术和企业地图,为提升企业、行业、城市智能化水平服务。1yJ |
随机阅读
热门排行
友情链接