来自 趣事 2021-09-01 08:39 的文章

莫智能创始人访谈录:依托存储与计算一体化,

20世纪40年代,冯·诺依曼架构开启了计算机系统结构的发展。
 
在传统的冯·诺依曼架构下,计算和存储是分离的。无论处理器的运行速度有多快,性能有多好,每次执行操作时都需要将数据从内存移至处理器,处理后再移回内存。
 
在基于数据的AI计算下,冯·诺依曼架构的“存储墙”和“功耗墙”的挑战脱颖而出。半个多世纪过去了,有办法翻过“两面墙”吗?
 
在接受The Paper (www.thepaper.cn)独家专访时,芯片初创公司厚墨智能创始人兼CEO吴强表示,存储与计算技术的融合是一个全新的AI芯片方向,可以将逻辑单元和存储单元进行集成,直接在存储单元内部进行操作,从而缓解数据处理问题,降低能耗。吴强
 
吴强
 
“相比计算芯片,尤其是CPU领域,AI芯片可能是中国第一个弯道超车的领域。”在国内外,存储与计算的融合还处于起步阶段,这种架构也正处于学术向产业迁移的关键时期。存储和计算的集成在学术界做得很好,AI计算在业界很强。“如果真的要做大芯片,需要两波人一起整合。”
 
一项新技术要想大规模推广,离不开产业生态的建设。尤其是在传统芯片已经占据了现有大部分应用场景的前提下,如何突破新市场,实现产业化,是所有新兴AI芯片公司不得不面对的问题。
 
吴强表示,与海外垄断巨头相比,作为新玩家,客户必须在当地有明显优势,解决痛点,才有动力尝试新产品。建立软件生态是必由之路。只有这样,才能真正打破巨人的壁垒。
 
爬过芯片“两堵墙”
 
AI芯片是人工智能应用中专门用于处理大量计算任务的模块,主要分为GPU、FPGA和ASIC。
 
厚墨智能创始人兼CEO吴强表示,这些芯片在底层设计理念上相似,但不同的是效率和通用性之间的权衡。然而,存储与计算的融合采用了全新的设计理念,基于存储与计算融合的计算芯片对先进制造工艺的依赖较弱。
 
在传统的冯·诺依曼架构下,计算和存储是分离的,计算单元从内存中读取数据,然后在计算后将其保存回内存。
 
但随着AI芯片的发展,这种架构带来的问题是内存的数据访问速度跟不上计算单元的数据处理速度,阻碍性能提升的“存储墙”问题严重,性能瓶颈突出,计算能力提升受限。
 
特别是随着人工智能的快速发展,人工智能算法对逻辑单元和存储单元之间信息交互的要求比传统任务更加严格。AI计算主要以数据为基础,大量的数据处理导致高功耗,凸显了“电源墙”的挑战。
 
到2025年,全球数据中心将使用全球20%的电力。再比如,AlphaGo在国际象棋上打败了人类,但是人类只用了20瓦的大脑能量,而AlphaGo用了2万瓦。如果更多的脑力劳动被机器取代,芯片散发的热量会使地球变热。
 
只有基于低功耗的大计算能力才是可持续的。那么如何才能越过“存储墙”和“电源墙”呢?内存计算,也称为内存计算,指的是存储单元内部的直接操作。它可以集成逻辑单元和存储单元,缓解数据处理问题,从而降低能耗。这被认为是打破冯·诺依曼瓶颈的有效途径。
 
厚墨智能联合创始人、战略副总裁向楚在开篇介绍,存储与计算的融合可以解决困扰行业已久的“存储墙”问题,在数据处理过程中功耗降低高达90%,提升计算能效比。同时,这种架构也减少了等待数据读取时对计算能力的浪费,实际性能更好。存储与计算一体化采用非冯诺依曼架构,因此只需复制“存储与计算一体化单元”来提高计算能力,在工程上更简单。
 
当然,存储和计算的一体化也不是万能的。它只针对某一类计算,尤其是基于数据的AI计算,不适合CPU等基于控制的计算。存储与计算集成作为一个新的芯片方向,面临着电路设计、架构和软件等诸多挑战。
 
存储与计算的融合正处于从学术界向工业界迁移的关键时期。吴强表示,最本质的挑战和难点在于“既要对存储和计算技术的融合有深刻的理解,同时也要对AI的应用有所了解。只有两者结合起来,才有可能产生裂变,做出局部颠覆性的东西。”
 
困难在于这两件事是由两个人做的。存储和计算的集成在学术界做得很好,人工智能计算在工业界很强。“如果真的要做大芯片,需要两波人一起整合。”吴强说。
 
寻找在中国创业的机会
 
做过AI芯片,研究过存储与计算的融合,吴强最终决定自己创业。
 
事实上,2018年之后,芯片热潮开始了,这对创业者来说是难得的历史机遇。投资者问吴强为什么要做AI芯片。吴强说,AI芯片比应用芯片更难制造,但空间很大。芯片巨头英伟达市值突破5000亿美元,大部分涨幅来自AI芯片。
 
“人们不喜欢做无聊的事情,所以他们肯定会用AI来帮助自己变得更有效率。我同意人类生活智能化是大势所趋。如果说AI是大势所趋,那么AI计算必须有计算能力的支撑。”
 
以无人驾驶为例,L5无人驾驶需要4000 TPOS的计算能力才能支持全智能。边缘和云计算能力支持AI应用,支持人类社会走向智能化。“当然,我们用差异化的技术来做存储和计算,可以做出差异化的产品来弯道超车。”
 
2006年获得普林斯顿大学计算机科学博士学位后,吴强曾在英特尔、AMD、脸书和地平线工作,是AMD GPU/OpenCL创始团队的核心成员。2009年至2017年任脸书高级科学家,主导绿色云计算项目,大幅优化节约整体功耗。
 
当时英特尔已经是大公司,AMD也是大公司,离创业还很远。我第一次接触硅谷的企业家精神是在脸书时期。“当时,脸书只有几百名工程师,规模还比较小,名气也不大。整个公司只有一层楼,每天都能看到扎克伯格。去了脸书之后,我看着它一路成长,成为拥有上万名工程师的国际巨头。”
 
这是吴强第一次看到创业公司是如何成长的,他知道创业是怎么回事,这让他感触很深。
 
2012年,脸书上市,包括吴强在内的一批老员工面临着未来何去何从的选择。“比如,当一个人经济自由时,他会进行投资,当一个人退休时,他会开始创业。我在想我自己,我想做什么。”
 
吴强“想了一下”,还是想创业。“我想我也非常喜欢这个过程。从0到1做一个公司,从小到大的成长,是非常美好的。”
 
他开始寻找回国的机会。在美国待了近20年,一步到位直接创业是不现实的,于是他决定先加入创业公司。“所以我只在看到国内机会的时候看创业公司,没有看到大公司。”
 
怀着创业的向往,2017年回国后,吴强加入地平线,担任技术副总裁、工程院院长,后担任地平线CTO,主导AI芯片软件解决方案和生态建设,以及边缘端应用解决方案的商业化,帮助企业打造硅谷标准的国际化R&D体系。
 
直到2020年,吴强离开了地平线,开始了自己的事业。我在美国的时候,吴强和我都住在波士顿,一起踢足球。“在美国,这很简单。我不知道他的专业是什么。我们只是踢球,在一起踢球有信任感。我们可以通过这些来判断一个人是否可靠。”就这样,在项目开始时,他也相信了这位高尔夫球手对创业的判断,两人一拍即合。
 
软件生态:鸡生蛋,蛋生鸡
 
在Micro 2017上,NVIDIA、英特尔、微软、三星、苏黎世联邦理工学院和加州大学圣巴巴拉分校等。都推出了集成存储和计算系统的原型。项目刚开始的时候,我对《www.thepaper.cn报》说,从技术上讲,无论是国内还是国外,在存款和计算一体化方面,还是在同一起跑线上。
 
"存储与计算的集成是科学技术的一大趋势."祁鸣创投合伙人周志峰告诉《www.thepaper.cn晨报》记者,在过去的两三年里,中国的存算一体化,尤其是对于AI应用的存算一体化,比欧美发展得更快、更积极。核心原因是国内有大量的应用场景,AI在很多领域落地都比其他国家早。
 
“我们拥有大量的AI算法、底层框架等相关人才,间接推动了集成存储和计算芯片的发展。中国在这一领域的发展在技术路径和应用方面是多样化的。我相信,未来中国的集成芯片公司将成长为这一领域的世界级公司,而不仅仅是中国的龙头公司。”周志峰说。
 
2020年底,吴强创立后摩洛哥智能,基于存储与计算一体化技术,研发大计算能力的智能计算芯片。今年3月,厚墨智能宣布完成数千万美元天使轮融资,并宣布半年内获得第二笔3亿元融资。目前已完成核心技术验证,8月中旬发布。
 
存储与计算的融合虽然受到业内部分人士的青睐,但一项新技术的大规模推广离不开产业生态的构建,包括芯片厂商、软件工具厂商、应用集成厂商的合作、研发、推广和应用。
 
尤其是在传统芯片已经占据了现有大部分应用场景的前提下,如何突破新市场,实现产业化,是所有新兴AI芯片公司不得不面对的问题。
 
回顾NVIDIA GPU的发展历史,它的成功给人以启示。1999年,英伟达推出了标志性的GeForce256,这是世界上第一款GPU。
 
“NVIDIA最初使用GPU进行图形处理,后来突然发现GPU可以作为GPU(通用图形处理器)进行科学计算。”吴强说,GPU的出现解决了一个痛点,因为没有国家实验室能够负担的起的大型服务器集群,它也能拥有巨大的计算能力。
 
“作为一个新玩家,我们必须在局部地区有明显的优势来解决别人的痛点,比如更大的计算能力和更低的功耗。如果我们能做到这一点,其他人就会有动力尝试你的产品。”
 
另一个不可忽视的点是NVIDIA以CUDA为核心的软件生态。吴强表示,智能芯片的研发很难挑战软件生态。“NVIDIA的软件非常好用,符合人们的思维逻辑或习惯。既然你已经习惯了,你可以在上面构建更多的工具和库。这叫生态。”
 
就像先有鸡还是先有蛋的问题一样,软件好用,自然用的人多。软件用得越多,功能就越强大。“我们也必须迈出这一步。软件一定要好用,迁移成本要低,用过之后尝到甜头的人要在上面搭建自己的工具,一定要开放的生态,这样才能循序渐进。它已经成为一种生态。”
 
吴强说,对于所有新玩家来说,这是必经之路,也只有这样才能真正打破巨人的壁垒。第一步是找一个“不太深的地方”进攻。相比AI训练,可以在没有那么多操作者的情况下,通过AI推理进行切割,逐步在本地构建自己的生态,在小范围内形成闭环,解决产卵和产卵的问题。
 
高端芯片设计人才的差距已经缩小
 
二战后的五六十年代,美国科技的爆炸式发展使得芯片作为底层支柱进入各行各业,最早开发半导体芯片的硅谷诞生了。上世纪七八十年代,随着日本汽车、家电产业的发展,芯片作为底层支柱也发展起来。
 
如今的中国也是如此,科技全面赋能,人工智能、无人驾驶、机器人、5G、物联网等各种新应用形成增量市场,也必须有位于技术栈底的新一代芯片支撑。中国芯片产业自然爆发。“这个时机特别好。如果需求端没有大幅增长,我们只是跟随欧美巨头已经有的芯片产品和市场。我觉得这个行业做不到。”周志峰说。
 
过去几年,国产芯片领域布局越来越多,行业释放的积极信号也越来越多。政府、资本市场和大型科技公司都在支持国产芯片的发展。更重要的是,有了中国的产业集群,芯片企业可以更好地了解用户需求,推动生产更符合市场需求的差异化芯片。
 
人才优势是推动行业发展最重要的环节。“做了七八个月CEO,感情还是挺深的。”和以前的技术不同,吴强现在一睁眼就有五样东西:人、钱、方向、客户、组织能力。
 
近20年来,中国芯片人才成长迅速。“比如一些半导体巨头在中国的R&D中心,已经成为中国芯片人才的‘黄埔军校’。这些中国R&D中心承载并交付了许多世界领先的核心技术研发。“周志峰告诉The Paper(www.thepaper.cn)记者,全球十大芯片设计公司在中国都有R&D中心,从事世界最先进技术的研发,这是中国涌现出一大批顶尖芯片设计人才的重要原因。
 
在众多科技领域中,我国在芯片领域的人才优势相对明显。“在全球范围内,与其他领域相比,中国力量在半导体行业的影响力是巨大的。在全球顶尖芯片公司中,中国人担任技术或业务高管的比例远高于其他领域。按营业收入计算,全球十大芯片设计公司中有八家是中国公司。”周志峰说,如今,这些人才大量回国,加入创业公司或大科技公司,带动中国芯片产业的发展。
 
吴强还认为,中国高端芯片与国外的设计差距很小,可以满足这一轮芯片革命的发展。芯片行业虽然出现了过热,比如验证人才短缺、价格甚至高于设计人才、企业家互相挖角等。,他说这是暂时的,两年内会变得理性。
 
“我们还是希望有一个有点智谋的人过来,真正认可我们,看中我们做的事情,看中这个团队,并且愿意加入我们。我相信我们可以把事情做得更大,我们必须找到这样的人。”
 
但芯片软件人才依然薄弱,与硅谷差距较大,高端芯片设计架构师等人才数量略显不足。“我们看到很多处理器芯片公司面向数据中心,很多创业者忽略了软件生态,只考虑如何让硬件具备极致性能。但是,没有高可编程性的支撑软件生态,就没有办法真正进入终端市场。软件生态才是欧美芯片厂商真正的护城河。”周志峰建议,我国应加强芯片软件生态人才的培养。
 
一批外企培训,一批海外归国,一批国内通过应用场景培训,人才固定,资金充足。“中国未来将成长为芯片巨头。我不知道是谁,但我相信会有。