
【本期嘉宾】徐宁仪:辉羲智能创始人,上海交通大学教授,清华大学本硕博; 先后就职于微软亚洲研究院硬件计算组主任研究员、百度智能芯片部技术委员会主席/主任架构师、商汤首席科学家。其中,主导的微软数据中心定制加速系统在全球首次应用于超大规模数据中心、应用在价值数十亿美元的产品和服务中;主导的百度昆仑AI芯片是中国第一款云端全功能人工智能芯片,首次在工业领域大规模应用的中国自研AI芯片。同时,在顶级会议及期刊发表相关论文50余篇,近5年引用1600余次,获得相关专利8项。
01
ChatGPT、阿尔法狗、深蓝有一个共性
慕容素娟: 近ChatGPT非常的火,也是把AI又重新带起来了。您怎么看?
徐宁仪: China GPT这一波,其实我觉得大家讲有一个比较重要的事情,它其实是模型做得更大,前面NLP自然语言处理其实有非常多的精巧的设计,但是大家就发现 open AI的Sam Altman等这些人,他们其实有一个信仰,就是说我“一定要把模型做大”,他必须找到一个scalable(可扩展)的办法才能把人类的这些自然语言最凝练过的思考放进去。但我想说这个事情其实在深度学习、再往前机器学习,其实一直是对的。
有一个强化学习之父叫Richard S. Sutton,他写了一系列的思考,他说过去70年人工智能发展史证明最有效的办法,往往是最scalable(可扩展)的方法,就最有效扩展的方法是最能够带来收益的方法。
这件事情我自己也是有体会,我在微软的时候,我的领导找我去微软的,他叫许峰雄,然后他以前在IBM做了一台机器叫深蓝deep blue,本质上就是做了一颗芯片来加速下国际象棋,然后打败人类的世界冠军卡斯帕罗夫。
其实他说我做的不是人工智能,我其实就是做了一个暴力的破解,我是用一个非常scalable(可扩展)的方法,然后打败了人类的世界冠军,当时其实有一些别的方法都是非常精巧的方法,但最后最stable最能可扩展,最能有效利用算力,最能有效利用数据的方法赢了。
这件事情其实一再的发生,从下象棋深蓝到后边下围棋阿尔法狗,到人脸识别,然后到最近的大模型ChatGPT,其实都是说我们找到了一个scalable(可扩展)方法,我们看ChatGPT或者是GPT这个系列,它其实用了一个decoder only的算法结构,谷歌其实走了encode and deconde(输入编码和输出编码),其实decoder only它算力上其实就是更scalable的一个方法。
再往下想一步是什么?就是这种算法必然是有一个硬件,能够比较好的把算法加速,硬件我们叫Hardware lottery(硬件彩票)。就是有一种硬件的架构,抽中了一个彩票,有一种算法跟硬件的架构正好结合的特别好,形成一种scalable(可扩展)的方法,这种硬件就会胜出,同样这个算法也会胜出。
我们可以从另外一个角度来思考,ChatGPT和 GPT的3\4\5\6一定会一直做下去,这就是我们这个时代的硬件彩票和算法彩票,它抽中了一个彩票,能够把人类这么多的高质量的文本全部能够学进去,而且还能够跟它进行对话。
慕容素娟:ChatGPT和辉羲目前要做的事情上有一些连接点吗?
徐宁仪:您问的是投资人的问题,非常好的问题。
我们现在做的跟这个事情一定是有关系的。我们大概两年多以前,我们就觉得这个方向非常的重要,我当时的判断就是transformer这件事情应该是对的。
transformer能够统一NLP自然语言处理和CV计算机视觉,所以我们觉得transformer这个架构应该会需要一种硬件架构,把这个事情做得特别好,它很通用的能力,既有语言文字的能力,又有图像视频的这种能力,它可能是通往通用人工智能的一条非常有效的道路。
所以我们一定要做一家芯片公司,抽中Hardware lottery硬件彩票,然后让上面的算法和系统在这些垂直领域能够做得更好,所以这是我们的一个初始设计,后来也逐步的印证了当时的一些判断,对,当然我们没有知道的是open AI把这件事情非常领先的做出来了。
慕容素娟:实大家就感觉是在同步在走,然后到这个点上最后有这样的一个交集出现了。
02
车载AI芯片1年内认证 明年上车
慕容素娟:能不能谈一下辉羲今年的一个侧重点,未来三五年又有什么样的一个发展规划?
徐宁仪:们辉羲从去年4月份成立,我们是做车载智能计算芯片,电动化是变成智能化的一个非常大的基础,智能化的话一定是AI或者这种智能计算是一个核心。辉羲的特点,也是能够把智能计算做得非常好。
在中国新能源车已经渗透率达到30%,有了一个大规模智能化的基础,我们(辉羲)就是用一个数据闭环来定义上面的芯片。因为有这么多的智能车一定能够获得非常多的数据,这些数据能够产生更好的算法,然后更好的算法需要更好更大算力的芯片,这个闭环一旦转起来会越来越快。
今年的话,我们的第一款芯片基本上就会告诉大家长什么样,然后明年会跟我们的主要客户会上车。今年芯片,明年上车。
慕容素娟:这款芯片属于车载芯片,它验证的周期什么样的?
徐宁仪:证周期是需要做完整的车规级的这种芯片。我们辉羲拿到了车规的功能安全的ASIL D级别的认证,就是最难的认证。
德国的SGS是一个非常严格的认证机构,他说辉羲在这方面的理解和实施都非常的深。第一,它是一个非常长而且非常严谨的过程。第二我们投入非常大的精力去把车规的这些认证全部去做完。第三个我们做的非常的快,因为是一些业界最好的工程师,我们一起来把这个车规的整个认证来把它做到。
03
中国AI大模型一定能做出来
慕容素娟:ChatGPT是从美国发起,创新又是这么快的速度在推进,怎么在这种现状下,尽我们的力来做一些准备和应对?
徐宁仪:现在创新的速度在非常快的叠加,你只有一个视角是不够的,要有创新的视角、产业的视角、研究的视角,这一切视角结合起来,我悲观的话才有可能活下来。
在中国好多组织都在做自己的大模型,从国家级的然后到北京的,然后还有几家大的这种像百度腾讯都在做,还有一些创业公司都在做。第一个肯定会做出来的,我觉得会慢,但是肯定会做出来,而且是一个追赶的态势。
04
创新创业内核相通
慕容素娟:徐总您在微软时做硬件架构,到后来您去百度又做昆仑芯片,后面去AI四小龙商汤做他们的首席科学家,现在又创业做辉羲。去年的时候有17个投资机构跟投一家,当时有了解到说投资哪个投资机构能投到你们,他们就引以为豪,说明咱这个项目大家非常看重,也说明潜力非常大。
我想表达意思就是,您看您在职业生涯里面,我就觉得您不断的在升级,不断在突破,就想问一下您的这种创新的意识是怎么形成的?
徐宁仪:感谢您的问题,也是我自己有的时候也在想,其实对我影响非常大的,这就是周祖成教授我的(博士)导师。
我现在还清楚的记得,当时我上研究生的课程,周老师讲VHDL语言,他其实60多岁的年纪还是自己在写网表,还在一线编程,其实再往前走的话就是集成电路,像用这种语言来设计,在此之前是画图,周老师一直是非常早的接触这些这种先进的生产力所以我想周老师的行为也是言传身教,影响了我。
在微软的话,我当时是想说微软是最厉害的软件公司,有很多算法需要做得非常快,所以我有很多芯片的这种基础的能力就能够非常好的结合。
然后,深度学习时代大浪潮来临,我想一定需要这种非常好的AI芯片,当时百度的话有这么一个机会,所以我说我一定要跳进去,在百度的话来做昆仑芯片,跟同事们一起。
百度这件事情做得差不多之后,我们看整个产业的浪潮又觉得这种计算机视觉的芯片化非常重要,商汤又是这种领先的计算机视觉的人工智能公司,我觉得这件事情可能在商汤做更合适。
当然后来的话我又创立了辉羲智能,也是觉得在新能源车智能化的浪潮里边需要更好的芯片,所以我说我们要跟志同道合的志士一起来做这件事情。
我想有一个主线,就是系统的发展、应用的发展会反过来定义芯片,周老师(博导)一直在讲两件事情,第一件事情他在学校的时候跟我们讲叫算法的结构映射是芯片的关键,就有一个算法,有一个协议要做到芯片,这件事情是需要打通的,这个打通是我们学电子、学微电子的人需要一起来做的。
第二件事情就是由电子的系统级设计,一定是系统引领着芯片在往前进,所以我自己工作的这么一些主线,我觉得是跟着电子系统的前沿在往前走,至于是在哪家公司不重要,一定是来做前沿的事情。所以很多创新我们觉得是算法、系统和芯片三位一体的这种联合的创新,我觉得是回答这个时代的一些挑战的最重要的底层逻辑。
慕容素娟:虽然是在不同的企业,其实最终就说这些企业是表象的,本质上就是您对技术创新这一块的一个理解,所以您会这样不断的来去升级和突破,对吧?
所以我就想,包括很多人他的角色可能最早他是企业家,后来变成作家或者变成教授等等,他表面上是不同的身份,但是内在其实就是源于他自己对他看重的事情的不断的追求才做的。
徐宁仪:你讲得非常好。我觉得底层逻辑是一致的,因为创新创业我觉得内核是相通的。