“AI的技术和发展在端侧进一步得到了快速释放,我们认为端侧生成式AI的时代已经到来。”近日,此芯科技创始人、CEO孙文剑在公司AI PC战略暨首款芯片发布会上表示。
AI PC带来投资新热潮?
2016年,Google的Alpha Go带领AI进入深度学习的1.0时代,计算机视觉和自然语言处理得到了应用和发展;2022年OpenAI的ChatGPT将AI引领到深度学习2.0时代,生成式AI快速发展。
如今,用户对于能效、数据隐私、个性化的需求越来越多,孙文剑认为,端侧的设备将充当重要的锚点。端侧智能设备非常丰富,包括PC、手机、车载以及未来的元宇宙、机器人等。其中,PC作为一个重要的生产工具、学习工具、娱乐工具,在人们的工作、生活当中扮演了不可或缺的角色,可以说是人类过去40年最重要的发明之一。
PC产业经历了很多爆发式发展的时刻:20世纪90年代初,从命令行到图形界面,让PC快速在人类社会中得以普及,PC产业迎来了第一波小高潮。随后,PC融合了互联网,PC成为人与人、人与虚拟世界之间交互的桥梁,PC产业再次迎来快速发展,电子政务、互联网金融等一系列PC与互联网融合的应用应运而生。
到了2024年,有人认为端侧AI爆发的元年来临了。这一年,华为在鸿蒙生态春季沟通会上发布了MateBook XPro,首次应用了华为盘古大模型;荣耀发布了首款AI PC产品MagicBook Pro 16;联想举办了“AI for All,让世界充满AI”发布会,更新了AI相关业务;微软发布了新一代Copilot+PC;苹果在2024全球开发者大会(WWDC2024)上宣布了其人工智能计划,为用户提供个性化的智能助手体验。
麒麟软件副总经理朱晨在此芯科技AI PC战略暨首款芯片发布会上表示:“前两年大家看统计报告会很焦虑,PC的出货量连续下降,好几年都不见起色。但是近两三个季度PC的出货量在不断上涨,其原因就是因为AI PC的概念出现了。”
国际数据公司(IDC)日前发布的报告显示,2024年第二季度全球PC出货量达到6490万台,同比增长3%。这是全球传统PC市场在连续七个季度下滑后,今年内实现的第二个季度正增长。IDC认为,这主要得益于AI PC的兴起和企业商用更新周期。
“我觉得AI,尤其生成式AI给PC产业的应用生态打开了一扇窗。这是AI芯片第一次融入到主板,赋予每个应用搭载AI的机会,各种各样的创新将诞生。”朱晨认为,“我相信AI PC的出现,不管对国内还是国际的PC产业都将迎来新一轮的投资热潮。”
生成式AI对芯片提出更高要求
对于AI PC的定义,每个科技巨头的定义都不尽相同,但芯片无疑是最核心的部分。去年9月,英特尔CEO帕特·基辛格在硅谷提出了AI PC的概念,并在去年年底推出的酷睿Ultra系列处理器中首次集成NPU。今年6月,英特尔又正式公布代号为“Lunar Lake”的下一代移动处理器,集成了全新的第四代NPU内核,能够提供48 TOPS的AI算力。
今年5月,微软发布了“有史以来速度最快、最智能的 Windows PC”Copilot+PC这一全新AI PC品类,微软划定的标准是,每台Copilot +PC都需要一个至少能够处理40TOPS的NPU。
AMD认为AI PC应该是CPU、GPU和NPU的结合,AMD在去年给Ryzen Mobile 7040系列处理器的部分型号配置了NPU,能提供最高10TOPS的算力。今年6月,AMD又发布了其第三代AI PC处理器:锐龙AI 300系列,NPU部分则升级到全新的AMD XDNA 2架构,与上代相比,AI 处理能力上升3倍,达到了50 TOPS。
高通近年来一直在耕耘ARM PC,去年10月就向桌面平台推出了骁龙X Elite系列处理器,这款处理器最大的亮点在于其NPU算力达到45 TOPS。
本次此芯科技发布的P1芯片作为国产新一代AI PC算力底座,内置了12核CPU,10核GPU以及30TOPS算力NPU,此芯科技联合创始人、系统工程副总裁褚染洲介绍:“P1芯片已经基本满足大部分的需求,若还不够的话,此芯平台可以通过PCIE Gen4扩展的独立GPU和独立NPU来进一步提升异构算力,没有天花板,这是我们的优势。”
生成式AI在对硬件提出更高要求的同时,也对其算力、能效以及软硬件协同等方面提出了新要求,结合各种算力单元的算力底座成为关键。孙文剑表示:“三年前我们在做产品定义的时候,就把PC当成我们的主场景,利用AI技术打造新一代的算力方案。我们也在思路上逐步形成了新一代AI PC算力底座的五大特征。”
孙文剑提到的第一个特征就是异构,可以充分利用不同算力引擎的优势,为算力底座打造高性能的基础设施中心。第二个是高能效,端侧的算力底座不同于数据中心的算力底座,对于算力方案能效比有比较大的容忍度;端侧用户对于产品的便携性和待机时长、工作时长有更高的要求,所以算力底座需要借助一切低功耗设计手段,让算力底座变得更加高效。第三个是生态,算力底座不仅仅是一个芯片,一定要融合操作系统、大模型对软件进行适配,构建丰富的软硬件开放系统,而在硬件上面也要结合电源管理芯片、存储芯片,最终形成一个完整的生态,赋能开发者。第四个是端云融合,人工智能发展的大趋势是端云混合的人工智能,作为终端的算力底座在发挥本土优势的同时一定要考虑如何与云端进行更灵活的融合,让用户基于端云一体的算力方案来解决自己生产、工作当中的问题。第五个是安全,不管作为个体用户自己的数据,还是作为企业的销售、财务的数据,都需要在算力底座层面乃至软硬件层面得到有效的安全保障。
生成式AI在端侧跑起来仍不简单
随着AI的快速发展,应用场景也在百花齐放,可以帮助用户管理PC上面的文档、图片、视频、邮件,以及更多格式的文件,帮助用户快速上手、高效使用PC上的各种功能,根据不同使用场景自动调节PC性能……但方便快捷的背后,是海量文件的解析、推理和数据维护工作,AI PC仍然面临着许多挑战。
“对操作系统来讲,生成式AI能在端侧跑起来,不是一件简单的事情。”朱晨表示,目前很多模型、算力芯片或者框架是烟囱式全耦合结构,应用软件使用不顺可以卸载更换,但要换一个本地大模型却并不容易。而且为了实现不同功能,可能需要搭载多个大模型,“文生文、文生代码、文生图可能需要3个不同的模型,需要3个不同的烟囱式全耦合结构,机器都装不下这些模型了。”
因此对于操作系统而言,想做好端侧生成式AI,就要提供一个公共、开放的平台,让最终用户自由选择模型,在操作系统上面像软硬件解耦一样,实现模型、硬件和应用之间的三层解耦。
联想集团首席研究员颜毅强也认为:“目前来说,需要做好中间软件层的工作,才能彻底把算法、模型跟应用的开发者做解耦,这层解耦做完以后,我们所有的开发者,而不是仅仅在做NPU或者是做模型的这些人,才能在NPU上部署一个大模型,所有人都能有利用大模型能力。”
此外,限于规模定律(Scaling Law),AI PC搭载的模型尺寸通常在10B以下,能力受到了一定的限制。“在一些复杂生成类的场景,如文生视频或者是大尺寸文生图时,本地的模型能力可能满足不了需求,所以云端结合在今天以及可预见的两三年里,还是一个很重要的话题。”颜毅强说道。