发布日期:2025/2/12 15:50:34 访问次数:13580
2月11日,专注AI基础设施研发的“清华系”企业无问芯穹宣布获七家国产芯片支持,正打通DeepSeek-R1、V3在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七个硬件平台的多芯片适配优化,目前开发者已经可以通过Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构国产算力服务。
自春节前夕爆火,DeepSeek已牵动了国内超30家云服务商与近20家芯片企业宣布接入,大家纷纷“抢食”由DeepSeek引发的流量蛋糕。随着无问芯穹宣布获7家国产芯片鼎力支持,多芯片适配的DeepSeek-R1入场,DeepSeek为可控国产算力撬动的历史机遇正变得愈发清晰。
国产的大部分模型是通过国际主流芯片(如英伟达)训练得到,尚未与国内的AI系统、芯片形成闭环生态。无问芯穹联合创始人、CEO夏立雪认为, DeepSeek的突破激发了越来越多的下游应用创造力,未来行业日均tokens(token是大模型中可以理解和生成的最小意义的单位)消耗量将达到百万亿级别,不仅将激发国产芯片的市场需求,也为打造全国产AI产业闭环,实现更可控的自主算力发展创造了有利条件。
在美国,模型、系统、芯片已经形成闭环生态。以英伟达为例,其GPU的主流地位与CUDA(英伟达的GPU编程平台)生态有直接关系,CUDA的护城河是软件堆栈,可以让研究人员和软件开发者更好地在GPU上编程和构建各种各样的应用,牵引下一代芯片的迭代方向。不过,由于Transformer架构逐渐成为主流技术方案,开发实际应用的大模型时所需的算子数量明显减少,这使得英伟达依靠CUDA技术建立的技术壁垒优势正在逐渐减弱。
“DeepSeek作为开源模型,其之于AI 2.0时代,正如Android(安卓)之于移动互联网革命,将重构整个产业生态,引发链式反应,广泛调动起跨越软硬件和上下游的生态,一起加大投入‘模型-芯片-系统’协同优化和垂直打通,从而继续‘打薄CUDA生态’。某种程度上来说,CUDA已经是历史了”。夏立雪举例,这类协同优化工作包括根据新一代模型架构来定义未来芯片的底层电路,以及根据国产AI系统的互联通信方式来设计高效的混合专家模型结构等。
据悉,无问芯穹核心技术团队源自清华大学纳米集成电路与系统实验室能效计算组。成立以来,其致力于在国内算力市场格局相对分散、高端算力受限的情况下,实现不同模型和不同硬件之间的统一部署和联合优化,像“淘宝”一样把各种不同的模型和算力资源统一起来,变成一套标准化服务。
夏立雪表示,通过打通DeepSeek-R1、V3在国产硬件平台的多芯片适配优化,希望进一步团结从模型到芯片的上下游产业伙伴,在打造“国产模型+国产算力+国产系统+国产应用”全国产化AI产业链的进程中起到牵引带动作用,集中优势资源,支持模型性能长足进步,推动中国AI自主可控长远发展,为人工智能行业发展筑牢算力基础。