针对 AI 推理算力逐步下沉至终端设备的行业趋势,英伟达CEO黄仁勋提出,智能手机早已形成分布式算力架构,部分运算在本机终端运行,剩余算力交由云端处理,该架构后续也会成为 AI Agent 的主流运行模式。他称,能够本地化处理的任务优先在终端设备运行,此举可以压缩成本、减少响应时延,同时实现更优质的定制化使用体验;未来 AI 模型可在笔记本电脑、工作站乃至 DGX Spark 等硬件上常驻运行,搭建全天候在线的 AI 智能体。黄仁勋指出,人工智能时代将迈入解耦分布式计算架构,未来 AI 算力负载会拆分部署在云端、企业内网与各类终端设备中,并实现互联互通、无缝协同。对于终端用户而言,无需知晓算力实际承载位置,只需享受最优的 AI 服务与使用体验。