对话戴尔科技:智能体时代,企业技术转型要避开哪些坑?
算力“军备竞赛”是最大误区?戴尔CTO:16块GPU就能服务4万员工
许多企业一谈AI转型就陷入“堆GPU”的狂热,动辄规划千卡集群。但戴尔内部规模最大的AI工作负载仅使用16块GPU,却支撑了4万名员工的日常使用。罗斯指出,企业AI部署的重心在于推理而非训练——智能体不涉及训练,只需推理能力,而推理所需算力远低于训练阶段。对于每个工作负载或智能体项目,通常只需少量GPU,有时半块就够。他警告,外界流传的“企业需要数千块GPU”的说法是彻头彻尾的误解。
智能体架构的隐藏陷阱:GPU不能单打独斗,CPU和GPU必须“二比一”配平
当企业从聊天机器人切换到智能体模式时,算力结构发生了根本性变化。聊天机器人对CPU负载很轻,但AI智能体需要调用外部工具、通信协议和知识图谱,这些组件并不天然存在于GPU中。罗斯强调,智能体模式下CPU与GPU的数量比例非常接近,大约每两块GPU对应一个CPU。你不能只堆叠GPU来构建AI基础设施,而必须将GPU与传统CPU算力结合起来。否则,GPU会因等待数据而闲置,你花钱购置的算力资源将白白浪费。

数据瓶颈:你的存储系统正在让GPU“挨饿”
将标准数据存储系统简单挂载到AI计算集群上,是当前企业最常见的错误。罗斯直言,性能瓶颈之一在于数据无法足够快地传输到GPU以完成计算。为降低这一延迟,戴尔的AI数据平台已接入Nvidia的Cuda-X接口,使数据层服务能够直接以GPU的速度运行。此外,私有模型的部署选项也日益丰富——你可以在虚拟私有云、自有数据中心或完全隔离的环境中使用它,而一年前只有API调用一种选择。
成本失控的根源:别让顶级模型吃掉你的利润
单个Token的成本预计会随时间下降,但“AI的使用成本不存在变得更低廉的路径”。罗斯以规范驱动开发为例:如果智能体框架产生大量编码任务并盲目地全部发送给顶级模型,企业最终将面临高昂的账单。他建议采用模型路由策略——将复杂规划任务交给高性能前沿模型,将常规编码交由本地运行的小型开源模型(运营成本仅为电力费用)。一个软件开发项目可能存在四五种不同的经济路径,合理的路由策略能帮企业实现最优的整体经济效益,这将成为企业的核心竞争优势。
最难的不是技术,而是人:CTO坦言50%的时间花在组织变革上
戴尔对公司内部6400个岗位进行审计后发现,每一个岗位都将因AI智能体而发生变化。罗斯将传统工作描述为“工作容器”,其中包含日常事务、效率提升、协调配合和专业任务。智能体无法承担一份完整的工作,但能高效完成特定类型的任务。他提问:“如果容器现在只装了一半,我是需要减少一半的员工,还是把剩余空间填满更多内容?”过去四个月里,他有50%的时间都在处理人的问题。AI已不再是一个技术讨论或投资回报率讨论的话题,它更多是一个关于组织与人的动态变化的讨论——除非你完全理解如何引导身边的人去适应这些变化,否则你根本无法有效使用这些工具。