对话戴尔科技：智能体时代，企业技术转型要避开哪些坑？

1 个月前

AI资讯

33 阅读

智能体企业转型算力误区戴尔科技

算力“军备竞赛”是最大误区？戴尔CTO：16块GPU就能服务4万员工

许多企业一谈AI转型就陷入“堆GPU”的狂热，动辄规划千卡集群。但戴尔内部规模最大的AI工作负载仅使用16块GPU，却支撑了4万名员工的日常使用。罗斯指出，企业AI部署的重心在于推理而非训练——智能体不涉及训练，只需推理能力，而推理所需算力远低于训练阶段。对于每个工作负载或智能体项目，通常只需少量GPU，有时半块就够。他警告，外界流传的“企业需要数千块GPU”的说法是彻头彻尾的误解。

智能体架构的隐藏陷阱：GPU不能单打独斗，CPU和GPU必须“二比一”配平

当企业从聊天机器人切换到智能体模式时，算力结构发生了根本性变化。聊天机器人对CPU负载很轻，但AI智能体需要调用外部工具、通信协议和知识图谱，这些组件并不天然存在于GPU中。罗斯强调，智能体模式下CPU与GPU的数量比例非常接近，大约每两块GPU对应一个CPU。你不能只堆叠GPU来构建AI基础设施，而必须将GPU与传统CPU算力结合起来。否则，GPU会因等待数据而闲置，你花钱购置的算力资源将白白浪费。

对话戴尔科技：智能体时代，企业技术转型要避开哪些坑？

数据瓶颈：你的存储系统正在让GPU“挨饿”

将标准数据存储系统简单挂载到AI计算集群上，是当前企业最常见的错误。罗斯直言，性能瓶颈之一在于数据无法足够快地传输到GPU以完成计算。为降低这一延迟，戴尔的AI数据平台已接入Nvidia的Cuda-X接口，使数据层服务能够直接以GPU的速度运行。此外，私有模型的部署选项也日益丰富——你可以在虚拟私有云、自有数据中心或完全隔离的环境中使用它，而一年前只有API调用一种选择。

成本失控的根源：别让顶级模型吃掉你的利润

单个Token的成本预计会随时间下降，但“AI的使用成本不存在变得更低廉的路径”。罗斯以规范驱动开发为例：如果智能体框架产生大量编码任务并盲目地全部发送给顶级模型，企业最终将面临高昂的账单。他建议采用模型路由策略——将复杂规划任务交给高性能前沿模型，将常规编码交由本地运行的小型开源模型（运营成本仅为电力费用）。一个软件开发项目可能存在四五种不同的经济路径，合理的路由策略能帮企业实现最优的整体经济效益，这将成为企业的核心竞争优势。

最难的不是技术，而是人：CTO坦言50%的时间花在组织变革上

戴尔对公司内部6400个岗位进行审计后发现，每一个岗位都将因AI智能体而发生变化。罗斯将传统工作描述为“工作容器”，其中包含日常事务、效率提升、协调配合和专业任务。智能体无法承担一份完整的工作，但能高效完成特定类型的任务。他提问：“如果容器现在只装了一半，我是需要减少一半的员工，还是把剩余空间填满更多内容？”过去四个月里，他有50%的时间都在处理人的问题。AI已不再是一个技术讨论或投资回报率讨论的话题，它更多是一个关于组织与人的动态变化的讨论——除非你完全理解如何引导身边的人去适应这些变化，否则你根本无法有效使用这些工具。

对话戴尔科技：智能体时代，企业技术转型要避开哪些坑？

算力“军备竞赛”是最大误区？戴尔CTO：16块GPU就能服务4万员工

智能体架构的隐藏陷阱：GPU不能单打独斗，CPU和GPU必须“二比一”配平

数据瓶颈：你的存储系统正在让GPU“挨饿”

成本失控的根源：别让顶级模型吃掉你的利润

最难的不是技术，而是人：CTO坦言50%的时间花在组织变革上

链接失效反馈