当前标签:[大模型
AI真能搞钱了!这家公司把大模型玩成闭环赚钱机器
AI真能搞钱了!这家公司用因果大模型构建销售智能体闭环,实现规模化盈利。
DeepSeek不惜代价保住它!V4关键特性被挖出来了
DeepSeek V4通过“batch invariance”设计实现模型在复杂工程链路中的一致性输出,代价是牺牲GPU利用率和推理速度。
DeepSeek-V4-Pro 旗舰模型限时 2.5 折优惠官宣延期,活动持续至今年 5 月 31 日
DeepSeek-V4-Pro 旗舰模型 2.5 折优惠活动延期至 5 月 31 日,继续提供超低价格。
最强大模型,保质期越来越短了
最强大模型的"统治期"正在急速缩短,技术优势转瞬即逝。
大模型上车,消费者说呵呵
车载大模型在2026年全面铺开,但消费者体验落差显著,普遍反馈“说呵”。
DeepSeek-V4 技术报告公开作者名单,多位核心骨干离职去大厂
DeepSeek发布V4技术报告,作者名单中10人标注“已离职”,其中多位核心骨干流向腾讯、字节等大厂。
超越DeepSeek-V4,罗福莉交出小米最强开源模型,首日适配5家国产芯片
MiMo-V2.5系列开源首日完成7家芯片适配,性能超越DeepSeek-V4-Pro。
DeepSeek不需要永远强,它只需证明这条路走得通
DeepSeek V4的价值在于证明国产大模型路径的可行性,而非追求长期绝对领先。
SafeGPT
SafeGPT是一个专注于大型语言模型应用测试与监控的工具,致力于提升模型应用的安全性与可靠性。
比预期还要高60% DeepSeek V4参数量有望达到1.6万亿
DeepSeek V4的参数量或将达到1.6万亿,远超市场预期,成为国产大模型技术新标杆。
阿里千问 Qwen3.6-35B-A3B 开源发布:30 亿激活参数实现顶尖智能体编程能力
阿里千问 Qwen3.6-35B-A3B 开源发布:30 亿激活参数实现顶尖智能体编程能力
匿名模型“大象”搅局OpenRouter:100B参数冲到热榜第一,实测结果如何
Elephant匿名模型凭借100B参数量和性能优势,上线首日迅速登上OpenRouter榜单前列。
大模型发力知识可视化交互:ChatGPT、百度、Gemini 均已上线
知识可视化交互正成为大模型竞争新高地,ChatGPT、Gemini 及百度等主流平台已陆续上线相关功能。
你等的DeepSeek,早已变了
你等的DeepSeek,早已变了,但不是以你期待的方式。
大模型吞噬Word
智能化办公进入新时代,大模型开始全面渗透传统办公软件。
大模型的有脑和无脑
大模型在人工智能领域的崛起引发了对其“有脑”和“无脑”特性的广泛讨论。
DeepSeek能否扛住 V4冲击波,得问代达劢
DeepSeek能否在V4版本发布后承受住市场和技术的冲击,关键在于其基础设施负责人代达劢的布局与应变能力。
从大模型到Agent的跨越难度,正被整个行业严重低估
摘要:从大模型到Agent的跨越不仅是技术升级,更是一次从静态智力到动态生产力的范式转变,而这一过程的难度远超行业预期。
智谱 GLM-5.1“Day0”上线华为云,在昇腾算力上实现 Layer 级 MOE 绝对均衡
智谱GLM-5.1“Day0”版本在华为云上线,实现昇腾算力下的Layer级MOE均衡。
定价权VS消耗战:大模型下半场的续命法则
大模型行业正分化为两大路线:降价派以极致低价换取生态规模,降耗派则追求端侧效率优化。
智谱GLM-5.1“Day0”上线华为云,可通过多款产品体验
智谱新一代大模型GLM-5.1在发布当天(Day0)上线华为云,用户可通过多款产品体验其强大功能。
智谱发布可持续工作 8 小时的旗舰模型 GLM-5.1,同时提价 10%
国产大模型智谱AI发布GLM-5.1,支持8小时长程任务并提价10%
DeepSeek V4发布在即:灰度测试曝光全新界面,多模态版本确凿无疑
DeepSeek V4即将发布,灰度测试曝光三款型号与多模态能力。
持续霸榜!阿里千问3.6Plus问鼎全球大模型调用周榜冠军
持续霸榜!阿里千问3.6Plus凭借4天日榜第一,登顶OpenRouter全球大模型调用周榜冠军,单日调用量突破1万亿Token。
谁是美国大模型第一股?
全球大模型第一股的称号最终归属于智谱AI,其成功登陆港股并首份财报引发行业广泛关注。
1.4 万亿词元!阿里 Qwen3.6-Plus 刷新全球最大 AI 聚合平台 OpenRouter 日调用量纪录
阿里Qwen3.6-Plus日调用量1.4万亿词元,创OpenRouter平台全球新纪录。
DeepSeek瘫痪12小时,国产大模型的算力已经跟不上野心了?
国产大模型服务商DeepSeek遭遇长达12小时服务中断,引发行业对算力基础设施与技术野心之间匹配度的深入反思。
小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求
小米MiMo大模型推出Token Plan,通过单一订阅支持全模态Agent任务调用。
全球权威大模型盲测榜单公布,阿里千问3.6登顶中国最强编程模型
全球权威大模型盲测榜单Code Arena最新排名发布,Qwen3.6-Plus凭借卓越的编程能力登顶国产模型榜首,并位居全球第二。
豆包大模型日均Token使用量超120万亿,Seedance 2.0 API开启公测
豆包大模型日均Token使用量突破120万亿,Seedance 2.0 API公测开启。