当前标签:模型优化

无需强化学习,苹果团队“简单自蒸馏”,实现Coding模型自进化

无需复杂机制,苹果团队提出简单自蒸馏方法,有效提升代码生成能力

谷歌Gemma 4实测:手机断网也能用,但逻辑题竟全军覆没

谷歌Gemma 4实测:手机断网也能用,但逻辑题竟全军覆没

手机端AI推理能力大幅提升,但逻辑处理仍存短板。

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队提出分层索引稀疏注意力机制HISA,在超长文本处理中实现2-4倍速度提升,且保持模型精度。

Manifest

Manifest

Manifest 是一个专为 OpenClaw 设计的开源 LLM(大语言模型)路由工具,能够通过智能模型路由帮助用户节省高达 70% 的计算成本。

LLMEval3

LLMEval3

LLMEval3是一个由复旦大学NLP实验室推出的综合性大模型评测基准平台,旨在为研究人员和开发者提供科学、系统的评估工具和标准。

Claude终于承认乱扣费,最高多收你20倍,一句「你好」干掉13%额度

Claude AI 计费机制引发争议,用户反映使用成本激增

Humanloop

Humanloop

Humanloop 是一个帮助开发者更高效构建、评估和优化 GPT-3 等大语言模型应用的平台。

单张显卡跑出15倍推理速度,aiX-apply-4B小模型加速企业AI研发落地

单张显卡跑出15倍推理速度,aiX-apply-4B小模型加速企业AI研发落地

aiX-apply-4B模型以极低算力成本实现15倍推理速度提升,将原本依赖高端集群的大模型推理任务压缩至单张消费级显卡,显著降低企业AI部署门槛并加速研发落地。

Nvidia Builder

Nvidia Builder

NVIDIA Builder 是一个帮助开发者与企业快速部署及优化 AI 模型的平台,提供 NVIDIA NIM APIs。

deepseek提示词

deepseek提示词

deepseek提示词|官方提示词合集,汇集R1与V3模型的全部官方指令,覆盖13个场景与30道精研指令,即刻提升AI交互效率。