当前标签:AI模型

Veo 3

Veo 3

Veo 3是Google推出的先进AI视频生成工具,支持将文本或图像转化为高质量视频。

微软加速打造自研尖端AI模型,目标明年具备最先进图文、音频处理能力

微软加速打造自研尖端AI模型,目标明年具备最先进图文、音频处理能力

微软加速打造自研尖端AI模型,目标明年具备最先进图文、音频处理能力

seedancetwo2.0

seedancetwo2.0

懂你意思的视频模型,提供个性化内容生成与智能视频制作服务。

阿里巴巴图像生成与编辑统一模型 Wan2.7-Image 发布,号称更具“活人感”

阿里巴巴图像生成与编辑统一模型 Wan2.7-Image 发布,号称更具“活人感”

阿里巴巴发布全新图像生成与编辑统一模型Wan2.7-Image,声称在生成图像中注入“活人感”,大幅优化人物神态、光影与细节表现。

Sora

Sora

Sora是一个由OpenAI推出的先进AI视频生成模型,能够根据文本描述生成高质量、时长较长的视频内容。

为什么数据质量成为人工智能领域最重要的问题

为什么数据质量成为人工智能领域最重要的问题

数据质量是人工智能发展的基石,决定了模型的可靠性与商业价值。

Scale AI

Scale AI

更好的数据会带来更好的性能,Scale AI致力于提供高质量的人工智能数据标注服务,助力机器学习模型的精准训练。

Tnkr AI

Tnkr AI

Tnkr AI是一个面向未来的机器人开发生态系统,致力于为开发者提供全面的工具与平台支持。

2700GB高质量数据,训出空间智能SOTA,背后秘诀全栈开源

2700GB高质量数据,训出空间智能SOTA,背后秘诀全栈开源

2700GB高质量数据训练出空间智能SOTA,背后全栈开源策略功不可没。

OpenAI和Anthropic世纪联手,codex-plugin-cc震动AI圈,两大巨头开放王炸产品

OpenAI和Anthropic世纪联手,codex-plugin-cc震动AI圈,两大巨头开放王炸产品

近期,AI行业因OpenAI与Anthropic的一系列协同发布和动态而引发广泛关注。尽管“codex-plugin-cc”并非某一官方产品的标准命名,但结合Opus 4.6与5.3-Codex的同日发布,以及OpenAI对Codex技术架构的深度揭秘,市场确实感受到了新一轮的技术震动。

Replicate

Replicate

Replicate 是一个开源 AI 模型的共享社区与云平台,便于开发者通过 API 调用、部署和微调模型。

阿里云百炼deepseek满血版

阿里云百炼deepseek满血版

阿里云百炼推出的DeepSeek-R1满血版,提供零门槛的云端部署与即刻可用的高性能AI模型服务。

CogAgent

CogAgent

CogAgent是智谱AI与清华大学联合研发的专注于图形用户界面(GUI)理解与操作的多模态大模型。

小米mimo

小米mimo

小米mimo是由小米全栈自研的AI模型家族,整合旗舰基座、全模态理解与高质量语音合成能力。

Meta 开源全新 AI 模型 TRIBE v2,精准预测人类大脑多模态反应

Meta 开源全新 AI 模型 TRIBE v2,精准预测人类大脑多模态反应

Meta最新发布的TRIBE v2模型是一个能够根据视觉和听觉刺激精确预测人脑活动模式的开源AI系统。

全网疯传:Claude最新模型意外曝光:全面碾压Opus 4.6,强到让Anthropic不敢发布

一篇关于Claude新模型的爆料文章在网络引发热议,声称存在远超现有版本的隐藏模型,但其真实性存疑,可能源于对模型迭代和市场策略的误读。

刚刚,Anthropic王炸Claude泄露,全面碾压Opus 4.6引爆全网

刚刚,Anthropic王炸Claude泄露,全面碾压Opus 4.6引爆全网

一次重大人为配置失误,导致 Anthropi 尚未发布的下一代旗舰模型 “Claude Mythos” 绝密细节意外泄露,其代号为 “Capybara”。

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语

美团发布开源原生多模态大模型 LongCat-Next,统一语言、视觉与语音,让AI像理解文本一样自然地理解世界。

Cursor滑跪开源技术报告:Kimi基模这样微调能干翻Claude

Cursor在其最新的Composer 2模型中被发现是基于Kimi K2.5进行微调而非纯自研,揭示了高估值AI公司与底层模型提供商之间复杂的技术依赖关系;此次事件中,Cursor通过特定的拒绝机制与微调技术,在使用国产基模的情况下在编程场景中实现了接近Claude的性能表现,引发业界对“套壳”定义与核心竞争力的讨论。

谷歌发布最高质量音频模型Gemini 3.1 Flash Live,低延迟、高精度响应,打造实时语音交互新范式

谷歌发布最高质量音频模型Gemini 3.1 Flash Live,低延迟、高精度响应,打造实时语音交互新范式

谷歌正式发布了Gemini 3.1 Flash Live音频模型,该模型在低延迟和高精度方面表现卓越,旨在为实时语音交互领域树立新的行业标杆,结合了极高的性价比和处理高吞吐量任务的能力。

聊聊 Token 出海的生意经:模型开源给世界,中国赚什么?

中国开源大模型通过技术与成本优势,正成为全球AI应用的底层“基础设施”,而中国通过Token出海和参与技术标准制定,在供应链中实现深度变现与话语权争夺。

从现在开始,得像研究DeepSeek一样严肃研究Kimi

从现在开始,得像研究DeepSeek一样严肃研究Kimi,因为其K2.5模型已在编程领域超越巨头,并成为全球开源生态的中流砥柱。

Phenaki

Phenaki是基于文本提示生成可变时长视频的AI模型。