当前标签:多模态

微软、谷歌同日发布新AI模型:语音、图像与本地开源能力齐上阵

微软与谷歌于同日发布全新AI模型,语音识别、图像生成及本地开源能力全面升级。

Seedance 2

Seedance 2

Seedance 2是一款多模态AI视频生成器,支持通过文本、图像、视频和音频等多种输入方式,创作出电影质感强且高度可控的视频内容。

Medeo Seedance 2.0

Medeo Seedance 2.0

Medeo Seedance 2.0 是一款多模态AI视频生成工具,通过自然对话方式帮助用户高效制作高质量视频内容。

悟道

悟道

智源“悟道”是中国首个且规模最大的人工智能超大规模模型,由北京智源人工智能研究院牵头研发。

自由画布

自由画布

自由画布是一个集智能生成、多模态编辑与团队协作为一体的一站式AI创作平台,覆盖文、图、音、视全媒介内容生产。

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

阿里发布Qwen3.5-Omni,多模态能力超越Gemini-3.1 Pro

阿里发布Qwen3.5-Omni,在多模态能力上超越了谷歌的Gemini 3.1 Pro,同时在推理效率和成本控制上实现了重大突破。

Aibiye降AIGC率

Aibiye降AIGC率

Aibiye是一款利用Multimodal与GTC全球思维链技术,智能优化学术论文及技术文档的AI生成降重工具。

Aibiye-Ai论文生成(专业版)

Aibiye-Ai论文生成(专业版)

Aibiye-Ai论文生成(专业版)是一款利用先进的Multimodal+Global Thought Chain语言模型,帮助用户高效生成连贯、一致且逻辑性强的长文本技术文档的智能工具。

千问-阿里AI助手

千问-阿里AI助手

通义千问是阿里云推出的新一代大语言模型系列,具备强大的自然语言理解与多模态内容生成能力。

lobechat

lobechat

lobechat 是一个整合多种 AI 模型并支持视觉识别的智能聊天助手。

商汤日日新大模型

商汤日日新大模型

商汤日日新大模型是一个集文生图、语音、图文与视频理解能力于一体的多模态AI开放平台。

阶跃星辰开放平台

阶跃星辰开放平台

阶跃星辰开放平台是一个基于自研多模态大模型,为企业和开发者提供全方位 AI 解决方案与服务的平台。

讯飞翻译

讯飞翻译

讯飞翻译是科大讯飞推出的基于AI的多模态智能翻译平台,提供文本、语音、图片、文档等多形式内容的即时互译服务。

MagicAvatar

MagicAvatar

MagicAvatar是一个多模态虚拟人生成框架。

国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了

国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了

国产AI天工近日发布全模态大模型,正式亮剑世界模型领域,标志着国产玩家在多模态技术路线上实现了从文本、图像到世界交互能力的系统化整合与顶尖突破。

SkyWork AI

SkyWork AI 是一个集文本、表格、图片、音频和网页于一体的全能型AI办公助手。

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语

美团发布开源原生多模态大模型 LongCat-Next,让视觉和语音成为 AI 的母语

美团发布开源原生多模态大模型 LongCat-Next,统一语言、视觉与语音,让AI像理解文本一样自然地理解世界。

从Token到词元:全模态时代的基模与交互入口

从Token到词元:全模态时代的基模与交互入口

Token作为AI处理的最小单元,其定义正从文本词元扩展至统一承载多维感知信息的“词元”,这一演进由模思智能等推动,并与Agent应用和Token经济爆发共同重塑AI的基模、交互入口与产业成本结构。

Gnomic-智能体平台

Gnomic-智能体平台

Gnomic智能体平台是一个帮助开发者设计、训练和部署个性化AI智能体的多模态生态平台。

商汤日日新大模型

商汤日日新大模型

商汤日日新大模型是基于大装置和大模型技术打造的生成式AI产品,通过多模态能力推动AGI发展。

MiniMax开放平台

MiniMax开放平台

国内领先的千亿参数三模态融合大模型开放平台。

国产模型悄无声息地赢得了一场多模态战役

国产模型悄无声息地赢得了一场多模态战役

国产多模态模型通过引入思维链等创新技术,已在声音理解与生成领域实现关键突破。

封神榜-IDEA研究院

封神榜-IDEA研究院

封神榜-IDEA研究院是一套致力于中文认知智能的研究项目,通过先进的语言模型与多模态技术推动中文自然语言处理发展。

吱意

吱意

吱意是一个集图片、文档、视频翻译与AI内容创作于一体的智能在线工具平台。

星流AI

星流AI

星流AI是LiblibAI推出的一站式多模态AI设计Agent,深度优化中文语境,支持全链路创意生成与精细化编辑。

无限画

无限画

无限画是一个免费的AI绘画与创意平台,利用先进的AIGC技术帮助用户通过简单的文本或图片输入快速生成高质量艺术作品。

讯飞星火

讯飞星火

科大讯飞推出的高性能AI语言模型,具备多模态理解和生成能力。