当前标签:语音识别
讯飞星火API
讯飞星火API是一款便捷的人工智能接口服务,提供多种语音和语言处理功能,用户可直接领取使用。
FunAudioLLM
FunAudioLLM是阿里巴巴集团通义语音团队推出的一个自然语音交互框架,致力于提升人与大型语言模型(LLMs)之间的语音交流体验。
讯飞星辰AstronClaw
讯飞星辰AstronClaw是科大讯飞推出的AI智能体平台,助力开发者快速构建个性化AI应用。
Whisper
Whisper是一款由OpenAI开发的开源自动语音识别系统,能够将语音内容高效准确地转为文字。
Nuance
Nuance 是一家专注于对话式人工智能技术的公司,提供先进的医疗保健与客户互动解决方案。
Speech Studio
Speech Studio是微软Azure提供的无代码开发平台,专注于语音识别与合成工具的可视化构建和集成。
FineVoice
FineVoice是一个AI驱动的实时变声与配音工具,为用户提供声音增强、语音转换和高质量音频处理的一站式解决方案。
听脑AI
听脑AI是一款提供免费录音转写和总结服务的智能工具。
蓝藻AI
蓝藻AI是一款基于先进人工智能技术的语言生成与语音服务平台,提供多项自然语言处理相关服务。
VAS视频加字幕
VAS视频加字幕是一个利用AI技术实现一键添加字幕与翻译的智能工具。
Notta
一款专为个人设计的AI语音转写工具,支持实时录音转写与音频/视频文件导入,高效生成文字记录。
智谱AI输入法
智谱AI输入法是一个智能的AI语音输入工具,通过说话就能实现高效创作,告别繁琐打字,说话即成文。
Deepgram
Deepgram是专注于提供高精度语音识别与AI语音处理API的开发者平台,新用户注册即赠200美金API额度。
讯飞开放平台
讯飞开放平台是科大讯飞推出的免费AI语音与语言能力开放平台,为开发者提供语音识别、合成、翻译及自然语言处理等多种AI能力。
讯飞翻译
讯飞翻译是科大讯飞推出的基于AI的多模态智能翻译平台,提供文本、语音、图片、文档等多形式内容的即时互译服务。
whisper
一个开源的通用语音识别模型
麦耳会记
一个集实时转写、全文摘要和辅助写作于一体的AI会议助手。
绘影字幕
绘影字幕是一款AI驱动的智能字幕生成与视频翻译工具,为用户提供高效的视频字幕添加和多语言翻译解决方案。
zeemo
zeemo是一款专业的AI视频翻译与字幕生成工具,旨在为全球视频内容创作者提供高效的字幕解决方案。
Leap AI
Leap AI是一款专注于将视频内容智能转写为文本的AI工具,助力营销团队提升内容复用效率。
腾创益昂
腾创益昂是融合AI能力的智能客户沟通与关系管理平台
科大讯飞AI平台
科大讯飞AI平台是科大讯飞推出的一站式人工智能开发与服务平台,提供语音、视觉、NLP、数据等多种AI能力。
pyVideoTrans
开源免费的视频翻译与配音工具,集成字幕生成、翻译、配音及合成,支持多引擎与离线使用。