"语音转文本" 标签

10 个结果

标签搜索结果

AI与计算

speech-to-cli MCP 服务器

基于 Model Context Protocol (MCP) 的后端服务，提供监听/跟说等语音工具，并通过 MCP 标准向各种 MCP 客户端（如 Copilot CLI、Claude Code、Gemini CLI）暴露工具、资源和 Prompts，支持多种 STT/TTS 后端及实时音频交互。

语音助手 Azure 文本转语音语音转文本

桌面与硬件

cubby

cubby 是一个跨平台桌面上下文服务，通过 MCP 协议为 LLM 客户端提供屏幕内容搜索、应用控制和自动化工具。

桌面自动化屏幕识别语音转文本 LLM工具

AI与计算

本地语音转文本MCP服务器

为Linux系统提供本地语音转文本功能，通过MCP协议将转录结果无缝集成到LLM客户端的输入流中。

语音转文本 LLM交互按键说话 Whisper

AI与计算

语音助手服务器

为大语言模型客户端提供语音（文本转语音、语音转文本）能力的MCP服务器。

语音助手文本转语音语音转文本对话界面

AI与计算

Groq MCP 服务器

为 Claude 等 MCP 客户端提供 Groq 闪速推理能力，支持文本转语音、语音转文本、图像分析和聊天等功能。

文本转语音语音转文本图像分析聊天机器人

AI与计算

ElevenLabs MCP服务器

ElevenLabs MCP服务器是一个基于Model Context Protocol的应用后端，旨在通过标准化的方式向LLM客户端提供ElevenLabs强大的语音API服务，包括语音合成、语音克隆、语音转文本等功能。

语音合成语音克隆语音转文本音效生成

AI与计算

OpenAI语音转文本MCP服务器

一个基于MCP协议的服务器，利用OpenAI Whisper API提供音频转文本功能，支持本地文件转录和保存。

语音转文本音频转录 OpenAI Whi…音频处理

生产力应用

mcp servers

该项目是Props Labs提供的MCP服务器集合中的Fireflies服务器实现，允许LLM客户端通过MCP协议访问Fireflies.ai的会议记录，进行检索、查看详情和生成摘要等操作。

会议记录 Fireflies.…会议摘要知识库

AI与计算

Voice Recorder (Whisper)

Voice Recorder MCP Server是一个基于MCP协议的服务器，它利用OpenAI Whisper模型实现录音和语音转文本功能，为LLM应用提供语音输入能力。

语音录制语音转文本音频转录 Whisper模型

桌面与硬件

File Finder

该仓库提供了两个MCP服务器：File Finder用于按文件名片段搜索本地文件，Whisper STT用于使用faster-whisper将音频转录为文本。

文件搜索文件系统音频转录语音转文本