返回首页

"语音转文本" 标签

10 个结果

标签搜索结果

AI与计算

speech-to-cli MCP 服务器

基于 Model Context Protocol (MCP) 的后端服务,提供监听/跟说等语音工具,并通过 MCP 标准向各种 MCP 客户端(如 Copilot CLI、Claude Code、Gemini CLI)暴露工具、资源和 Prompts,支持多种 STT/TTS 后端及实时音频交互。

桌面与硬件

cubby

cubby 是一个跨平台桌面上下文服务,通过 MCP 协议为 LLM 客户端提供屏幕内容搜索、应用控制和自动化工具。

AI与计算

本地语音转文本MCP服务器

为Linux系统提供本地语音转文本功能,通过MCP协议将转录结果无缝集成到LLM客户端的输入流中。

AI与计算

语音助手服务器

为大语言模型客户端提供语音(文本转语音、语音转文本)能力的MCP服务器。

AI与计算

Groq MCP 服务器

为 Claude 等 MCP 客户端提供 Groq 闪速推理能力,支持文本转语音、语音转文本、图像分析和聊天等功能。

AI与计算

ElevenLabs MCP服务器

ElevenLabs MCP服务器是一个基于Model Context Protocol的应用后端,旨在通过标准化的方式向LLM客户端提供ElevenLabs强大的语音API服务,包括语音合成、语音克隆、语音转文本等功能。

AI与计算

OpenAI语音转文本MCP服务器

一个基于MCP协议的服务器,利用OpenAI Whisper API提供音频转文本功能,支持本地文件转录和保存。

生产力应用

mcp servers

该项目是Props Labs提供的MCP服务器集合中的Fireflies服务器实现,允许LLM客户端通过MCP协议访问Fireflies.ai的会议记录,进行检索、查看详情和生成摘要等操作。

AI与计算

Voice Recorder (Whisper)

Voice Recorder MCP Server是一个基于MCP协议的服务器,它利用OpenAI Whisper模型实现录音和语音转文本功能,为LLM应用提供语音输入能力。

桌面与硬件

File Finder

该仓库提供了两个MCP服务器:File Finder用于按文件名片段搜索本地文件,Whisper STT用于使用faster-whisper将音频转录为文本。