返回首页

"内容提取" 标签

75 个结果

标签搜索结果

网页与API

GenesisTools MCP Web Reader 服务

基于 Model Context Protocol(MCP)的服务器实现,提供网页内容获取与转换等工具的 MCP 服务接口,允许 LLM 客户端通过 JSON-RPC 调用工具、检索工具列表并执行网页相关任务,进而得到结构化输出和元数据。该服务明确实现了 MCP 的核心请求处理路径(如 ListTools、CallTool),并提供可运行的服务端代码,作为 MCP 服务器使用。

网页与API

MiroThinker MCP 服务器组件集

基于 Model Context Protocol 的后端服务器集合,提供多个 MCP 服务器用于向 LLM 客户端暴露 Tools、Resources 与 Prompts,并通过 JSON-RPC 及多端传输协议(如 STDIO、SSE、WebSocket)进行交互,支持工具执行、网页检索、内容提取、音视频处理等多种能力。

网页与API

You.com MCP 服务器实现

基于 Model Context Protocol (MCP) 的后端服务器实现,提供工具注册、资源管理和内容/搜索相关能力,支持通过 JSON-RPC 与客户端通信,涵盖 STDIO 与 HTTP 两种传输方式的 MCP 服务端实现。

网页与API

Confluence MCP 服务器

基于模型上下文协议(MCP)的后端服务,提供 Confluence 页面搜索与文本读取等功能,并通过 MCP 标准向大型语言模型(LLM)客户端暴露工具与资源,以便在对话系统中获取上下文数据与外部能力。

网页与API

Google Search MCP Server

基于 Model Context Protocol (MCP) 的后端服务器,提供 Google 自定义搜索与网页内容提取的上下文服务,供 LLM 客户端通过 MCP 进行资源读取、工具调用和提示渲染。

网页与API

MCP 搜索服务器

基于 Model Context Protocol (MCP) 的后端服务,向 LLM 客户端提供资源、工具和提示模板等上下文能力,并通过 JSON-RPC 进行通信,支持多种传输方式以实现安全、可扩展的上下文服务。

网页与API

Search-Scrape MCP 服务器

基于 Model Context Protocol (MCP) 的 Rust 实现的后端服务,提供 SearXNG 联邦搜索、网页抓取与内容提取等工具的 MCP 服务接口,能够向大型语言模型客户端以标准化的 JSON-RPC 方式提供资源、工具、以及会话能力,为 AI 助手提供上下文和外部功能接入能力。

网页与API

bing-mcp-cn-enhanced

基于 Model Context Protocol (MCP) 的中文必应搜索工具后端实现,提供 bing_search 与 fetch_webpage 两个 MCP 工具,通过 MCP 服务器向大语言模型客户端暴露网页检索与网页内容获取能力,支持浏览器自动化与网页文本抽取等功能。

网页与API

Pulse MCP 服务器

Pulse MCP 服务器是一个提供网页智能和上下文服务的后端,通过其提供的工具和资源,赋能大型语言模型(如Claude)进行网页抓取、信息搜索、站点地图构建、内容提取以及本地文件查询。

网页与API

Firecrawl 上下文服务

一个基于Model Context Protocol (MCP) 实现的服务器,集成Firecrawl提供强大的网页抓取、网络爬虫、搜索和内容提取能力。

网页与API

GoFetch MCP 服务器

基于MCP协议的Go语言实现,提供高效的网页内容抓取和处理服务,支持Robots协议和多种传输方式。

网页与API

MCP Web访问服务器

为LLM提供强大的网络访问能力,支持网页搜索、内容抓取、PDF解析和图像加载。

网页与API

Web Scout网页搜索MCP服务器

基于MCP协议,为LLM提供网页搜索及内容提取能力。

网页与API

WebInsight - 本地优先的AI内容平台

基于MCP协议的本地优先平台,用于网页内容提取、AI分析与知识管理。

网页与API

FindxAI MCP服务器

为LLM提供智能搜索和内容提取工具,增强模型获取实时信息的能力。

网页与API

Aspire MCP 网页抓取服务器

基于 .NET Aspire 和 MCP 协议构建,提供智能网页抓取和内容提取能力。

网页与API

fetch-mcp 服务器

一个基于 MCP 协议的服务器,提供抓取网页内容和获取 YouTube 视频字幕的工具。

网页与API

Fetcher MCP: Playwright网页内容获取服务器

基于Playwright的MCP服务器,为LLM提供高效网页内容获取和处理能力。

网页与API

Crawl4ai MCP Server

基于 Spring Boot 的 MCP 服务器,提供网页爬取工具,通过 Crawl4ai API 为 LLM 应用赋能。

开发者工具

Markdownify MCP Server

Markdownify MCP Server 提供多种文件和网页内容转换为 Markdown 格式的工具,方便 LLM 应用获取和处理文本信息。

网页与API

Markdownify Server

Markdownify Server 是一个 MCP 服务器,提供多种工具将各种文件和网页内容转换为 Markdown 格式。

网页与API

Markdownify MCP Server

Markdownify MCP Server 是一个基于 Model Context Protocol 的服务器,提供多种工具将各种文件和网页内容转换为 Markdown 格式。

网页与API

Markdownify Server

Markdownify Server 是一个 MCP 服务器,提供多种工具将各种文件和网页内容转换为 Markdown 格式。

生产力应用

Markdownify MCP Server

Markdownify MCP 服务器是一个基于 Model Context Protocol 的工具服务器,可以将多种文件和网页内容转换为 Markdown 格式。

开发者工具

Markdownify Server

Markdownify Server是一个MCP服务器,提供多种文件和网页内容转换为Markdown格式的功能,方便LLM应用获取和处理信息。

网页与API

Markdownify Server

Markdownify Server是一个MCP服务器,提供多种工具将各种文件和网页内容转换为Markdown格式,方便LLM应用处理非结构化数据。

开发者工具

Markdownify Server

Markdownify Server是一个MCP服务器,提供多种工具将各种文件和网络内容转换为Markdown格式,方便LLM理解和处理。

网页与API

AutoGen MCP网页抓取服务器示例

基于MCP协议实现的网页内容抓取工具服务器,允许LLM客户端通过工具调用安全地获取和解析网页内容。

网页与API

MCP Fetch Server

一个基于MCP协议的Fetch服务器,可以将URL内容抓取并转换为Markdown格式,优化AI模型的内容输入。

网页与API

小红书内容抓取MCP服务器

基于MCP协议,使用Playwright自动化抓取小红书帖子内容,包括图文和视频资源。

开发者工具

Markdownify MCP Server

Markdownify MCP服务器是一个可以将多种文件类型和网页内容转换为Markdown格式的工具集合,通过MCP协议为LLM应用提供文档转换能力。

网页与API

Prysm MCP Server

Prysm MCP Server为AI助手提供网页内容抓取服务,支持多种抓取模式和数据格式,并通过MCP协议与客户端通信。

网页与API

Fetch-MCP

Fetch-MCP 是一个 MCP 服务器,提供抓取 URL 内容和 YouTube 视频转录的功能,为 LLM 应用提供网络数据访问能力。

AI与计算

Unstructured Platform MCP Server

基于Unstructured API的MCP服务器,为LLM客户端提供文档解析和非结构化数据处理能力。

网页与API

MCP Servers for Scientific Research

提供基于MCP协议的Web内容抓取和TXYZ学术/网页搜索服务器,为LLM应用提供外部信息访问能力。

网页与API

Fetch MCP Server

提供网页内容和YouTube视频转录抓取工具的MCP服务器。

数据库与文件

Ebook-MCP:电子书智能处理服务器

Ebook-MCP 是一款 MCP 服务器,专注于电子书内容处理,为 LLM 应用提供 EPUB 和 PDF 格式电子书的结构化信息和内容提取工具。

网页与API

Fetcher MCP

基于Playwright的MCP服务器,提供网页内容抓取工具,支持多种配置选项,帮助LLM高效获取网络信息。

网页与API

网页摘要智能体

基于MCP Agent框架实现的网页内容抓取和总结工具,利用LLM模型对指定URL的网页进行内容提取和总结。

网页与API

网页内容抓取

提供网页内容抓取功能的MCP服务器,支持浏览器自动化、OCR和多种内容提取方法。

网页与API

Scrapling Fetch MCP

Scrapling Fetch MCP 是一个 MCP 服务器,旨在帮助 AI 助手从具有反爬虫机制的网站抓取文本内容,扩展 AI 的信息访问能力。

网页与API

Fetch MCP Server

基于Playwright的MCP服务器,提供网页内容抓取工具,支持智能提取内容并转换为Markdown格式。

网页与API

网站信息 MCP 服务器

一个基于 Model Context Protocol 的服务器,提供从网站提取信息的功能,支持使用 AgentQL API 或直接网页抓取。

网页与API

Chrome控制MCP服务器

通过MCP协议为AI助手提供高效的Web浏览能力,无需依赖屏幕截图,直接分析和操作DOM。

AI与计算

Unstructured文档处理器MCP服务器

基于MCP协议,提供非结构化文档处理能力,使LLM能够提取和利用文档内容。

网页与API

mcp server fetch typescript

tatn_mcp-server-fetch-typescript 是一个 MCP 服务器,提供网页内容抓取和转换工具,支持多种格式和渲染方式,方便 LLM 应用获取网络信息。

网页与API

rag web browser

RAG Web Browser是一个网页内容抓取工具,可以作为MCP服务器为LLM应用提供网页搜索和内容提取功能,支持多种输出格式和动态网页。

网页与API

mcp youtube

该项目是一个MCP服务器,通过yt-dlp工具提供YouTube视频字幕和元数据提取功能,供LLM客户端调用。

网页与API

server moz readability

该项目是一个MCP服务器,利用Mozilla Readability算法解析网页内容,提取文章标题、正文等信息,并转换为Markdown格式,优化LLM内容处理。

网页与API

fetch mcp

Fetch MCP Server是一个MCP服务器,提供工具用于从URL获取网页内容,并支持HTML、JSON、纯文本和Markdown等多种格式。

AI与计算

mcp youtube

YouTube MCP Server 使用 yt-dlp 下载 YouTube 字幕,并通过 Model Context Protocol (MCP) 将其连接到 LLM,例如 Claude,实现视频内容总结功能。

网页与API

web browser mcp server

blazickjp_web-browser-mcp-server 是一个 MCP 服务器,为 LLM 提供网页浏览能力,支持通过 URL 获取网页内容,并使用 CSS 选择器提取特定信息。

网页与API

Cloudflare Browser Rendering

基于Cloudflare Browser Rendering的MCP服务器,为LLM提供网页内容抓取、处理和结构化信息提取工具。

网页与API

Markdown Web Crawl

Markdown Web Crawl MCP服务器是一个基于Model Context Protocol的应用后端,用于抓取网站内容并将其保存为Markdown格式文件,支持网站结构映射和批量处理。

网页与API

Readability (Fetch & Parse)

该MCP服务器通过Readability算法提取网页正文,去除广告和导航等干扰元素,并转换为Markdown格式,优化LLM处理网页内容。

网页与API

Web Crawler

基于MCP协议的Web爬虫服务器,提供网页内容抓取工具,支持深度和并发控制。

网页与API

Google Search

该项目是一个MCP服务器,提供通过Google Custom Search进行网页搜索和浏览网页内容的功能,并具有高级的Bot检测规避能力。

数据库与文件

Google Drive

一个MCP服务器,允许LLM客户端通过工具搜索、读取Google Drive文件,并支持多种Google Workspace文件格式转换。

网页与API

Local Web Search

local-web-search MCP服务器提供了一个工具,用于执行本地网络搜索并提取网页内容,以便为LLM提供上下文信息。

网页与API

Web Browser (Playwright)

基于Playwright的Web Browser MCP服务器,为LLM提供网页浏览和内容提取等功能,支持headless模式和多种网页交互操作。

网页与API

Web Browser

该项目是一个 MCP 服务器,为 LLM 提供网页浏览和内容提取工具,支持 CSS 选择器进行精细化内容抓取。

网页与API

Tavily API Server

Tavily API Server是一个MCP服务器,提供基于Tavily API的搜索和内容提取工具,方便LLM应用获取网络信息。

网页与API

Google Search

提供Google搜索和网页内容浏览功能的MCP服务器,支持关键词过滤、域名限制和反爬虫机制。

网页与API

Fetch TypeScript Server

提供网页内容抓取和格式转换功能的MCP服务器,支持获取原始文本、渲染后的HTML和Markdown格式内容。

网页与API

Deep Web Research Server

Deep Web Research Server是一个MCP服务器,为Claude等LLM客户端提供高级网页研究能力,包括智能搜索、内容提取和会话管理。

网页与API

NPX Fetch

一个 MCP 服务器,提供网页内容抓取和格式转换工具,支持 HTML, JSON, 纯文本和 Markdown 格式。

网页与API

Webscan

Webscan MCP服务器提供网页内容扫描和分析工具,包括页面抓取、链接提取、网站爬取等功能,为LLM应用提供网页信息处理能力。

数据库与文件

File Preview

该项目是一个 MCP 服务器,提供 HTML 文件预览和分析功能,例如截图和内容结构分析。

网页与API

Hacker News

Hacker News MCP Server是一个基于Model Context Protocol (MCP) 的服务器实现,提供工具以访问Hacker News的数据,例如获取热门新闻、搜索新闻、获取用户信息和评论等,使LLM能够利用Hacker News的信息。

开发者工具

Markdownify

Markdownify MCP服务器是一个工具集合,可以将多种文件格式和网页内容转换为Markdown格式文本。

网页与API

Fetch MCP Server

Fetch MCP Server 提供网页内容抓取工具,支持HTML, JSON, 纯文本和Markdown格式,为LLM应用提供网页数据访问能力。

网页与API

Fetch Browser

Fetch Browser是一个无需API密钥的MCP服务器,提供网页内容抓取和智能Google搜索工具,支持多种输出格式,方便AI Agent获取网络信息。

网页与API

Skrape MCP Server

Skrape MCP Server 是一个 MCP 服务器,它利用 skrape.ai API 将网页转换为 LLM 友好的 Markdown 格式,方便 LLM 应用处理网页内容。

网页与API

MCP Fetch

MCP Fetch 是一个 MCP 服务器,用于从互联网抓取网页内容和处理图片,为 LLM 应用提供网页信息获取能力。

网页与API

YouTube Transcript Server

YouTube Transcript Server 是一个 MCP 服务器,允许用户通过工具从 YouTube 视频中提取字幕和转录文本,方便 LLM 应用获取视频内容。