微软近 5 万 star 的开源项目 —— MarkItDown 已支持 MCP


MarkItDown 是微软开源的 Python 实用工具库,支持将各种文件转换为 Markdown 格式,适用于索引、文本分析等用途。

MarkItDown 目前支持以下文件:

  • PDF
  • PowerPoint
  • Word
  • Excel
  • 图片(EXIF 元数据和 OCR)
  • 音频(EXIF 元数据和语音转录)
  • HTML
  • 基于文本的格式(CSV、JSON、XML)
  • ZIP 文件(遍历内容)

该项目最近发布了一项“史诗级”更新 —— 支持 MCP。MarkItDown 现已提供 MCP(模型上下文协议)服务器 (MarkItDown-MCP),以便与 LLM 应用程序如 Claude Desktop 集成。

MarkItDown-MCP 提供两种主要的服务器模式:

  1. STDIO模式(默认):通过标准输入/输出进行通信,非常适合与命令行工具和脚本集成。

  2. SSE模式:作为服务器发送事件(Server-Sent Events)服务器在指定主机和端口上运行,支持基于 Web 和网络的集成。

Docker 支持

为了增强可移植性和隔离性,MarkItDown-MCP 提供了 Docker 支持。这在以下情况特别有用:

  • 确保在不同系统上的环境一致性

  • 将转换过程与主机系统隔离

  • 与 Claude Desktop 等远程服务协作

Docker 集成包括挂载本地目录的功能,允许容器访问和转换本地文件,同时维持安全边界。

更多信息查看 markitdown-mcp。


相關推薦

2024-10-31

就在昨晚,有开发者惊奇地发现自己的开源项目 star 数竟然超过了最流行的开源全文搜索引擎 Elasticsearch。 发生了什么事,Elasticsearch 竟然跌得比 A 股还凶 —— 近 10 万 star 的 GitHub 仓库竟然只剩下 200 多。 今天,Elasticse

2023-03-16

除了大力投资 Open AI ,微软还亲自下场大搞 AI 。5 天前,微软开源了 Visual ChatGPT ,这个软件可以连接 ChatGPT 和一系列视觉模型,以实现在 ChatGPT 的聊天过程中发送和接收图像。 众所周知,尽管 ChatGPT 的功能非常强大,甚至可以

2022-09-12

美元的 B 轮融资。 此次融资由 Thomvest Ventures 领头,M12(微软的风险基金)和 Grafana Labs 参与了跟投,他们与 Google 和思科一起成为公司战略投资者。 eBPF 是由 Isovalent 和 Meta 共同维护的一个强大、但却很复杂的 Linux 内核功能

2025-03-25

洲风险投资公司 Runa Capital 发布了一份“2024 年最热门的开源初创公司”榜单。 该公司自 2020 年以来一直运营 Runa Open Source Startup (ROSS) 指数,按照 GitHub“star”数量增长速度每季度更新一次榜单。并从 2023 年开始制作年度报告,

2025-03-20

令行标志,便于配置 支持个人、组织和企业操作 开源地址:https://gitee.com/oschina/mcp-gitee 什么是 Gitee MCP Server? MCP(Model Context Protocol,模型上下文协议)是一个用于 AI 与开发环境交互的标准协议,让 AI 具备代码上下

2023-01-04

已知这个分段的极限。 项目信息 Furion 是基于 MIT 开源协议的开源项目,底层核心无依赖,商业使用无需授权。 此情此景,想再再吟诗一首(百小僧):无私奉献不是天方夜谭,有时候,我们也可以做到。 文档地址

2022-10-01

约 15000 star,据称其活跃用户中的 10000 家公司包括谷歌、微软、红帽、腾讯、字节跳动和 Mozilla。 Penpot CEO 兼联合创始人 Pablo Ruiz-Múzquiz 表示,在 Adobe 宣布收购 Figma 之前,他们产品的注册人数保持着每月 40% 左右的增长。而在

2025-03-29

飞致云(即杭州飞致云信息科技有限公司)凭借旗下MaxKB开源知识库问答系统、1Panel开源面板、Halo开源建站工具等开源工具软件在阿里云镜像市场的用户认可度和产品服务能力,成功入选“2024年度Alibaba Cloud Linux最佳AI镜像服务

2025-03-26

近日,Anthropic 工程师在 MCP 的 GitHub 仓库提交了一个希望采用 "Streamable HTTP" 传输代替「HTTP+SSE」的 PR,以解决当前远程 Model Context Protocol (MCP) 传输方式的关键限制,同时保留其优势。 根据该 PR 目前的状态,MCP 现已合并"Streamable

2023-10-10

,贾佳亚团队联合MIT发布的新技术和新模型悄然登上各大开源网站的热榜:hugging face热榜第一、paperwithcode热度第一,Github全部python项目热度第五、github stars一周内破千,Twitter上的相关技术帖子浏览量近18万...... github stars已达1

2022-09-10

在 GitHub 上有 12.4k Stars。 目前包括 Adobe、苹果、Google、微软、亚马逊、迪士尼、通用汽车、星巴克和特斯拉等财富 500 强中的公司都是 Akka 的用户。 Lightbend(Akka 项目背后的公司)的创始人兼 CEO、Akka 的作者 Jonas Bonér 近日表示

2023-01-04

Levels.fyi 网站于日前发布了一份 2022 年度程序员收入报告,基于收集的超过 150,000 份薪资申请。报告中的薪酬数据反映的是在过去一年中收集的年度薪酬总额中位数,包括工资、股票和奖金。 “就像今年年初市场迅速升温一

2025-04-01

2025年3月27日,1Panel开源项目组发布名为“1Panel MCP Server”的开源工具软件。1Panel MCP Server(https://github.com/1Panel-dev/mcp-1panel)基于MCP(Model Context Protocol,模型上下文协议)开发,能够大幅度简化Linux服务器的日常管理工作,为用户

2025-03-21

繁琐事务,助力 Gitee 专业版研发提效 Gitee MCP Server 正式开源:让 AI 助手直连你的代码仓库