微软近 5 万 star 的开源项目 —— MarkItDown 已支持 MCP


MarkItDown 是微软开源的 Python 实用工具库,支持将各种文件转换为 Markdown 格式,适用于索引、文本分析等用途。

MarkItDown 目前支持以下文件:

  • PDF
  • PowerPoint
  • Word
  • Excel
  • 图片(EXIF 元数据和 OCR)
  • 音频(EXIF 元数据和语音转录)
  • HTML
  • 基于文本的格式(CSV、JSON、XML)
  • ZIP 文件(遍历内容)

该项目最近发布了一项“史诗级”更新 —— 支持 MCP。MarkItDown 现已提供 MCP(模型上下文协议)服务器 (MarkItDown-MCP),以便与 LLM 应用程序如 Claude Desktop 集成。

MarkItDown-MCP 提供两种主要的服务器模式:

  1. STDIO模式(默认):通过标准输入/输出进行通信,非常适合与命令行工具和脚本集成。

  2. SSE模式:作为服务器发送事件(Server-Sent Events)服务器在指定主机和端口上运行,支持基于 Web 和网络的集成。

Docker 支持

为了增强可移植性和隔离性,MarkItDown-MCP 提供了 Docker 支持。这在以下情况特别有用:

  • 确保在不同系统上的环境一致性

  • 将转换过程与主机系统隔离

  • 与 Claude Desktop 等远程服务协作

Docker 集成包括挂载本地目录的功能,允许容器访问和转换本地文件,同时维持安全边界。

更多信息查看 markitdown-mcp。


相關推薦

2024-10-31

就在昨晚,有开发者惊奇地发现自己的开源项目 star 数竟然超过了最流行的开源全文搜索引擎 Elasticsearch。 发生了什么事,Elasticsearch 竟然跌得比 A 股还凶 —— 近 10 万 star 的 GitHub 仓库竟然只剩下 200 多。 今天,Elasticse

2025-05-21

微软宣布在 Windows 11 中集成模型上下文协议(MCP),旨在未来使 Windows 11 成为一个智能代理操作系统。 MCP 与 Windows 的集成将为 AI 智能体连接原生 Windows 应用提供标准化框架,使应用能够无缝参与智能体交互。

2025-05-27

2025 年 5 月 22 日,微软在北京微软大厦举办媒体沟通会,围绕 “探索未来工作趋势,以智能体重塑企业竞争力” 主题展开圆桌讨论与专访,分享了 AI 智能体技术突破、行业应用实践及安全治理方案。同时,结合微软 Build 2025 大

2025-05-21

微软发布了名为“NLWeb”的开源项目,旨在简化创建网站的自然语言对话界面,使任何网站都能轻松转变为 AI 驱动的应用程序。 NLWeb 定位为 “智能体 Web 时代的 HTML”,支持自定义模型与数据交互,旨在帮助开发者轻松将网站

2023-03-16

除了大力投资 Open AI ,微软还亲自下场大搞 AI 。5 天前,微软开源了 Visual ChatGPT ,这个软件可以连接 ChatGPT 和一系列视觉模型,以实现在 ChatGPT 的聊天过程中发送和接收图像。 众所周知,尽管 ChatGPT 的功能非常强大,甚至可以

2022-09-12

美元的 B 轮融资。 此次融资由 Thomvest Ventures 领头,M12(微软的风险基金)和 Grafana Labs 参与了跟投,他们与 Google 和思科一起成为公司战略投资者。 eBPF 是由 Isovalent 和 Meta 共同维护的一个强大、但却很复杂的 Linux 内核功能

2025-06-06

微软发布了面向初学者的 Model Context Protocol (MCP) 课程:mcp-for-beginners。 Model Context Protocol (MCP) 是一个前沿框架,旨在规范 AI 模型与客户端应用之间的交互。这个开源课程提供了结构化的学习路径,配有实用的代码示例和真实案

2025-03-25

洲风险投资公司 Runa Capital 发布了一份“2024 年最热门的开源初创公司”榜单。 该公司自 2020 年以来一直运营 Runa Open Source Startup (ROSS) 指数,按照 GitHub“star”数量增长速度每季度更新一次榜单。并从 2023 年开始制作年度报告,

2023-01-04

已知这个分段的极限。 项目信息 Furion 是基于 MIT 开源协议的开源项目,底层核心无依赖,商业使用无需授权。 此情此景,想再再吟诗一首(百小僧):无私奉献不是天方夜谭,有时候,我们也可以做到。 文档地址

2022-10-01

约 15000 star,据称其活跃用户中的 10000 家公司包括谷歌、微软、红帽、腾讯、字节跳动和 Mozilla。 Penpot CEO 兼联合创始人 Pablo Ruiz-Múzquiz 表示,在 Adobe 宣布收购 Figma 之前,他们产品的注册人数保持着每月 40% 左右的增长。而在

2025-03-29

飞致云(即杭州飞致云信息科技有限公司)凭借旗下MaxKB开源知识库问答系统、1Panel开源面板、Halo开源建站工具等开源工具软件在阿里云镜像市场的用户认可度和产品服务能力,成功入选“2024年度Alibaba Cloud Linux最佳AI镜像服务

2023-10-10

,贾佳亚团队联合MIT发布的新技术和新模型悄然登上各大开源网站的热榜:hugging face热榜第一、paperwithcode热度第一,Github全部python项目热度第五、github stars一周内破千,Twitter上的相关技术帖子浏览量近18万...... github stars已达1

2022-09-10

在 GitHub 上有 12.4k Stars。 目前包括 Adobe、苹果、Google、微软、亚马逊、迪士尼、通用汽车、星巴克和特斯拉等财富 500 强中的公司都是 Akka 的用户。 Lightbend(Akka 项目背后的公司)的创始人兼 CEO、Akka 的作者 Jonas Bonér 近日表示

2023-01-04

Levels.fyi 网站于日前发布了一份 2022 年度程序员收入报告,基于收集的超过 150,000 份薪资申请。报告中的薪酬数据反映的是在过去一年中收集的年度薪酬总额中位数,包括工资、股票和奖金。 “就像今年年初市场迅速升温一