DeepSeek 新专利公开：优化网页采集流程，降低网络资源消耗

2025-04-03 發表於开源资讯

4月1日，DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利在国家知识产权局正式公布。

据专利摘要介绍，该方法旨在在尽可能多发现网页链接的同时，降低网站流量冲击。系统通过分析已下载内容并对未下载链接进行质量推断，采用择优下载的机制分配额度，从而减少低质量或重复内容的采集，提高数据质量与下载效率，有效降低数据采集过程中的网络资源消耗。

此外，该方法还通过引入独立的信息回灌队列，确保网页元信息库的修改操作具备原子性与稳定性。

据悉，随着大语言模型在自然语言处理领域的广泛应用，高质量、多样化的训练语料需求不断提升。当前网页采集中存在诸多问题，如链接获取不全、网站过载风险以及重复或低质下载等。该专利试图从技术层面提升采集系统的效率与安全性，为大模型训练提供更稳健的数据基础。

相關推薦

饿了么免费开源 10 项专利

2024-08-16

8月15日，饿了么宣布将10项专利开源，并完成在上海技术交易所的公开挂牌，这也是国内首批通过全国技术要素市场公开挂牌的开源专利。10项专利中，7项为食品安全领域、3项为低碳环保领域，其中共有3项为AI相关专利。此

腾讯首个专利：单窗口多页浏览装置，由马化腾 20 年前发明

2023-05-04

2001年的春天，腾讯申请了自己的第一个专利——单窗口多页浏览装置，发明人是Pony（马化腾）。据介绍，这项专利促进了浏览器使用方式的改变——用一个窗口即可打开多页面。当时的浏览器，如果同时打开很多网站需要

DeepSeek 新论文公开 V3 大模型降本方法

2025-05-16

DeepSeek 团队近日发表了新论文《Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures》，把 DeepSeek-V3 在训练和推理过程中，如何解决“硬件瓶颈”的方法公布了出来。论文主要介绍了 DeepSeek-V3 在硬件架构

DeepSeek 关联公司公布大语言模型部署方法专利

2025-08-02

天眼查App显示，DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利公布。摘要显示，该发明涉及人工智能领域，有益效果在于将预填充阶段和解码阶段分别部署在

OSC 社区 2.1 发布：私有化 + AI

2025-06-19

景，OSC通过GiEngine多模型推理能力，实现在本地环境中对DeepSeek、Qwen3、GLM4等模型的百毫秒级响应。用户可即时获得精准答案，显著提升内部协作效率并降低运维压力。 OSC × AI 内容工厂 - 高效闭环的知识生成在跨部门内容策划

《生成式人工智能全栈技术专利分析报告》发布

2025-04-02

上又进一步。2025年1月，我国AI初创公司深度求索发布的DeepSeek R1以技术路径、成本控制与开源策略的全面创新，为AI研发提供了新范式。3月百度发布的文心大模型X1在性能对齐的情况下，进一步将API调用价格降至R1的一半。人工

英伟达开源 2530 亿参数推理大模型，效果直逼 DeepSeek-R1

2025-04-11

关注的是，英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1，但只用了不到一半的参数量。测试结果显示，GPQA（76 vs. 71.5）、IFEval 指令遵循（89.5 vs. 88.8）和 LiveCodeBench 编码任务（66.3 vs. 65.9）。并且，Llama-3.1-Nemotron-Ultra-25

JS 网页全自动翻译 v3.14 发布，智谱 AI、DeepSeek 提供全私有化部署翻译支持

2025-03-27

低服务器资源占用，同时深度融合各种大模型如智谱AI 、DeepSeek 等，开放 linux 一键部署。它可以提供标准的文本翻译API，一方面可以配合 translate.js 进行使用，另一方面如果你需要文本翻译，完全可以使用它，而不用再

OpenCart 专业版升级至 v4.1.1.0 | 上线 OpenCart 采集插件

2023-01-13

点击使用即可获得相应优惠！ ✦✦ 二、优化功能（1）17Track 密钥变为可填写（2）隐藏后台 logo 配置（3）PC端前台分类模块鼠标移入显示全名称（4）SMTP 添加帮助文档链接（5）

苹果新专利公开：让 Xcode 更智能、甚至为开发者写代码

2023-06-30

根据 Apple Insider 的报道，苹果公开的一项新专利显示，他们希望通过机器学习技术来深度帮助开发者。正如专利名字所言，这是一项将学习模型集成到软件开发系统的技术 ("Integration Of Learning Models Into A Software Development S

首发！优刻得云平台上新 DeepSeek-V3-0324 模型

2025-03-26

上新！DeepSeek-V3重磅升级昨夜，DeepSeek-V3迎来一波更新，升级至「DeepSeek-V3-0324」版本。不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude 3.5/3.7 Sonnet相媲美。同时，模型的开

SQLE 3.2406.0 发布，对 PGer 更加友好！

2024-06-29

较长（3.35 秒）。这表明查询可能存在 CPU 消耗高或查询优化不足的问题。结合这些指标，我们可以做的优化可能有：索引优化：检查并优化相关表的索引，减少全表扫描的发生。查询重写：分析并重写查询逻辑，减

AIBrix v0.4.0 发布

2025-08-23

，AIBrix v0.4.0 还增强了对专家并行（EP）的支持。对于像 DeepSeek 这样的混合专家（MoE）模型，EP 显著降低了与稀疏前馈网络（FFN）相关的内存开销。vLLM 和 SGLang 社区通过实现 EP 机制并集成 DeepEP 和 DeepGemm 等高性能算子库，为可

🚀 Xinference v1.6.1 新增 Deepseek-R1 模型，语言能力升级！

2025-06-05

🚀 Xinference v1.6.1 更新日志 ✅ 本次亮点 🧠 新增 Deepseek-R1-0528 及其蒸馏模型 Deepseek-R1-0528-Qwen3支持 Deepseek R1 最新版模型，语言理解与生成能力进一步增强。 🧩 Transformers 的视觉语言（VL）模型推理逻辑全面重构新架构

熱門推薦