(2025-10-21热点)-DeepSeek团队开源OCR新模型:少量视觉token完成海量文本压缩

zydadmin  105

今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。

根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。

在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。

在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。

转载请注明原文地址:https://www.lzdww.com/read-201900.html
上一篇下一篇

随机主题
祝福旅行的话语唯美(阳光简短励志唯美句子)祝福旅途的成语(祝朋友出行顺利的句子)祝福旅行顺利的句子(祝出行吉利的语言顺利)祝福老婆生日快乐的句子(老婆的生日祝福语简短)祝福旅行的话语(旅行经典祝福句子大全)祝福结婚幸福美满的句子(比较大气的结婚祝福语)祝福结婚家庭的话语(婚姻祝福的句子经典语录)祝福结婚的唯美句子简短(恭喜结婚的金句八字)祝福孩子旅行愉快的句子短句(关心儿子儿媳妇旅行回家的话)祝福国庆古风句子(古风祝福语唯美简短)祝福别人婚姻幸福的句子(祝福新婚婚后的幸福语)祝福别人结婚的短句子(结婚祝福短句子)祝福爸爸生日快乐句子(祝爸爸生日快乐的语录)祝福别人婚姻幸福的句子(结婚祝福语简短精辟)祝福爸爸生日暖心句子(爸爸生日怎么发圈祝福)祝夫妻幸福的祝福语四字(祝福夫妻恩爱的句子)祝二人新婚的句子简短新款的(诗经中最唯美的结婚祝福语)祝二人新婚的句子简短(有文化内涵又高雅的新婚祝福)朱熹爱惜光阴的句子(朱熹的偶成古诗)朱熹爱惜光阴的句子(朱熹写的关于时间的名言警句)竹笛古风评价句子(古风朋友句子)周末早安问候语(周末风趣幽默的句子)周六早安最简单一句话(周六搞笑正能量的句子)周二押韵短句有哪些(幽默搞笑押韵的句子)周末出去玩短句八个字(周末玩的开心的句子)重庆旅游唯美句子摘抄(重庆旅游心得简短)重庆旅游发朋友圈的句子(重庆旅游必去十大景点推荐)重庆旅行文案朋友圈搞笑句子(去重庆旅游的文案)重庆旅游的句子说说(去重庆玩文案简短一句话)重庆旅行的文案句子(旅游的文案)重庆旅游短语(重庆打卡说说经典句子)重庆旅行句子(关于重庆很文艺的句子)重庆旅行句子(重庆旅游感想简短语录)
最新回复(0)