(2025-10-21热点)-DeepSeek团队开源OCR新模型:少量视觉token完成海量文本压缩

zydadmin  116

今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。

根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。

在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。

在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。

转载请注明原文地址:https://www.lzdww.com/read-201900.html
上一篇下一篇

随机主题
闺蜜深情寄语简单有含义短句闺蜜陪伴的说说心情闺蜜生日贺卡简短怎么写闺蜜三十年抖音文案闺蜜情深的句子简短闺蜜深情语录闺蜜生日8个字霸气搞笑闺蜜陪伴语录经典短句做生意早上发朋友圈的精美句子(生意早上满满的正能量句子)做优秀的自己好词好句摘抄(致自己一句话精辟句子)做销售晚安温馨句子(新手怎么做销售)(2026-04-17-热点)微信又有新功能,网友:好玩,我的朋友有福了做人最基本的道理(人品干净的句子)做人的格局和人品的句子怎么说(大事看格局小事看人品)做人的格局和人品的句子(要懂得尊重别人的朋友圈)作文开头描写时间快的句子(时间过得很快高情商开头)作文好开头(作文好句子摘抄大全)作文神仙句子古风(古风仙气冷清句子)作文时间开头优美句子(以时间为开头写一句话)作文古风句子文案(惊艳一句话文案)作文古风句子文案(唯美古风文案句子)作文古风句子文案(可以写进作文里的古风句子)作文开头描写时间快的句子(表示时间过得很快开头怎么写)作文古风句子含义(优美作文开头结尾摘抄)作文古风句子文案(唯美文案句子)作文素材古风句子(求而不得的古风句子)作文古风句子文案(可爱的文案句子)最新古风唯美句子(文艺有韵味复古的句子)最新早上问候语暖心句子(早上好祝福语优美句子)最新工作励志句子说说(工作励志的句子简短)最暖心的孝心说说(关于孝心的句子)最强团队七言绝句(形容团队非常棒的句子)最能打动情人心的短信短句(让情人看到暖心的句子)
最新回复(0)