(2025-10-21热点)-DeepSeek团队开源OCR新模型:少量视觉token完成海量文本压缩

zydadmin  19

今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。

根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。

在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。

在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。

转载请注明原文地址:https://www.lzdww.com/read-201900.html
上一篇下一篇

随机主题
(2025-11-24热点)-超越《哪吒2》!《疯狂动物城2》创预售首日票房双记录(2025-11-24热点)-睡觉的时候身体突然抖一下的原因旅行发朋友圈怎么说(旅游发朋友圈的句子语调)旅游逗比文案朋友圈(晒旅游照的幽默句子)旅行与酒的句子(酒文化优美句子)(2025-11-23热点)-脸面都丢光了?这次,站C的大鹏和带口音的费翔,都不值得原谅(2025-11-22热点)-《哪吒2》真正竞争者?《疯狂动物城2》创纪录,狐兔面临最大危机(2025-11-22热点)-《哪吒2》真正的对手?《疯狂动物城2》破纪录,狐兔遭遇最大危机(2025-11-22热点)-销量太差!苹果iPhone Air大部分产线已被拆除,二代被曝无限期推迟旅游的好句子好词语(旅游好词好句好段摘抄大全)旅游的优美开头(旅游启程前的句子)(2025-11-21热点)-顶流歌手林俊杰疑似秘恋女网红 知情人爆料引发热议(2025-11-21热点)-华为Mate80,加量不加价(2025-11-21热点)-huawei mate70 air和huawei mate80那个好(2025-11-21热点)-云南发现寄生花,解开植物界谜团领证古风篇句子(晒结婚证的简短句子)落泪文案古风句子(文案句子伤感古风)鲁迅写的关于爱情的句子(鲁迅笔下的情话有多浪漫)楼兰的古风句子(楼兰头像)旅行寄语简短(旅行哲理句子精辟)龙年押韵的句子怎么写(什么叫押韵)(2025-11-20热点)-2027“人造太阳”点燃,人类或将迎来无限能源时代轮回古风的句子(古风句子)龙年祝福词押韵的句子儿童(龙年拜年词押韵)龙年押韵的句子有哪些呢(幽默搞笑押韵的句子)龙年祝福词押韵的句子7字(龙年口号大全霸气押韵)龙年祝福词押韵的句子7字(带龙字的祝福语)龙年押韵的句子简短一点(正能量押韵的句子)龙年事业祝福词押韵的句子(给属龙的人的祝福语)(2025-11-18热点)-郭晶晶广州亮相,身穿高跟鞋女王气质,笑起来太优雅了(2025-11-17热点)-霸王茶姬CEO与光伏女神结合,奶茶业零碳转型加速(2025-11-18热点)-44岁郭晶晶现身广州,没有美颜滤镜,真实状态曝光,气场令人折服(2025-11-18热点)-44岁郭晶晶露面广州,纯素颜无滤镜真实状态曝出,气场不得不服
最新回复(0)