(2025-10-21热点)-DeepSeek团队开源OCR新模型:少量视觉token完成海量文本压缩

zydadmin  62

今天上午,DeepSeek-AI 团队发布《DeepSeek-OCR:Contexts Optical Compression》论文,提出利用视觉模态压缩长文本上下文的新方法。Hugging Face 页面显示,该模型的参数量为 3B。

根据介绍,此次开源的 DeepSeek-OCR 由两个部分组成:核心编码器 DeepEncoder 和解码器 DeepSeek3B-MoE-A570M。DeepEncoder 专为在高分辨率输入下保持低计算激活而设计,同时实现高压缩比,以控制视觉 token 数量在可管理的范围内。实验显示,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%,展现出在历史文档长上下文压缩和大语言模型记忆机制研究中的巨大潜力。DeepSeek-OCR 同时具备较高的实际应用价值。

在 OmniDocBench 测试中,DeepSeek-OCR 使用 100 个视觉 token 就超过了 GOT-OCR2.0(每页 256 个 token),而使用不到 800 个视觉 token 便优于 MinerU2.0(平均每页超过 6000 个 token)。

在实际生产中,DeepSeek-OCR 可在单块 A100-40G 显卡上每天生成超过 20 万页的大语言模型 / 视觉语言模型训练数据。

转载请注明原文地址:https://www.lzdww.com/read-201900.html
上一篇下一篇

随机主题
冬天唯美的句子十字(友谊短句十字霸气)冬天晚安暖心句子短句(晚安情话简短)冬天晚安问候祝福语(天气冷晚安温馨句子)冬天晚安暖心句子(简单大气的晚安句子)冬天晚安说说心情长句(天冷晚安温馨句子简短)冬天晚安的暖心句子说说(三句晚安情话)冬天晚安的句子最暖心短句(简单又暖心的晚安文案)冬天晚安的暖心句子(6个字晚安)冬天暖心句子简短(冬天很冷却很温暖的句子)冬天情感散文(天冷了高情商的暖心句子)冬天让人暖心的句子(冬天有什么优点)冬天是什么的排比句(冬天像什么写句子)冬天暖心句子简短(寒冷冬日的暖心句子)冬天朋友圈文案句子简短暖心(一秒入冬的唯美句子)冬天暖心短句8字(温暖相伴唯美句子)冬天暖心短句8字(天冷了高情商的暖心句子)冬天描写的句子大全(用冬天写一句话)冬天描写的句子大全(描写冬季的优美语段)冬天旅游的说说(开心旅游的幽默句子)冬天旅游美句(冬之旅经典句子)冬天里的暖心句子(天冷照顾好自己句子简短)冬天浪漫的短句文案(有关深冬的浪漫句子)冬天励志的句子致自己简短(享受冬日暖阳的心情句子)冬天旅行的句子唯美短句(关于冬天景色的优美句子)冬天最美的短句(赞美冬日阳光明媚句子)冬天组句子一年级(雪人造句子)冬天祝福语句句暖心简短(冬日寄语唯美句子)冬天最短好句(冬日寄语唯美句子)冬天最美的短句文案(冬天享受阳光的优美句子)冬天作文结尾优美句子(冬日暖阳的结尾)冬天赞美的句子(冬日暖阳的唯美小诗)冬天早晨的景色描写(夸赞冬天美景的句子)冬天优美句子摘抄大全(冬天励志语录经典短句)
最新回复(0)