谷歌早有类似技术?DeepSeek-OCR开源引发战略拐点,长文本渲染图像框架如Glyph验证视觉压缩的普适性。但故事还没完。 特别是,在长上下文解码固定97%的精度下,OCR版本所需的视觉标记比文本标记少10倍。 也就是说,OCR版本的信息压缩能力比文本版本强10倍。在20倍压缩下,仍能保持60%的准确率。 长上下文解码,即模型将信息压缩为潜在表示并重建的能力。换句话说:对AI而言,单张图像可以 ...