What Is a Visul Text - 搜索 News

3 天

VIST视觉压缩：LLM长文本阅读新范式，DeepSeek-OCR理念融合

VIST框架的核心在于“快-慢阅读通路”的视觉化压缩机制。它将长文本转化为图像，通过轻量级视觉编码器快速提取显著性语义，同时将关键文本直接输入 LLM 进行深度推理。这种设计使VIST在处理相同文本内容时，所需的视觉 Token 数量仅为传统文本分词所需 Token 数量的56%，内存减少了50%。

腾讯网

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中，来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST（Vision-centric Token Compression in ...

13 天

内存直降50%，token需求少56%！用视觉方式处理长文本

此外，VIST在处理相同文本内容时，所需视觉 Token 数量比传统文本 Token 少56% （压缩比约为2.3，从 1024 个文本Token压缩到448个视觉 Token），同时显存使用减少 50% ，极大提高了计算效率。

证券之星

守擂“AI王冠”，小鹏拆掉的拐杖不止语言

唯有壮士断腕，才能拥抱新生，即便这可能充满了不确定性。正因如此，小鹏为了这次“涌现”，拆掉的拐杖不止语言。它摒弃的不止是“L”，更是对昔日成功路径的依赖。唯有壮士断腕，才能拥抱新生，即便这可能充满了不确定性。

China.org.cn

'When Words Become Images': Lu Dadong solo exhibition held in Beijing

Editor's note: "When Words Become Images," a solo exhibition by Lu Dadong, is now open at Space Station Gallery in Beijing's 798 Art District until Nov. 30. Curated by Fu Xiaodong, the show stages a s ...

China.org.cn

China Focus: Chinese screens find gold mine in online literature

"Joy of Life 2," a historical suspense series, was released overseas on Disney+ and became the platform's most-watched drama from the Chinese mainland. Other series, including "The Double," topped ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果