What Is a Visul Text - 搜索 News

3 天

VIST视觉压缩：LLM长文本阅读新范式，DeepSeek-OCR理念融合

VIST框架的核心在于“快-慢阅读通路”的视觉化压缩机制。它将长文本转化为图像，通过轻量级视觉编码器快速提取显著性语义，同时将关键文本直接输入 LLM 进行深度推理。这种设计使VIST在处理相同文本内容时，所需的视觉 Token 数量仅为传统文本分词所需 Token 数量的56%，内存减少了50%。

腾讯网

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在 NeurIPS 2025 论文中，来自南京理工大学、中南大学、南京林业大学的研究团队提出了一个极具突破性的框架 ——VIST（Vision-centric Token Compression in ...

17 小时

ConsistEdit：重新定义AI视觉编辑，港科大、清华等机构提出MM-DiT注意力 ...

最近，来自香港科技大学、清华大学、 IDEA研究院和香港科技大学（广州）的研究者们，共同提出了一种名为ConsistEdit ...

1 天

守擂“AI王冠”，小鹏拆掉的拐杖不止语言

唯有壮士断腕，才能拥抱新生，即便这可能充满了不确定性。正因如此，小鹏为了这次“涌现”，拆掉的拐杖不止语言。它摒弃的不止是“L”，更是对昔日成功路径的依赖。唯有壮士断腕，才能拥抱新生，即便这可能充满了不确定性。

China.org.cn

China Focus: Chinese screens find gold mine in online literature

"Joy of Life 2," a historical suspense series, was released overseas on Disney+ and became the platform's most-watched drama from the Chinese mainland. Other series, including "The Double," topped ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果