7B Grammar - 搜索 News

Hyena成下一代Transformer？StripedHyena-7B开源：最高128k输入，训练速度提升50%

Hyena处理长序列输入比FlashAttention速度高100倍！最新发布的StripedHyena模型可能成下一代AI架构的新标准？最近几年发布的AI模型，如语言、视觉、音频、生物等各种领域的大模型都离不开Transformer架构，但其核心模块「注意力机制」的计算复杂度与「输入序列长度 ...

腾讯网

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

近年来，大型语言模型（LLM）通过大量计算资源在推理阶段取得了解决复杂问题的突破。推理速度已成为 LLM 架构的关键属性，市场对高效快速的 LLM 需求不断增长。其中，采用 Transformer 架构的模型虽然占据了主流，但在输入序列长度增加时，计算量会呈二次方 ...

凤凰网

苹果发布DiffuCode-7B-cpGRPO编程AI模型：基于Qwen2.5-7B，可不按顺序生成代码

IT之家 7 月 5 日消息，苹果公司悄然在 Hugging Face 上发布了一款名为 DiffuCode-7B-cpGRPO 的开源 AI 模型，该模型在生成代码方面具有创新特性，能够不按顺序生成代码，且性能媲美顶级开源编码模型。 IT之家注：传统大语言模型（LLM）生成代码的方式，如同大多数 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

Hyena成下一代Transformer？StripedHyena-7B开源：最高128k输入，训练速度提升50%

原作者带队再次改造xLSTM，7B模型速度最快超Mamba 50%，权重代码全开源

苹果发布DiffuCode-7B-cpGRPO编程AI模型：基于Qwen2.5-7B，可不按顺序生成代码

今日热点