Pytorch GPU - 搜索 News

8 天

OpenAI、Claude、通义、智谱、月暗，甚至谷歌，为什么全选择Pytorch ...

上周，于旧金山举行的 PyTorch 2025 年大会上，PyTorch 基金会技术顾问委员会的主席 Luca Antiga 发表了事关 Pytorch 长远发展的重要观点。Luca 不仅是最早参与撰写 PyTorch ...

腾讯网

“我不想永远只做PyTorch，不愿像Linus几十年都被绑在同一件事情上 ...

就在这样半感慨、半释然的心情里，PyTorch 的灵魂人物、“PyTorch 之父”Soumith Chintala 于 Meta 任职十一年零四个月后，发布了一封情绪满满的离职长文，宣布将在十天后正式告别这家科技巨头。

腾讯网

全球 PyTorch 大会与 Triton 大会揭示：算子语言繁荣和分化背后，编译 ...

当地时间2025年10月22日至23日，全球 AI 开源盛会 PyTorch Conference 2025在美国旧金山召开，从底层编译器、到大模型算法、再到智能体层面，全面探讨推动最具突破性 AI ...

新浪网

PyTorch官宣：告别CUDA，GPU推理迎来Triton加速新时代

【新智元导读】用英伟达的GPU，但可以不用CUDA？PyTorch官宣，借助OpenAI开发的Triton语言编写内核来加速LLM推理，可以实现和CUDA类似甚至更佳的性能。试问，有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰？又有多少开发者曾因为频频闪烁的警报「 ...

腾讯网

英伟达新一代GPU架构（50系列显卡）PyTorch兼容性解决方案

点击上方“Deephub Imba”,关注公众号,好文章不错过 ! 随着NVIDIA不断推出基于新架构的GPU产品，机器学习框架需要相应地更新以支持这些硬件。本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题，并详细分析了问题根源及其解决方案，以期为遇到类似情况的 ...

电子工程专辑

PyTorch宣布支持苹果M1芯片GPU加速：训练快6倍，推理提升21倍

更多精彩内容请点击上方蓝字关注我们吧！今年 3 月，苹果发布了其自研 M1 芯片的最终型号 M1 Ultra，它由 1140 亿个晶体管组成，是有史以来个人计算机中最大的数字。苹果宣称只需 1/3 的功耗，M1 Ultra 就可以实现比桌面级 GPU RTX 3090 更高的性能。随着用户 ...

电子工程专辑

英伟达PyTorch优化神器TensorRT重磅更新！10亿参数大模型实时运行，GPT ...

【导读】12月2日，英伟达发布了最新的TensorRT 8.2版本，对10亿级参数模型进行了优化，让实时运行NLP应用成为可能。与原始PyTorch模型相比，TensorRT可以将T5、GPT-2的延迟降低9到21倍。众所周知，PyTorch和TensorFlow是两个非常受欢迎的深度学习框架。 12月2日，英伟达 ...

18 小时

“不想困于舒适圈！”PyTorch之父Soumith离职Meta，欲探未知新旅程

Soumith Chintala在离职长文中，半感慨半释然地讲述了自己的心境。他表示，休完育婴假后，他发现团队处理难题的能力越来越强，项目已不再依赖他的指导。这种变化让他意识到，是时候开启新的旅程了。他不想带着从未尝试me ta之外世界的遗憾继续前行，也不愿像Guido或Linus那样，几十年都专注于同一件事。他渴望去探索未知，做一些小的、全新的、自己还不完全理解，甚至会让他感到不舒适的事情。

快科技

努力替代CUDA！摩尔线程Torch-MUSA插件升级v1.3.0 完全开源

快科技10月31日消息，摩尔线程宣布，针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”，迎来重大更新新版本v1.3.0，全面兼容PyTorch 2.2.0。新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度，能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...

凤凰网

你的Mac电脑也能在PyTorch训练中用GPU加速了

此功能由Pytorch与Apple的Metal工程团队合作推出。它使用Apple的Metal Performance Shaders(MPS) 作为PyTorch的后端来启用GPU加速训练。为了优化计算性能，MPS还针对Metal GPU系列的独特特性对每个内核进行了微调。 Metal是一个类似OpenGL的框架，只不过OpenGL适用于各平台的移动 ...

36氪

谷歌狂喜：JAX性能超越Pytorch、TensorFlow，或成GPU推理训练最快选择

7项指标排名第一。 JAX在最近的基准测试中的性能已经不声不响地超过了Pytorch和TensorFlow，也许未来会有更多的大模型诞生在这个平台上。谷歌在背后的默默付出终于得到了回报。谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow，7项指标排名第一。

新浪网

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客，详细讲解了如何利用 Hugging Face 上的库和 fsdp 以及 Q-Lora 对大模型进行微调。我们知道，Meta 推出的 Llama 3、Mistral AI 推出的 Mistral 和 Mixtral 模型以及 AI21 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果