随着大型语言模型(LLM)越来越普及,背后的AI技术也越来越成熟。过去,芯片的焦点在于模型训练(Pre-Training),需要强大的运算力来“教导”AI。但现在,AI的重心逐渐转向“推理”(Inference,也就是模型实际应用、回答问题或生成内容 ...