Llama相关文章列表 - 蓝鸢梦想

Meta 推出 Llama 3.2 1B / 3B 模型量化版：功耗更低、可适用更多轻量移动设备

继今年 9 月开源 Llama 3.2 的 1B 与 3B 模型之后，Meta 于 10 月 24 日发布了这两个模型的量化版本，量化后的模型大小平均减少了 56%，RAM 使用量平均减少了 41%，模型速度提高了 2 至 4 倍，同时降低了功耗，使这些模型能够部署到更多移动设备上。目前，Meta 已在一加 12、三星 S24+/S22 及苹果 iOS 设备（未公布具体型号）等移动平台测试这些经过量化后模型，测试“运行结果良好”，研究人员未来还计划通过神经处理单元（NPU）提升这些量化模型的性能。

0 431 0

休闲区

Meta 发布 Llama 3.1 开源大语言模型：128K 上下文长度，405B 版可与 GPT-4o 和 Claude 3.5 Sonnet 媲美

Meta 今晚发布 Llama 3.1 开源大语言模型，提供 8B、70B 及 405B 参数版本，改进了推理能力及多语言支持，上下文长度提升至 128K。

0 163 0

Llama

微信扫一扫