IT之家 9 月 20 日消息,在今年 8 月的 2023小米雷军年度演讲上,小米 AI 大模型首次公布。相比其他公司的千亿万亿参数模型,小米 AI 大模型并没有专注于扩张超大参数,而是尝试将 13 亿参数的模型放到用户的手机本地运行。
近日,小米集团 AI 实验室主任,自然语言处理(NLP)首席科学家王斌在接受声动活泼采访时透露了他们的考量,并表示未来一定是大小模型共存,通用和专用共存的状态。
王斌称,与其他公司不同,小米拥有大量设备,目前这些设备的计算能力已经大幅提升,比如现在手机上搭载的芯片计算能力比以前提升很多。其次,小米是重端侧的公司,如果要大量调用云端算力,成本比较高。此外,用户隐私、用户使用手机时的网络情况等也是我们的考量因素。
不过,大模型的参数量太小也会影响用户的使用体验,因此小米需要在模型规模与硬件门槛之间做好平衡。
王斌表示:“我们相信除了通用能力,不同维度的小模型可能更适合某一项任务,所以最后可能是以混合体的形式出现,既有云端,也有端侧,既有大模型,也有小模型,通过共通的生态把用户体验做到极致。”
据IT之家此前报道,雷军在 2023 年度演讲中表示,小米已经布局 12 个技术领域,99 个细分赛道,未来 5 年技术投入 1000 亿元人民币。在 AI 方面,小米从 2016 年 7 月起就开始布局,今年 4 月成立大模型团队,相关团队超过 3000 人。
目前,小爱同学现已开始升级 AI 大模型能力,不过还没有大范围开放。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。