当前标签

模型

院士领衔推出大模型的第 3 种记忆:比参数存储和 RAG 都便宜,2.4B 模型越级打 13B

给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出 Memory3,比在参数中存储知识以及 RAG 成本都更低,同时保持比 RAG 更高的解码速度。在实验中,仅有 2.4B 参数的 Memory3 模型不仅打败了许多 7B-13B 的

快手文生图大模型“可图”宣布开源,现已上线微信小程序和网页版

IT之家 7 月 6 日消息,正在举行的世界人工智能大会期间,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图正式开源,希望共建更加繁荣的文生图大模型社区生态。IT之家注意到,快手“可图”大模型于今年 5 月对外开放,目前已经上线网页版和微信小程序,支持文生图和图生图两类功能

理想汽车启动端到端 + 视觉语言模型早鸟计划:车辆将具备“思考能力”

IT之家 7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。IT之家汇总主要信息如下:理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户

腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型

IT之家 7 月 4 日消息,腾讯混元文生图大模型(混元 DiT)今日宣布开源小显存版本,仅需 6G 显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作

百度李彦宏:商业化闭源模型最能打,没有应用开闭源全都一文不值

IT之家 7 月 4 日消息,在今日举行的 2024 世界人工智能大会期间,百度创始人、董事长兼首席执行官表示,模型开源与代码开源不同,无法做到众人拾柴火焰高。他指出,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。在激烈竞争的环境中,需要让业务效率比同行更高、成

全国首个司法审判垂直领域 AI 大模型在深圳市中级人民法院上线运行

IT之家 6 月 29 日消息,综合“面壁智能”“深圳市中级人民法院”官方公众号,由面壁智能公司助力的全国首个司法审判垂直领域大模型问世,AI 辅助审判系统于 28 日在深圳市中级人民法院上线运行。据介绍,该大模型能够精确诊断案情,解决 AI 在司法领域的应用难题。该系统可充分尊重裁判者的自主决策权

你也喜欢 72?大语言模型最喜欢的随机数揭晓

计算机程序可以生成很像真随机的「伪随机数」,而 LLM 表示,干脆不装了,我就有自己最喜欢的数。计算机程序中,「随机」是一个常见的概念。由于生成真正的随机数过于昂贵,所以 Python、Java 等语言都内置了「伪随机数生成算法」。虽然生成的数字序列是完全可预测的,但它看起来就像是真正的随机数。一个

科大讯飞:星火 V4.0 大模型“对标 GPT

IT之家 6 月 24 日消息,科大讯飞今日发布公告,公司将于 2024 年 6 月 27 日在北京国家会议中心如期发布讯飞星火大模型的最新进展。本次发布会以“懂你的 AI 助手”为主题,发布讯飞星火大模型 V4.0 及相关落地应用。官方披露发布会内容:全面提升大模型底座七大核心能力,对标 GPT-

消息称蔚来重组智驾团队,用端到端大模型实现高阶智能驾驶

IT之家 6 月 20 日消息,晚点 LatePost 报道称,蔚来智驾研发部近日完成架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚来感知团队负责人彭超负责。重组后的自动驾驶研发部仍由蔚来智能驾

大模型「幻觉」全无?图神经网络成破解核心,精准预测因果消除「幻觉」

【新智元导读】Alembic 首次推出用于企业数据分析和决策支持的无「幻觉」人工智能。原来大模型的「幻觉」,真的可以完全消除!近日,AI 初创公司 Alembic 首次宣布,一种全新 AI 系统完全解决了 LLM 虚假信息生成问题。也就是说,饱受诟病的 LLM 幻觉,被彻底攻破了。联创兼首席执行官

字节跳动相关人士回应“研发 AI 手机”:实为基于手机的大模型软件解决方案

IT之家 6 月 12 日消息,据新浪科技,近日有媒体报道称字节跳动“已于两个月前秘密启动”AI 手机研发项目 。针对以上信息,字节跳动相关人士称:信息不实,实际上是在探索基于手机的大模型软件解决方案,提供给手机厂商参考使用。目前并没有自己做手机并销售的计划。IT之家查询获悉,该消息最初来源“AR

中国信通院公布 AI 代码大模型评估,阿里云、华为、商汤等首批通过

IT之家 6 月 11 日消息,中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力

华为拟打造“小艺”超级助手:基于盘古大模型,融汇 5G + AI 能力

IT之家 6 月 7 日消息,我国 5G 商用五周年之际,由工业和信息化部新闻宣传中心、北京市通信管理局、中国信息通信研究院将联合举办的“移动通信高质量发展论坛”在京召开。本次论坛以“智联未来 无限可能为主题”,系统总结了我国 5G 发展阶段性成果与经验,深入探讨移动通信演进升级路径与机遇。据官方介

快手上线自研文生图大模型“可图”,消息称参数规模达十亿级

IT之家 5 月 30 日消息,快手自研文生图大模型“可图”已于近日正式对外开放,其目前支持文生图和图生图两类功能,可用于 AI 创作图像以及 AI 形象定制。用户可通过“可图”微信小程序和网页版使用。据界面新闻报道,这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型

AI 平台 Replicate 曝“跨租户攻击”安全隔离漏洞,用户自训练人工智能模型可被黑客入侵

IT之家 5 月 28 日消息,安全公司 Wiz 近日发布报告,宣称开源 AI 模型共享平台 Replicate 存在重大漏洞,黑客可通过恶意模型进行“跨租户攻击”(IT之家注:即利用存在于多租户环境中的安全漏洞访问 / 干扰其他租户的数据资源),从而导致平台用户训练的AI模型内部机密数据泄露。安全

四川:将人工智能作为一号创新工程,发力智算芯片、算法模型等重点领域

IT之家 5 月 27 日消息,综合上海证券报、“四川建设发布”消息,国务院新闻办公室今日上午举行“推动高质量发展”系列主题新闻发布会,四川省委副书记、省长黄强表示,四川把人工智能作为一号创新工程,推动绿氢全产业链发展和推广应用,打造生物技术、卫星网络、智能网联新能源汽车、无人机和工业互联网等战略性

中国大模型价格战背后的真相

API 商业模式能不能成立,最终并不只是看价格。作者 | 宛辰编辑| 靖宇5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元 / 百万 tokens,直降 97%。阿里云降价公告 | 来源:阿里云这个大幅度降价的消息瞬间

周鸿祎喜提极氪 009 光辉后,360 与极氪宣布在安全、大模型领域深度合作

IT之家 5 月 24 日消息,据“360 公司”官方公众号,360 集团和极氪今天签署了战略合作协议。根据协议,360 将充分结合极氪在新能源汽车领域数字化建设及智能化转型的业务场景,提供全方位的技术支持。官方表示,双方将在安全领域全面保障车企自身数字化安全、车机座舱数据安全、隐私安全;在大模型领

英国 AI 安全研究所轻松越狱主要大语言模型,令其输出有害内容

IT之家 5 月 20 日消息,英国政府下属的人工智能安全研究所(AISI)今日发布了一份新报告,揭示了一个值得重视的事实 —— 当前的 AI 系统可能并非像创建者所说的那样“安全”。报告指出,参与测试的四个大语言模型(IT之家注:报告未提到这些模型的具体名称)“极易受到基本越狱攻击”的影响,更有一

微信扫一扫

微信扫一扫
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close