
Mistral AI 旗下 Codestral 模型获 25.01 更新:支持超 80 种编程语言、上下文长度提至 25.6 万个 Token
Mistral AI 宣布为旗下 Codestral 编程模型推出 25.01 版本,官方强调相关版本主要在处理上下文长度和代码完成效率方面获得较大改进。
Mistral AI 宣布为旗下 Codestral 编程模型推出 25.01 版本,官方强调相关版本主要在处理上下文长度和代码完成效率方面获得较大改进。
Claude AI 开发商 Anthropic 于 11 月 25 日宣布了一项名为 Model Context Protocol 的开源协议,该协议号称是为业界 AI 助理与模型数据库提供一套标准化接口,允许各大助理通过单一协议访问各种数据源,从而加速模型响应速度与生成质量。
如今小语言模型开始升温,许多厂商开始推出适用于手机等轻量级设备的“小模型”,本周 Hugging Face 便公布了“SmolLM”小语言模型家族,其中包含 1.35 亿、3.6 亿及 17 亿参数模型。团队指出他们重点优化了模型所需的 RAM 用量,“即使是在 6GB RAM 的 iPhone 15 上也能运行”。
给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来!中科院院士鄂维南领衔,上海算法创新研究院等团队推出 Memory3,比在参数中存储知识以及 RAG 成本都更低,同时保持比 RAG 更高的解码速度。在实验中,仅有 2.4B 参数的 Memory3 模型不仅打败了许多 7B-13B 的
批评不仅能让人进步,也能让大模型的能力提升。OpenAI 就用这个思路造了个“找茬模型”CriticGPT。非常巧合的是,就在 CriticGPT 放出的前几天,北大联合千问等团队以类似的思路设计出了“数学专用版”CriticGPT。在无需训练的设置下,验证器能够在推理时辅助模型在 GSM8K 上的
IT之家 7 月 8 日消息,在 7 月 5 日举行的 2024 世界人工智能大会(WAIC)期间,商汤科技发布“日日新 SenseNova 5.5”大模型体系。吉利翼真 L380 MPV 作为首个搭载该大模型的汽车产品,也亮相 WAIC。据介绍,搭载商汤“日日新”AI 大模型的 L380,可以实现
IT之家 7 月 6 日消息,正在举行的世界人工智能大会期间,快手高级副总裁、主站业务与社区科学负责人盖坤宣布,快手文生图大模型可图正式开源,希望共建更加繁荣的文生图大模型社区生态。IT之家注意到,快手“可图”大模型于今年 5 月对外开放,目前已经上线网页版和微信小程序,支持文生图和图生图两类功能
IT之家 7 月 5 日消息,正在进行的 2024 世界人工智能大会(WAIC 2024)期间,智谱 AI 发布并开源代码生成大模型 CodeGeeX 的第四代产品 CodeGeeX4-ALL-9B,集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等所有能力于一体,号称是目
IT之家 7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。IT之家汇总主要信息如下:理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户
IT之家 7 月 5 日消息,在 2024 世界人工智能大会(WAIC 2024)上,哔哩哔哩(以下简称“B站”)公布了多项自主研发的 AI 技术成果和 AIGC 多元创意,包括最新定制的 AI 语音声库、自研音视频大模型必剪 Studio 以及自研 AI 动态漫技术等。此外,B站自研的大语言模型系
IT之家 7 月 5 日消息,据百度官方消息,百度文心智能体平台(AgentBuilder)免费开放了文心大模型 4.0。开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型 3.5 或 4.0 版本。文心大模型 4.0 于 2023 年 10 月发布,实现了基础模型的全面升级,在理解、生成、
IT之家 7 月 4 日消息,腾讯混元文生图大模型(混元 DiT)今日宣布开源小显存版本,仅需 6G 显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元 Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作
IT之家 7 月 4 日消息,在今日举行的 2024 世界人工智能大会期间,百度创始人、董事长兼首席执行官表示,模型开源与代码开源不同,无法做到众人拾柴火焰高。他指出,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。在激烈竞争的环境中,需要让业务效率比同行更高、成
IT之家 6 月 30 日消息,Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业使用,IT之家附项目地址如
IT之家 6 月 29 日消息,综合“面壁智能”“深圳市中级人民法院”官方公众号,由面壁智能公司助力的全国首个司法审判垂直领域大模型问世,AI 辅助审判系统于 28 日在深圳市中级人民法院上线运行。据介绍,该大模型能够精确诊断案情,解决 AI 在司法领域的应用难题。该系统可充分尊重裁判者的自主决策权
计算机程序可以生成很像真随机的「伪随机数」,而 LLM 表示,干脆不装了,我就有自己最喜欢的数。计算机程序中,「随机」是一个常见的概念。由于生成真正的随机数过于昂贵,所以 Python、Java 等语言都内置了「伪随机数生成算法」。虽然生成的数字序列是完全可预测的,但它看起来就像是真正的随机数。一个
IT之家 6 月 24 日消息,科大讯飞今日发布公告,公司将于 2024 年 6 月 27 日在北京国家会议中心如期发布讯飞星火大模型的最新进展。本次发布会以“懂你的 AI 助手”为主题,发布讯飞星火大模型 V4.0 及相关落地应用。官方披露发布会内容:全面提升大模型底座七大核心能力,对标 GPT-
IT之家 6 月 22 日消息,斯坦福大学基础模型研究中心(CRFM)6 月 11 日发布了大规模多任务语言理解能力评估(Massive Multitask Language Understanding on HELM)排行榜,其中综合排名前十的大语言模型中有两款来自中国厂商,分别是阿里巴巴的 Qw
OpenAI 竞争对手 Anthropic 周四发布了其迄今为止最强大的 AI 模型 Claude 3.5 Sonnet。与 OpenAI 的 ChatGPT 和谷歌 Gemini 一样,Claude 在过去的一年里也是人气爆棚。Anthropic 由 OpenAI 前研发高管创立,赢得了谷歌、S
IT之家 6 月 20 日消息,晚点 LatePost 报道称,蔚来智驾研发部近日完成架构调整。此前,蔚来智能驾驶研发部分为感知、规控和集成等部分。调整后,感知和规控团队合并为大模型团队,集成团队重组为交付团队。合并后的大模型团队由原蔚来感知团队负责人彭超负责。重组后的自动驾驶研发部仍由蔚来智能驾
【新智元导读】Alembic 首次推出用于企业数据分析和决策支持的无「幻觉」人工智能。原来大模型的「幻觉」,真的可以完全消除!近日,AI 初创公司 Alembic 首次宣布,一种全新 AI 系统完全解决了 LLM 虚假信息生成问题。也就是说,饱受诟病的 LLM 幻觉,被彻底攻破了。联创兼首席执行官
【新智元导读】刚刚,英伟达全新发布的开源模型 Nemotron-4 340B,有可能彻底改变训练 LLM 的方式!从此,或许各行各业都不再需要昂贵的真实世界数据集了。而且,Nemotron-4 340B 直接超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwe
IT之家 6 月 14 日消息,字节跳动“扣子 Coze”公众号今日宣布,扣子平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。IT之家附具体操作:用户可以在扣子官网(coze.cn)左侧导航栏中的“探索”列表找到“模型广场”,进入功能。其对战模式分为“随机 Bot 对战”“指定
IT之家 6 月 12 日消息,同济大学昨日宣布推出大模型 ChatTJ,现阶段着重为高招季考生和家长提供 24 小时全天候、不断线的咨询服务,后续将用于同济大学人才培养并拓展至学校综合事务等相关事项的常规咨询服务。IT之家附 ChatTJ 网址:https://bkzs-h5.tongji.edu
IT之家 6 月 12 日消息,苹果在昨日的 WWDC24 上重磅公布了Apple Intelligence(苹果智能),将为iPhone、Mac 等设备引入一系列 AI 功能。随后,苹果机器学习官网公布了 Apple Intelligence 的详细信息。据苹果官方介绍,Apple Intell
IT之家 6 月 12 日消息,据新浪科技,近日有媒体报道称字节跳动“已于两个月前秘密启动”AI 手机研发项目 。针对以上信息,字节跳动相关人士称:信息不实,实际上是在探索基于手机的大模型软件解决方案,提供给手机厂商参考使用。目前并没有自己做手机并销售的计划。IT之家查询获悉,该消息最初来源“AR
IT之家 6 月 11 日消息,科大讯飞今年 3 月推出了讯飞星火大模型 V3.5,而讯飞星火 V4.0 将于今年 6 月 27 日正式发布。科大讯飞董事长刘庆峰在公司成立 25 周年司庆活动上透露,讯飞星火 V4.0 发布时将展示最新的端到端智能语音落地成果,同时公司的端到端的语音技术建模方案也排
IT之家 6 月 11 日消息,中国信息通信研究院公布了可信 AI 代码大模型评估的首轮评估名单,阿里云通义灵码、华为云盘古、智谱 codegeex 等国产 AI 大模型均入选并首批通过。此次大模型评估以《智能化软件工程技术和应用要求 第 1 部分:代码大模型》标准为依据,围绕通用能力、专用场景能力
IT之家 6 月 11 日消息,主要 BIOS 企业之一系微 Insyde 近日在 2024 台北国际电脑展上宣布推出“业界首款 AI 驱动固件辅助技术” aiBIOS,适用于 x86 和 Arm 架构平台。aiBIOS 技术将 AI 同系微的旗舰固件解决方案 InsydeH2O UEFI BIOS
IT之家 6 月 11 日消息,在宣布与 OpenAI 旗下的 ChatGPT 达成合作后,苹果软件工程高级副总裁 Craig Fedrighi 在 WWDC24 开发者大会上确认了与其它第三方模型合作的计划。Fedrighi 在主题演讲后的采访中透露:“我们期待在未来与其它 AI 模型集成,例如谷
IT之家6 月 7 日,专注于保护用户隐私的搜索引擎 DuckDuckGo,周四官宣向用户免费开放 DuckDuckGo AI Chat,这是一个可以选择匿名访问 OpenAI GPT 3.5 Turbo、Anthropic's Claude 3 Haiku、Meta Llama 3 、Mixtra
IT之家 6 月 7 日消息,我国 5G 商用五周年之际,由工业和信息化部新闻宣传中心、北京市通信管理局、中国信息通信研究院将联合举办的“移动通信高质量发展论坛”在京召开。本次论坛以“智联未来 无限可能为主题”,系统总结了我国 5G 发展阶段性成果与经验,深入探讨移动通信演进升级路径与机遇。据官方介
IT之家 6 月 7 日消息,据“钛媒体 AGI”周四报道,生数科技、清华大学联合发布的国内首个长时长、高一致性、高动态性的视频大模型 Vidu 将于近期完成三大更新,实现“重大技术迭代”。主要更新内容如下:支持一键生成 32s 视频支持音视频合成,“视频有声音了”(Text-2-Audio)支持
IT之家 6 月 6 日消息,腾讯今日发布针对腾讯混元文生图开源大模型(混元 DiT)的加速库,号称大幅提升推理效率,生图时间缩短 75%。官方表示,混元 DiT 模型的使用门槛也大幅降低,用户可以基于 ComfyUI 的图形化界面使用腾讯混元文生图模型能力。同时,混元 DiT 模型已经部署至 Hu
IT之家 6 月 6 日消息,Stability AI 立足 Stable Diffusion 文生图模型,进一步向音频领域拓展,推出了 Stable Audio Open,可以基于用户输入的提示词,生成高质量音频样本。Stable Audio Open 最长可以创建 47 秒的音乐,非常适合鼓点、
IT之家 6 月 5 日消息,像 OpenAI 的 ChatGPT、谷歌的 Gemini Ultra 这样的高级 AI 模型,训练它们通常需要数百万美元的费用,且该成本还在迅速上升。随着计算需求的增加,训练它们所需的计算能力的费用也在飙升。为此,AI 公司正在重新考虑如何训练这些生成式 AI 系统。
IT之家 6 月 5 日消息,在今天举行的智谱 AI Open Day 上,智谱 AI 宣布全模型矩阵降价。IT之家附降价情况如下:GLM-4-Air、GLM-3-Turbo 现价 0.6 元 / 百万 TokensEmbedding-2 现价 0.3 元 / 百万 TokensGLM-4-Flas
斯坦福 AI 团队,竟然曝出了抄袭事件,而且抄袭的还是中国国产的大模型成果 —— 模型结构和代码,几乎一模一样!跟任何抄袭事故一样……AI 圈内都惊呆了。斯坦福的这项研究叫做 Llama3-V,是于 5 月 29 日新鲜发布,宣称只需要 500 美元就能训出一个 SOTA 多模态大模型,比 GPT-
IT之家 5 月 30 日消息,快手自研文生图大模型“可图”已于近日正式对外开放,其目前支持文生图和图生图两类功能,可用于 AI 创作图像以及 AI 形象定制。用户可通过“可图”微信小程序和网页版使用。据界面新闻报道,这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型
开源代码大模型的王座,再次易主!来自素有“欧洲 OpenAI”之称的 Mistral,用 22B 参数量表现超越了 70B 的 Code Llama。模型名为 Codestral,将代码的英文 Code 与公司名结合而成。在 80 多种编程语言上进行过训练后,Codestral 用更少的参数实现了更
IT之家 5 月 29 日消息,昆仑万维旗下海外信息分发与元宇宙平台 Opera 宣布与谷歌云合作,将谷歌 Gemini 大模型整合至原生浏览器 AI 助手 Aria 中。▲图源昆仑万维官方公众号,下同据介绍,Opera 原生浏览器 AI 助手 Aria 由 Opera multi-LLM Comp
IT之家 5 月 28 日消息,安全公司 Wiz 近日发布报告,宣称开源 AI 模型共享平台 Replicate 存在重大漏洞,黑客可通过恶意模型进行“跨租户攻击”(IT之家注:即利用存在于多租户环境中的安全漏洞访问 / 干扰其他租户的数据资源),从而导致平台用户训练的AI模型内部机密数据泄露。安全
IT之家 5 月 27 日消息,综合上海证券报、“四川建设发布”消息,国务院新闻办公室今日上午举行“推动高质量发展”系列主题新闻发布会,四川省委副书记、省长黄强表示,四川把人工智能作为一号创新工程,推动绿氢全产业链发展和推广应用,打造生物技术、卫星网络、智能网联新能源汽车、无人机和工业互联网等战略性
IT之家 5 月 26 日消息,微软在今年4月至 5 月陆续公布了一系列 Phi-3 小语言模型 (SLM),相关模型号称“轻巧到可以在移动设备上运行”,同时具备视觉能力,能够理解文字和图片,主要用于低功耗计算场景。目前英特尔发布新闻稿,声称目前开发人员已经就 Phi-3 模型对自家 Gaudi A
API 商业模式能不能成立,最终并不只是看价格。作者 | 宛辰编辑| 靖宇5 月 21 日上午,阿里云在其例行峰会上,意外地释放了大降价的消息:通义千问 GPT-4 级主力模型推理输入价格降至 0.5 元 / 百万 tokens,直降 97%。阿里云降价公告 | 来源:阿里云这个大幅度降价的消息瞬间
IT之家 5 月 24 日消息,据“360 公司”官方公众号,360 集团和极氪今天签署了战略合作协议。根据协议,360 将充分结合极氪在新能源汽车领域数字化建设及智能化转型的业务场景,提供全方位的技术支持。官方表示,双方将在安全领域全面保障车企自身数字化安全、车机座舱数据安全、隐私安全;在大模型领
北京时间 5 月 23 日晚间消息,英伟达 CEO 黄仁勋今日表示,支持视频生成的新 AI 模型将进一步刺激英伟达 AI 芯片的需求。在此之前,以 ChatGPT 为代表的 AI 聊天机器人已经引发了英伟达 AI 芯片的短缺。但英伟达现预计,能够创建视频和进行类似人类的语音交互的新 AI 模型,将进
IT之家 5 月 22 日消息,2024 华为影像 XMAGE 品牌之夜于今日下午四时举行,华为终端 BG CTO 李小龙在活动上公布了华为 XMAGE 未来影像进化十大趋势。IT之家整理如下:极致紧凑,极致影像表现新型光学材料/高性能传感器/超精密模组拍得到、拍得清XD Motion 运动引擎/X
IT之家 5 月 21 日消息,字节跳动上周发布了豆包大模型并宣布大模型价格进入“厘时代”,号称“比行业便宜 99.3%”。今日,阿里云也宣布通义千问 Qwen-Long 降价 97% 来应战。现在,百度文心大模型更进一步,直接宣布其两款主力模型 ENIRE Speed、ENIRE Lite 全面
IT之家 5 月 20 日消息,英国政府下属的人工智能安全研究所(AISI)今日发布了一份新报告,揭示了一个值得重视的事实 —— 当前的 AI 系统可能并非像创建者所说的那样“安全”。报告指出,参与测试的四个大语言模型(IT之家注:报告未提到这些模型的具体名称)“极易受到基本越狱攻击”的影响,更有一
IT之家 5 月 20 日消息,在今晚的小鹏 AI 智驾发布会上,小鹏汽车发布了天玑系统 XOS 5.1,目前已推送至小鹏 X9、G9、P7i、G6 四款型号汽车。小鹏 P7 将于今年 Q3 开启公测、P5、G3i 及 G3 将于 2025 年 Q1 开启公测。IT之家附小鹏汽车的天玑 XOS 5