Jina AI 推出全球首个开源 8K 文本嵌入模型,号称“超越 OpenAI”

IT之家 10 月 26 日消息,Jina AI 在其官网发布新闻稿,宣布推出jina-embeddings-v2模型,号称是目前是唯一支持8K(8192个 token)上下文长度的开源产品,在功能和性能上与OpenAI的text-embedding-ada-002类似。

Jina AI 推出全球首个开源 8K 文本嵌入模型,号称“超越 OpenAI”休闲区蓝鸢梦想 - Www.slyday.coM

在大规模文本嵌入基准(MTEB)排行榜方面,IT之家发现,官方进行如下解释:

与OpenAI的8K模型text-embedding-ada-002进行比较,jina-embedding-v2在分类平均值、重排平均值、检索平均值和摘要平均值方面均优于OpenAI的text-embedding-ada-002。

Jina AI 推出全球首个开源 8K 文本嵌入模型,号称“超越 OpenAI”休闲区蓝鸢梦想 - Www.slyday.coM

▲ 图源 Jina AI 官网

Jina AI 推出全球首个开源 8K 文本嵌入模型,号称“超越 OpenAI”休闲区蓝鸢梦想 - Www.slyday.coM

▲ 图源 Jina AI 官网

官方表示,jina-embeddings-v2 模型,是从头开始构建的。在过去的三个月里,Jina AI团队进行了密集研发、数据收集和调整。

Jina AI同时声称,jina-embeddings-v28K的上下文长度有利于以下应用场景:

法律文件分析:确保对大量法律文本中的每一个细节进行捕捉和分析。

医学研究:为了进行高级分析和发现,全面地嵌入科学论文。

文学分析:深入研究长篇内容,捕捉微妙的主题元素。

财务预测:通过详细的财务报告获得卓越的洞察力。

会话式AI:提升聊天机器人对复杂用户查询的响应能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

相关推荐

  • 友情链接:
  • PHPCMSX
  • 智慧景区
  • 微信扫一扫

    微信扫一扫
    返回顶部

    显示

    忘记密码?

    显示

    显示

    获取验证码

    Close