Jina AI 推出全球首個開源 8K 文本嵌入模型,號稱超越 OpenAI
發(fā)布時間:2023-10-26 16:30:09來源:
10 月 26 日消息,Jina AI 在其官網宣布新聞稿,發(fā)布推出jina-embeddings-v2模型,號稱是目前是唯一支撐8K(8192個 token)上下文長度的開源產品,在功效和性能上與OpenAI的text-embedding-ada-002相似。
在大規(guī)模文本嵌入基準(MTEB)排行榜方面, 發(fā)現(xiàn),官方進行如下解釋:
與OpenAI的8K模型text-embedding-ada-002進行比擬,jina-embedding-v2在分類平均值、重排平均值、檢索平均值和摘要平均值方面均優(yōu)于OpenAI的text-embedding-ada-002。
▲ 圖源 Jina AI 官網
▲ 圖源 Jina AI 官網
官方表現(xiàn),jina-embeddings-v2 模型,是從頭開端構建的。在過去的三個月里,Jina AI團隊進行了密集研發(fā)、數(shù)據收集和調劑。
Jina AI同時聲稱,jina-embeddings-v28K的上下文長度有利于以下使用場景:
法律文件剖析:確保對大批法律文本中的每一個細節(jié)進行捕捉和剖析。 醫(yī)學研討:為了進行高等剖析和發(fā)現(xiàn),全面地嵌入科學論文。 文學剖析:深刻研討長篇內容,捕捉奧妙的主題元素。 財務預測:通過詳細的財務報告獲得卓著的洞察力。 會話式AI:晉升聊天機器人對龐雜用戶查詢的響應才能。
(責編: admin)
免責聲明:本文為轉載,非本網原創(chuàng)內容,不代表本網觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。