應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

百川智能發(fā)布全鏈路領(lǐng)域增強金融大模型 Baichuan4-Finance,測試成績領(lǐng)先 GPT-4o

2024-12-24 09:09 IT之家
關(guān)鍵詞:百川智能金融大模型

導(dǎo)讀:12 月 23 日消息,百川智能發(fā)布全鏈路領(lǐng)域增強金融大模型Baichuan4-Finance。

  12 月 23 日消息,百川智能今日發(fā)布全鏈路領(lǐng)域增強金融大模型Baichuan4-Finance,融合 100B + 中英文金融知識,采用多層次質(zhì)量評估體系進行篩選,由人民大學(xué)財政金融學(xué)院金融專家團隊全程參與定義和評估。

  在中國人民大學(xué)財政金融學(xué)院新近發(fā)布的評測體系 FLAME 以及國內(nèi)開源金融評測基準 FinancelQ 上,Baichuan4-Finance 均登上榜首,金融專業(yè)能力和場景應(yīng)用能力領(lǐng)先 GPT-4o。

image.png

  Baichuan4-Finance API 現(xiàn)已在百川智能官網(wǎng)正式上線,附測試成績?nèi)缦拢?/p>

  FLAME-Cer 評測結(jié)果顯示,Baichuan4-Finance 在銀行、保險、基金、證券等多個資格認證領(lǐng)域的準確率均突破了 95%,整體準確率 93.62%,大幅領(lǐng)先 GPT-4o 和 XuanYuan3-70B-Chat,超出 GPT-4o 近 20%。

  Baichuan4-Finance 在 FLAME-Sce 評測中,一級核心金融業(yè)務(wù)場景的整體可用率達 84.15%,金融數(shù)據(jù)計算、金融知識理論等場景的可用率超過 90%。

  在國內(nèi)開源金融評測基準 FinanceIQ 中,Baichuan4-Finance 同樣超越了 GPT-4o 和 XuanYuan3-70B,整體準確率達到 79.23%,領(lǐng)先 GPT-4o 近 13%。