近日,中國平安金融大模型PingAnGPT-Qwen3-32B在行業(yè)權威大模型評測體系CNFinBench大語言模型公開榜單上綜合排名第一。本次參評模型陣容強大、競爭激烈,涵蓋DeepSeek-R1(671B)、Qwen3-235B-A22B、Kimi-K2(1000B)等開源大模型,以及 GPT-4o、Claude-Sonnet 4、Doubao-1.5-pro 等領先的閉源商業(yè)模型,代表當前行業(yè)最高水平。此次評測登頂也標志著平安在金融大模型領域的技術能力已達到行業(yè)先進水平。

CNFinBench是由上海人工智能國家實驗室團隊聯(lián)合金融領域權威機構打造的中文金融大模型綜合性評測基準,為當前國內最具權威性和行業(yè)認可度的金融大模型能力評估平臺。本次測評中,PingAnGPT-Qwen3-32B在金融事實推理與計算、金融專業(yè)知識問答、金融合規(guī)與風險控制等多項關鍵指標表現(xiàn)卓越,展現(xiàn)出精準的金融數(shù)值計算能力、嚴謹?shù)倪壿嬐评砟芰腿鹑陬I域知識體系的深度掌握,尤其在金融投研分析、風險計量等場景具有重要應用價值和安全可控優(yōu)勢。
評測方表示,此次登頂CNFinBench,體現(xiàn)了平安在金融大模型領域的技術實力。值得關注的是,中國平安參評的模型僅采用 32B參數(shù)規(guī)模,不足 DeepSeek-R1(671B)的5%及Kimi-K2(1000B)的 3.2%規(guī)模,卻實現(xiàn)了綜合性能上的超越,在模型效率與性能平衡上實現(xiàn)了重要技術突破。依托于"輕量高效"特性,該模型已支持產險車險報案、人事員服智能問數(shù)、客服實時質檢、智能話術、集團財資費用審核等97個業(yè)務場景,并為其后續(xù)在私有化部署、場景化應用提供了堅實基礎。
據(jù)悉,CNFinBench評測體系覆蓋金融專業(yè)知識問答、金融業(yè)務理解與分析、金融事實推理與計算、金融合規(guī)與風險控制、金融內生與應用安全五大核心維度,全面檢驗模型在金融垂直領域的專業(yè)深度、業(yè)務理解力、計算準確性、合規(guī)意識及安全可控性。
2025年前三季度,平安的數(shù)據(jù)庫已沉淀30萬億字節(jié)數(shù)據(jù),覆蓋近2.50億個人客戶;基于海量數(shù)據(jù)訓練大模型,積累超3.2萬億高質量文本語料,31萬小時帶標注的語音語料,超75億圖片語料。以海量數(shù)據(jù)為基礎,以科技公司服務技術開發(fā)與應用,平安持續(xù)拓展場景應用的深度和廣度,賦能金融業(yè)務優(yōu)體驗、控風險、降成本、促銷售。2026年2月,國家知識產權出版社發(fā)布《金融科技行業(yè)2025年專利分析白皮書》與《醫(yī)療健康行業(yè)2025年專利分析白皮書》,中國平安再度攬獲2025年金融科技、醫(yī)療健康行業(yè)專利數(shù)雙榜首,并在多項核心技術與關鍵應用場景中占據(jù)領先地位。
中國平安表示,通過打造領先AI能力,推進模型優(yōu)化迭代,深化場景化應用落地,公司持續(xù)將技術優(yōu)勢轉化為服務價值,以高質量的數(shù)字化金融供給,不斷滿足人民群眾對美好生活的向往,踐行"省心、省時、又省錢"的服務承諾,為金融強國建設貢獻平安力量。
