中新社北京9月19日電 (記者 孫自法)由中國科研團隊成功研發的全球首個多模態地理科學大模型“坤元”,19日在北京正式發佈。作為一款專注於地理科學的專業語言大模型,“坤元”具備處理地理科學相關問題的專業能力,堪稱“智能地理學家”,致力於推動地理學與人工智能深度融合。
中國科學院地理科學與資源研究所(地理資源所)當天舉行專題新聞發佈會介紹說,“坤元”大模型通過地理學全譜系高質量語料庫構建、地理科學語言大模型構建、地理科學研究智導平台研發等工作,讓“坤元”具備“懂地理”“精配圖”“知人心”“智生圖”等特點,實現地理專業問題解答、地理學文獻智能分析、地理數據資源查詢、地理數據挖掘分析、專題地圖繪製等功能。
“坤元”大模型研發組首席科學家、中國科學院地理資源所副所長蘇奮振研究員指出,“懂地理”方面,研發團隊建立涵蓋4大類、16小類的地理全學科語料庫,提供320億詞元供大模型自監督學習,並製作出4萬餘條高質量地理學指令進行模型微調。相比通用語言大模型,“坤元”更熟悉地理學的語言模式、專業術語和領域知識,在地理學基準測試集上的準確性提昇了31.3%。
“精配圖”方面,自主研發出面向多層次地圖信息的多模態檢索技術、支持地理認知與圖形表達的知識推理技術,使得“坤元”能够在解答地理學提問的同時,可根據生成的文字答案檢索不同地理要素,並匹配地理景觀照片、專題地圖或示意圖表呈現給提問者。
“知人心”方面,創新提出基於“認知啟航—應用智導—前沿研析”框架的用戶畫像精準判別與響應技術,保證“坤元”能够充分考慮地理知識愛好者、地理學專業學生以及科研人員的地理科學知識體係認知和表達差異,以圖文共現的方式給出適配用戶知識結構的地理學專業問題解答。
“智生圖”方面,基於“坤元”開發的科研助手,可根據用戶指令完成概念理解、數據獲取、信息分析、製圖綜合等流程,最終生成用戶需要的專業地理圖表。
中國研發併發佈的全球首個多模態地理科學大模型為何取名“坤元”?蘇奮振解釋說,源自“乾坤”的“坤”即大地;“元”是起始,又是“神經元”,所以,“坤元”就是指關於大地的神經元係統,大地的智能,也就是地理科學的智能。
他透露,“坤元”研發團隊後續將推進地圖大模型及地理推理機研發,並打造地理科研協作大平台,以期讓每個科學家和科研團隊都可以擁有專屬的地理大模型,能够與數百萬科學家通過共享數據、模型、研究思路等方式協同工作。(完)
來源中新社