2023年的五月,稱得上一句AI之夏。
大模型層出不窮、扎堆發布。
這一輪由大模型推動的AI熱潮中, NLP(自然語言處理)技術與金融落地場景的結合備受期待。金融行業是數字化、智能化的先行者,也是大模型技術落地的最佳領域。如果將大模型的能力放在金融行業中去處理原有的任務,會對很多工作產生顛覆性的影響。
對科技企業來說,不僅要積極參與“訓大模型”的技術競賽,更重要的是,從場景出發,用最快速度完成大模型的業務落地、找到可行的產業邏輯。
這條“NLP+金融”的技術落地之路,度小滿已經走了五年。作為源自百度的公司,度小滿在NLP上的積累得天獨厚。我們從度小滿NLP開始,去看看NLP與金融的可能性,以及AI走向產業的應用落地是如何實現的。
大模型時代, 打開NLP+金融的想象力
大模型的到來,讓NLP技術在金融領域的應用,打開了想象空間。
幾乎所有金融單位都要處理大量文本、文檔,NLP技術有潛力貫穿金融業務的所有環節:
1.讀。超大規模的預訓練生成式大模型,能夠對金融業務場景中的數據信息和隱藏知識進行更高效的挖掘和理解,“多快好省”從文檔文本數據中抽取出相應的信息,包括文檔智能信息抽取、OCR、輿情分析、暴雷事件分析、報警、風控等,提高決策能力。
比如信貸輔助決策,基于強大的語義理解能力,讀懂非結構化數據,包括財務報告自動化解析、數據智能挖掘、信貸流水材料智能處理、宏觀行業分析、風險事件傳導分析等。
在金融領域,征信報告是識別個人信用的最重要風控手段,小微企業融資難,一個主要原因是個人征信報告中存在大量非結構化數據,很難用傳統的數據處理方式進行分析。度小滿“智能化征信解讀中臺”,將NLP、圖算法應用在征信報告的解讀上,能夠將報告解讀出40萬維的風險變量,將銀行風控模型的風險區分度提升了26%。
- 寫。利用大模型的生成能力,自動化生成金融信息的抽取匯總、年報、行情預判、客戶畫像、營銷方案等,成為金融從業人員的“全能助理”, 提升金融機構的效率。
3.說。基于自然語言的通用對話能力,更智能的任務式對話理解,打造全新的的智能客服、智能交互服務,例如 “超級金融顧問”,提供專業建議和方案輔助交流,快速高效低成本地響應用戶需求,讓金融更有溫度。
從“智能”到“致用”:度小滿的NLP之路
自然語言處理是人工智能皇冠上的明珠,但在大語言模型展露出強大的通用能力之前,如何用這顆“明珠”洞察金融數據,沒有現成的路可走,全世界專注做NLP公司都比較少。2018年的時候,金融科技公司成立專門的NLP團隊的更是鮮見,NLP在金融領域的應用落地也相對有限。
度小滿則走出了一條獨特的NLP之路。2018年創立之初,度小滿就看到了“NLP+金融”的潛力,開始進行相應的產業布局。
首先是人才。人才是創新的源頭。作為源自百度的公司,度小滿在NLP技術上的人才儲備可為得天獨厚。度小滿CTO許冬亮,2005年從清華大學計算機系人工智能實驗室畢業后加入百度,三年多時間成長為百度搜索算法領域的領軍人物,在自然語言處理、搜索算法及架構、知識圖譜、LBS、智能營銷及反欺詐等領域屢破難關。度小滿技術委員會執行主席楊青,曾任百度主任架構師,有著豐富的技術應用實踐經驗。
有了人才作為技術創新的驅動力,度小滿在NLP前沿領域持續探索,并不斷斬獲成果。
2021年,在微軟舉辦的MS MARCO 比賽中的文檔排序Document Ranking(文檔排序)任務中,度小滿的AI-NLP團隊排名第一并刷新紀錄。2022年,團隊研發的軒轅 (XuanYuan) 預訓練模型也在中文語言理解領域最具權威性的測評基準之一CLUE分類任務中排名第一。度小滿AI-Lab在預訓練模型、用戶表示、序列建模等NLP任務相關算法也取得了突破性進展,相關論文被收入NLP頂會。
更重要的是,度小滿的NLP之路并沒有止步于學術賽場和實驗室,而是積極走向產業,推動NLP技術與金融場景緊密結合,典型的就是信貸風控場景的征信報告解讀。
2023年,由度小滿建設的“智能化征信解讀中臺”工程,將大型語言模型 LLM、圖算法應用在征信報告的解讀上,榮獲了 “吳文俊人工智能科學技術獎”,度小滿也憑借該工程成為唯一入選的金融科技公司。
今年以來,大語言模型的爆發,讓NLP這一技術路線成為科技公司和大眾關注的焦點。
2023年2月,度小滿成為百度文心一言首批生態合作伙伴,推動對話式語言模型技術在國內金融場景的落地應用。
大語言模型掀起的AI熱潮還在持續,大眾的關注焦點,也從“訓大模型”,擴展到了“用大模型”的長線故事。
度小滿作為一支超前布局、技術前沿性強、與金融產業接軌十分成熟的NLP力量,有望跑通大模型從技術到產業應用的落地之路。
審核編輯 黃宇
-
AI
+關注
關注
87文章
30763瀏覽量
268909 -
nlp
+關注
關注
1文章
488瀏覽量
22033
發布評論請先 登錄
相關推薦
評論