中國人工智能知名企業達觀數據宣布近期已成功完成了C輪5.8億元融資,并刷新了中國文本智能處理行業的單筆最高融資記錄。
本輪投資方包括中信證券、招商證券、廣發證券、中信建投4家中國知名證券集團,和弘卓資本、陽光保險、襄禾資本、尚珹資本等投資機構,以及深創投、聯想之星、眾麟資本等老股東。達觀數據也成為了業界首家同時由四家頭部券商同時注資的科創企業。融資后達觀數據將強化在國內自然語言處理領域的領軍地位,并通過加大在NLP自然語言理解和RPA自動化辦公領域的研發投入,為更多行業的智慧辦公系統賦能。
達觀數據由一批國內知名的文本處理技術專家構成,公司董事長陳運文畢業于復旦大學計算機系,并獲得過上海市優秀博士論文獎。曾經在百度、盛大、騰訊等擔任過核心技術研發工作,擔任過閱文集團首席數據官CDO,負責文本自動化處理的技術研發和團隊管理工作。經過6年多迅速發展達觀業務已遍布金融、制造、政務、航運、傳媒、醫藥等各個版塊,在全國設立了研發和交付團隊,并和北京大學、復旦大學、上海交通大學、同濟大學、上海外國語大學、中央財經大學等高校建立了聯合課題組,承擔了多項國家重點專項課題研究。
談及自然語言處理技術的發展現狀與挑戰,陳運文博士表示,近年來自然語言處理在學術界有突飛猛進的發展,例如BERT、Transformer、Prompt等算法模型都有巨大的效果和理論提升,但在產業應用方面還有很大的技術挑戰。例如實際應用中標注訓練樣本少、數據噪音大、深度學習抗干擾性弱、垂直領域的知識圖譜缺失等問題,導致NLP技術在工程落地應用方面有重重障礙。怎樣將理論和工程實踐相結合,開發出真正好用的系統就顯得異常重要。但從另外好的方面來看,文本智能處理的應用前景非常廣闊,客戶需求旺盛,很多繁瑣重復的文檔處理任務迫切需要有好用的自動化系統能代替人來來完成,實現降本增效。
為了不負客戶期望,陳博士的經驗是,要能在浮躁的環境里靜下心來,不炒作概念不跟風,在技術創新的細節上一點點打磨。在過去幾年里達觀首創了行業無錨點OCR文字提取系統,獨家開發了RPA文字元素自適應穿透捕獲算法、開發了國內第一套文本智能處理IDPS處理平臺,率先與15家國產信創系統完成兼容適配,首家推出適配華為鴻蒙和歐拉操作系統的國產RPA機器人等,也參與了國際IEEE學會和國家工信部在文本處理應用行業標準的制定工作。“這些工作成果都是達觀團隊的技術研發同學們在過去幾年日積月累逐步建立起來的,很不容易”。
當聊到本輪融資后的發展規劃時,陳運文介紹:“組織和人才建設是重中之重”。尤其既要精通計算機算法技術,又要了解產業應用知識的復合型人才是非常寶貴的,營造一個優越的成長環境讓高潛力的人才能快速學習和成長是我們接下來的重點任務。所以在公司內部開發了達觀wiki知識庫和培訓體系,在復旦大學和華東師范大學設立了“達觀數據獎學金”,支持鼓勵優秀的大學生。為了營造正能量的企業文化,公司還每年還組織去貧困山區小學援建“達觀愛心圖書室”,以“立定腳跟處事,放開眼孔讀書”為宗旨,為孩子們捐贈了數萬本書籍,以及積極參與無償獻血和社會公益活動。
因為在自然語言處理工程應用方面的突出成就,達觀數據獲得了中國人工智能學會頒發的“吳文俊科學技術獎”,福布斯2021科技創新50強,以及共青團中央授予的“中國青年創業獎-科技創新特別獎”、上海市政府頒發的“青年科技杰出貢獻獎”等榮譽。
“融資是達觀前進道路上的一小步,未來還有很多困難等待我們去克服”,陳運文博士表示:“務實求真是達觀一直在堅持的工作作風,我們還需要虛心向行業前輩和同行們多學習,開發出優秀的文字自動化處理系統。期望機器人舞文弄墨的時代在我們的手上早日實現!”
-
自然語言處理
+關注
關注
1文章
618瀏覽量
13553 -
nlp
+關注
關注
1文章
488瀏覽量
22033
發布評論請先 登錄
相關推薦
評論