NLP(自然語言處理)作為人工智能一大分支,目前主要的落地場景有三大類:搜索、智能問答、智能寫作。其中,搜索領域已經有谷歌、百度等巨頭占領大部分市場份額;智能問答由于業務場景多樣化,人機交互層面還有許多技術尚未成熟,同時產品也存在標準化的問題,距離商業落地還有一定距離。
智能寫作成為NLP另一個具備大規模應用潛力的技術,目前主要體現在文字端的處理能力比較成熟。國外媒體從07年開始嘗試AI寫作,到14年美聯儲已經使用Wordsmith平臺撰寫財報新聞,同年Automated Insights生產內容篇數達到10億;國內方面,15-16年也迎來AI寫作的高速發展,騰訊、新華社、今日頭條相繼推出智能寫作產品從新聞領域切入。隨著大量同類產品進入市場,智能寫作的原創性、通順度成為產品競爭力的關鍵。
深圳市智搜信息技術有限公司(以下簡稱“智搜”)是一家內容創作機器人研發商,公司成立于2013年,產品經過5年的研發,在2018年正式落地,面向媒體、營銷公關、黨政機關、財經領域的企業服務市場和個人用戶提供內容創作的SaaS服務,以人機協作的形式生成內容。
從核心技術上看,內容創作機器人需要底層大量素材的積累以及算法模型支持原創性及通順度。團隊已經構建了營銷、資訊以及金融領域的知識圖譜,知識圖譜節點達到億級。同時,對資訊、營銷和金融領域的所有文章、段落、句子、知識等素材不斷打標簽,擁有了50億以上的營銷素材。
算法方面,團隊采取了WikiAnswers,Quora,TCNP,LCQMC等專業訓練集,同時還開發了非監督的中文語言生成模型,基于百億級的文章進行訓練,具備了原創的寫作能力,系統可在5秒內生成10篇原創文章,每篇字數在1000-2000字,通順度達到80%左右。
公司的業務場景根據企業服務、個人用戶分為兩種:
對于媒體、金融、機關、營銷類企業客戶,公司提供Saas平臺,生成研報、新聞、思想報告類文章。首先,系統會基于大數據和算法挖掘、跟蹤信息點,5秒內生成多篇底稿;之后,用戶可根據系統生成的文章對不滿意的地方進行修改,系統在這一階段起到分類素材推薦、查重/改寫等輔助功能;最后,對于需要在網上公開發布的文章,系統利用AI算法模型將關鍵詞標簽化,自動生產SEO標題和文章,方便后期搜索引擎進行收錄。
對于自媒體這種中小企業客戶/個人用戶,系統以官網的形式(www.giiso.com)完成內容創作。操作流程與Saas平臺的工作方式類似,只不過不需要與公司內容系統對接。智搜聯合創始人鄭海濤表示,公司今年開始主推C端市場,目前產品在滿足自媒體對于內容原創性的要求方面具備核心技術優勢,下一步要在多樣化上做研發,迎合自媒體對個性化的需求。公司能夠幫助用戶實現文章裂變,支持月卡、年卡、單篇付費機制,分享文章可獲得金幣獲得折扣,輸入一篇文章后可快速生成數十上百篇文章;后期系統還將聯合版權方開發基于圖片、直播、小視頻的內容創作。在市場策略上,公司會以分銷的形式,向分享系統鏈接的用戶發放提成,實現用戶裂變。
營收方面,公司目前主要以Saas模式收取企業客戶的年服務費,可按照公司內部的賬戶數量收費,也有一次性過百萬元的項目合作費用。公司已經積累了中國經濟日報、深圳報業集團、廈門報業集團、中國太平洋保險集團、上海證券交易所、公安黨政機關等大客戶,2018-2019年營收過千萬。鄭海濤表示,公司從今年開始重點開發個人用戶(包括中小企業客戶)市常
公司團隊目前約20人,聯合創始人鄭海濤是清華大學計算機系副教授,擔任國家863項目副組長,主持多項國家自然科學項目,以及多項教育部,廣東省和深圳市項目,是中國大數據語義挖掘領域的領軍人物。公司最近一筆融資是在2017年獲得民銀資本領投,金沙江創投跟投的2000萬元A輪融資。公司正在尋求B輪融資。
責任編輯:tzh
-
機器人
+關注
關注
211文章
28578瀏覽量
207794 -
智能
+關注
關注
8文章
1714瀏覽量
117618 -
nlp
+關注
關注
1文章
489瀏覽量
22065
發布評論請先 登錄
相關推薦
評論