作為數據挖掘研究領域最具影響力的國際頂級賽事,素有“數據世界杯“之譽的KDD Cup日前正式公布了KDD Cup 2019三項重大賽事,包括Auto-ML Track、Regular ML Track及Humanity RL Track三場比賽,其中開賽22年以來首次引入的AutoML Competition挑戰賽受到不少學術及工業界專業人士的關注。
AutoML(Automated/Automatic Machine Learning,自動機器學習)旨在研究在沒有專業知識的情況下、使用的低門檻甚至零門檻的機器學習算法,在AI人才緊缺的情況下,AutoML可以降低AI落地過程中對科學家的依賴,是2014年以來機器學習領域最炙手可熱的研究對象之一。2018年1月,谷歌高調推出自動機器學習產品Cloud AutoML,再次將這項技術推向更多人的視野中,目前AutoML已成為國內外科技巨頭關注的焦點。
由于日益受到學術界、工業界的廣泛關注,NeurIPS、IJCAI等學術頂會從去年開始將AutoML視為重點。
本次KDD Cup選擇將其納入比賽內容,并為此打破歷來數據挖掘方向賽事的傳統,也是基于對AutoML技術發展趨勢和落地價值的認可。對此,KDD Cup主席Taposh Dutta-Roy表示,AutoML是今年KDD關注的重點,也是一項AI落地的關鍵技術。
據了解,本次KDD Cup AutoML挑戰賽由第四范式主辦,微軟、AutoML領域最權威的學術組織ChaLearn協辦,并為此次比賽設置了“史上”難度最高的比賽項目——基于時序關系型數據的AutoML。
時序關系型數據在在線廣告、推薦系統、金融市場分析、醫療等應用場景中非常常見,人們往往需要利用這樣的數據去構建機器學習模型,并應用機器學習模型提升對應業務的效果。
賽事主要負責人、第四范式資深算法科學家涂威威表示這是AutoML比賽歷史上首次考慮時序關系型多表數據,會重點考察AutoML在實際應用場景中的能力,應對關系型、時序等多表類型數據的挑戰,探索AutoML解決實際問題的價值。競賽已于4月1日正式拉開帷幕,挑戰賽分Feedback(反饋)、Check(校驗)、AutoML(盲測)3個階段,最終根據AUC排名選出冠軍團隊,并在7月20日公布比賽結果。
值得一提的是,KDD Cup比賽向來由具備深厚學術積累和行業實踐的頂級企業或高校承辦,競爭極為激烈,歷屆承辦方包括微軟、阿里等巨頭公司和卡耐基·梅隆大學等知名高校。
大數據文摘據大賽的主辦資質等問題采訪了本次的主辦方之一——第四范式資深算法科學家、也是本次AutoML主委會成員涂威威,他表示KDD Cup每年賽事需要大家提案,組委會會根據賽事挑戰性、實際應用性、賽程規劃等多維度標準來篩選賽事方案。
第四范式作為首屆KDD CUP AutoML大賽的主辦方,將會肩負起賽事提案、數據提供、平臺搭建、賽事報名招募、競賽以及評選等全部流程重任。
“具體審核流程并不清楚,我們在KDD Cup賽事提案獲得了組委會及主席的認可和信任,KDD Cup的Chair也充分表明了對AutoML應用價值的肯定。”
AI技術的發展,興起于比賽,成功于行業,此前ImageNet賽事推動了一大批CV公司的成長,并且極大地促進了行業爆發。AutoML的產業發展延續了這個路徑,此次首登“數據世界杯”的比賽舞臺,KDD平臺將有望吸引更多“全球最聰明的大腦”參與到AutoML進程中,AutoML或將落地于更廣泛的行業和場景,迎來新的發展高峰。
對于這次新增賽題AutoML,涂威威也表示,反映了整個大行業的AI自動化趨勢。因為AI人才緊缺始終是AI落地的核心痛點,自動化工具就是試圖解決這樣的痛點,正在成為改變目前AI科學家瓶頸以及行業應用門檻的關鍵技術,近年來AutoML已成為國內外科技巨頭關注的焦點。
“AutoML是機器學習國際研究的前沿,需要更多的研究者參與到基礎算法研究和實際落地中來,我們深知需要整個學術界和工業界一起來推動技術的進步,因此我們做了很多實際的推動,KDD Cup最終選擇重點關注AutoML比賽,并引用我們的比賽作為AutoML大賽的示例與首秀,也從側面證明了我們這幾年推動的正向效果。”
最后,對于本次“史上最難比賽項目”,第四范式也為參賽者提供了一些小tip:
首先,歡迎更多對AutoML關注和有興趣的同學參加比賽,甚至加入我們一起推動AutoML的發展,共同探索AutoML無限可能。
需要提醒參賽者提交AutoML方案是需要注意的幾個關鍵點:
如何自動生成有效的時序信息?
如何將多個相關表信息有效整合?
如何解決數據分布隨時序緩慢變化的問題?
如何自動捕獲有意義的表間聯系?
如何自動高效地選擇合適的機器學習模型和超參數?
如何讓方案更通用,即如何使其適用于未知的任務?
如何保持計算和內存成本可接受?
希望所有參賽者能在本次挑戰賽中,充分展示自己的能力和風采,取得更好的成績。當然,AutoML技術的發展還有很多更具挑戰性的難題在前面等著我們,在今后比賽中我們會繼續與大家一起挑戰更高難度的問題,讓AutoML真正大幅降低了機器學習的應用門檻,賦能非機器學習背景的人可以輕松使用。
目前,KDD2019官網已經放出了大賽的三個賽題,其中,AutoML比賽詳情頁面已經發布。SIGKDD-2019將于2019年8月4日至8日在美國阿拉斯加州安克雷奇舉行。比賽預計將持續2-4個月,獲勝者將在2019年7月中旬被通知,并在KDD會議開幕式上接受頒獎,最終在會議期間在KDD杯研討會上展示他們的解決方案。
-
數據挖掘
+關注
關注
1文章
406瀏覽量
24263 -
機器學習
+關注
關注
66文章
8425瀏覽量
132766 -
ai技術
+關注
關注
1文章
1281瀏覽量
24350
原文標題:“數據世界杯”KDD Cup 2019賽題正式公布,首次挑戰AutoML產業落地最大難題
文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論