閃亮的手機屏幕能夠安撫哭鬧的孩子,然而,21世紀的父母必須權衡兒童使用手機的利弊,防止他們沉迷王者榮耀、“吃雞”游戲或者不知不覺地在淘寶、亞馬遜上購買玩具。
幸運的是,由南卡羅來納大學和中國浙江大學的研究人員開發的新軟件(iCare)可以幫助解決這個育兒難題。
在iCare中研究人員開發了一種算法,用于測量用戶與移動設備的互動,并可以可靠地分辨出用戶是成人還是小孩。如果軟件檢測到是孩子在用手機,它可以自動阻止訪問零售商、電子郵件等應用程序以及兒童不宜的網站。
iCare能夠記錄像手指按壓的表面積、手指施加的壓力和滑動長度等度量數據。研究人員分別從一群3至11歲的兒童(共17人)和一群22至60歲的成年人(共14人)那里收集數據。其測試的準確率達到了84%,8次滑動之后,準確率可達到97%。
不過,該算法尚未被整合到操作系統中,論文已經發表在移動技術大會HotMobile上。
基本理念:兒童與成年人與手機互動的方式不同
人體工程學和運動機能學已經表明,我們可以在相似年齡段的人群中發現共同的特征。本項研究的主要假設是兒童與成年人以不同的方式與智能手機進行互動。我們希望從智能手機上的正常觸摸操作中提取兒童用戶的特征。我們的想法基于以下兩個觀察:
首先,在尺寸方面,兒童和成人之間手部幾何結構不同:兒童手部較小,而手指觸碰點較一般成人短。因此,兒童往往會在較窄的屏幕范圍內接觸,并以較短的軌跡滑動。
其次,與成年人相比,兒童與智能手機互動的靈巧性差。根據我們的觀察,孩子們在智能手機上的每次觸摸都比成人慢,速度也較慢。當他們嘗試在兩次觸摸操作之間切換時,即從輕擊到滑動時,情況也是如此。這可以歸因于兒童的身體尚未成熟,因此這會影響他們在使用手指執行任務時的反應。
因此,當從觸摸數據提取特征時,我們考慮手形和靈活性屬性。
實驗裝置:解鎖手機和玩2048游戲
我們的研究獲得南卡羅來納大學機構審查委員會的批準(IRB號碼73819)。在實驗中,我們使用與所有主題相同的智能手機(由LG生產的Google Nexus 5X,運行Android v.7.1.1),并關閉其自動旋轉功能以消除與各種手持相關的偏差。我們基于智能手機的兩項常見活動設計了一個兩階段應用程序:解鎖手機(點擊手勢)和玩游戲(滑動手勢)。
點擊手勢在第一階段收集。如圖2(a)所示,在屏幕的頂部出現一個PIN碼,用戶被要求輸入它。我們的應用程序生成兩個四位數和兩個六位數的引腳號,每個引腳隨機出現兩次。如果每次都成功,每個用戶都會將手機解鎖八次。我們將解鎖嘗試的最大次數設置為十次。。
滑動手勢在第二階段收集。我們修改了一個名為2048的流行益智游戲,如圖2(b)所示。
用戶可以在任何方向滑動來玩游戲。令人驚訝的是,相當數量的孩子表示他們之前玩過這個特定的游戲或類似的游戲。大多數3-5歲的兒童能組成64或更大,而6-11歲之間的兒童至少組成128,而五年級學生(10歲)最高組成512。
實驗數據
在我們的實驗中,我們招募了兩組用戶:兒童組有17名3至11歲的兒童,成人組有14名20至59歲的成年人。表1總結了參與者的人口統計。所有的參與者都完成了兩個階段的任務。在解鎖手機階段,我們收集了兒童組中的1357個手指按壓和成人組中的762個手指按壓數據。
請注意,雖然3至5歲兒童的人數并不是最多,但與大齡兒童和成人相比,我們收集的手指按壓數量最多。這是因為這個年齡組的孩子更可能輸入錯誤,因此他們嘗試多次。在第二階段,我們分別從兒童組和成人組收集了3442和3658次。總的來說,成人組在2048年的比賽中表現更好。
表2給出了滑動數據的樣本,表3是點擊數據的樣本。輕擊一般由兩個動作組成:向下(“0”)和向上(“2”),而滑動有一個動作:觸摸移動(“1”)。滑動由一系列觸摸點組成。它從觸摸屏幕開始,以手指提升結束。在每個點上,我們記錄發生的時間,X-Y坐標,觸摸區域的壓力和大小以及手指ID。事件時間以毫秒為單位,并基于智能手機自啟動以來的非睡眠正常運行時間。壓力和尺寸值均被標準化為0和1之間的范圍,其中0意味著沒有壓力并且完全沒有尺寸。
數據處理
我們從所收集的觸摸數據中從兩個方面提取特征:手的幾何形狀和靈活性。表4顯示了滑動手勢和輕擊手勢的功能描述。總共,我們提取了35個特征,并且點擊了8個特征。
手部幾何。手部幾何形狀的差異會導致觸摸范圍,觸摸距離,觸摸壓力和尺寸方面的差異。特別地,表4中編號從1到19的特征是基于手部幾何圖形提取的。
靈活性。考慮到靈活性,我們提取了從20到35的16個特征。靈巧性主要影響速度,加速度和任務持續時間。
分類器和度量
分類選擇。根據孩子和成人分類的以上特點,我們實現了三個機器學習分類器,即支持向量機(SVM),隨機森林(RF)和k近鄰(kNN)。支持向量機是二元分類的流行和強大的工具,它可以輸出一個最優化的超平面,以最大化兩個類之間的邊界。最重要的是,它能夠通過使用內核技巧將數據映射到更高維空間來解決非線性可分問題。
在這里,我們使用徑向基函數(RBF)作為我們的非線性核。 kNN是一種非參數方法,它沒有數據的基礎假設,每個樣本都基于其鄰居的多數投票分配給一個類。神經網絡不基于訓練數據進行任何概括,但它非常簡單而且快速,同時具有高度競爭的結果。 RF是另一種有效的算法,它能夠準確地對大量數據進行分類。它是一種集成方法,它在訓練時間內構造大量決策樹,并輸出所有模型中票數最多的類標簽。它還給出了每個特征在分類中重要性的估計。
指標。為了評估二元分類器的性能,我們選擇常用的性能指標:ROC(AUC)曲線下的面積和相等的錯誤率(EER)。 ROC曲線代表受試者工作特征曲線,并通過繪制真實接受率(TAR)與錯誤接受率(FAR)的關系來創建,因為閾值變化。 TAR是正確識別孩子的概率,而FAR是分類錯誤地接受孩子的概率。 AUC是介于0和1之間的值,較大的值通常更好。 EER是接受和拒絕誤差相等時的速率,而這個值越低,分類者越好。
結果:
首先,我們將孩子的觸摸數據分為兩組,分成3至5歲的兒童和6至11歲的兒童兩組。我們將所有成人數據視為陰性樣本,并為每個組單獨訓練了一個RF分類器。
圖4顯示了兩個年齡組的ROC曲線的比較。對于滑動和敲擊,我們在對3至5歲的兒童組進行分類時有更好的表現。這是合理的,因為年齡較小的兒童在手部幾何和靈活性方面往往與成年人更為不同。
多次滑動。在本節中,我們將探索將不同數量的連續滑動組合用于分類對性能的影響。到目前為止,我們只使用相對較大的滑動數據集來進行多筆劃評估。首先,我們分開將數據集轉換為訓練和測試集。我們通過從每個年齡段的參與者中隨機選擇10%的連續樣本來準備測試數據集。
總的來說,測試數據集由660個樣本組成,均勻地分布在兒童和成人之間。我們使用剩余的樣本訓練RF模型,并選擇樹號為200。與其單獨劃分所有劃動并通過大多數投票達成最終決定,我們在較早階段將其多個連續輸出與它們的概率組合,并取平均值作為我們的預測概率。
圖5顯示了ROC曲線,通過改變劃分的次數來進行分類決策。增加滑動次數時,分類錯誤可以大大減少。隨著我們將滑動次數增加到8次,EER本地收斂到3.0%。盡管數據集的有限大小不允許我們進一步增加滑動次數,但結果清楚地表明使用多次滑動可以提高準確性。
限制與未來探討:兒童多樣性、有限的手勢等
有幾個問題有待探討。
1、由任務屬性造成的偏差。雖然沒有限制用戶如何執行觸摸手勢,實驗中使用的具體應用(任務)會影響手勢幾何。因此,依賴任務的多樣性可能會影響iCare的準確性。值得研究手勢和相應的特征如何隨著不同的任務而變化。
2、兒童用戶的多樣性。考慮到女孩和男孩身體的不同發育率,應該檢查不同性別的觸摸模式。此外,隨著兒童的行為每年發生顯著變化,可能會降低整體的準確性。我們還觀察到,3歲以上的兒童可以使用PIN碼解鎖智能手機,即使他們無法讀取數字。
3、有限的手勢。還有很多其他的手勢(例如,滾動)在我們的研究中還沒有探索過。實際上,用戶可能需要在不同類型的手勢之間來回切換,才能在智能手機上完成任務。將所有類型的手勢融合在一起可以產生更快的分類決策并可能提高準確性。
4、提高準確性。鑒于連續8次滑動和準確性,我們的方法可以為現有的父母監控應用程序提供很好的補充。但是,在應用到現實世界之前,其準確性應該得到改善。我們可以通過解決上述三個限制來提高準確性。此外,智能手機上還有其他內置傳感器(例如陀螺儀和加速計),可以利用這些傳感器來導出用戶的分類結果特征。
-
算法
+關注
關注
23文章
4617瀏覽量
93030
原文標題:【AI防熊孩子搶手機】浙大開發算法軟件,輕松識別兒童玩手機
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論