色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何應對并解決可能出現的智能體失控問題

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-07-04 09:46 ? 次閱讀

隨著人工智能(AI) 技術和應用的普及,人們對于AI的認識不再只是一種智能機器。近日,麻省理工的研究團隊構建了一個有精神病傾向的AI智能體,它表現得就像我們人類一樣,有著自己情感和人格。通常,我們只能在一些科幻作品中看到這種人工智能體,也見識過人工智能失控的可怕場景,在現實中我們該如何應對并解決可能出現的智能體失控問題呢。

近日,堪薩斯州立大學的研究人員從精神病理學的角度回答了這個問題。他們稱之為“人格障礙治療”:通過矯正訓練來試圖改變人類的行為模式;通過藥物療法操縱外部的獎勵信號以從根本上改變AI智能體的行為方式。該研究主要分為三步驟進行,具體來看他們的論文:

▌摘要

由于人工智能( AI )技術的動態復雜性已經逐漸接近那些復雜的自適應系統,因此這一定程度上削弱了AI在安全性工程領域的可行性、可控性和可達性。由此可見,對于通用人工智能( AGI )的實例設想也將同樣面臨這種復雜性的挑戰。為了解決這些問題,我們將AI和AGI中的不良行為視為心理障礙,通過建模的方式,從精神病理學的角度分析并控制這些不良行為。相應地,我們進一步討論了這種精神病理學方法在AI、AGI安全工程方面的可行性,并為AGI中心理疾病的研究建模,診斷和治療提供了一種通用的方法。

▌簡介

雖然人類認知的自適應機制為其適應動態環境提供了獨特的手段,但是這也容易產生心理紊亂問題,這是一種被廣泛定義為對自我或社會生態系統的核心和長期目標會產生危害的自我重構行為。根據這一現象不難推斷,具有類似認知能力的通用人工智能( AGI )實例也可能容易引發這種疾病。例如,某些目標功能和環境條件在重復的高回報獎勵策略下,可能會導致強化學習( RL )的代理得以發展一些成癮的行為,這違反了代理長期的目標策略。此類突發性疾病的其他情況還包括創傷后行為,抑郁癥和精神病等。

目前對于人工智能(AI)安全研究主要集中在安全意識設計及其緩解技術,但隨著AI、AGI復雜性的不斷擴大,將使得這種疾病分析會像生物智能分析一樣困難。要解決人類智能方面的難題,我們需要從神經科學、認知科學再到心理學,精神病學,社會學和犯罪學等各種抽象層面,去研究不良行為的原因和動態。本文,我們建議使用精神病理學的方法來研究AI和AGI中的疾病問題,提供其中的技術討論和動機,并建立二者之間的并行性。

▌精神病理學

精神病理學是指對精神障礙的起因及其相關治療手段的科學研究。在這種背景下,引用美國精神病學協會( APA )對精神障礙的定義:精神障礙是一種在“心理學”與痛苦,殘疾相關的心理綜合癥,它可能會增加相關的綜合癥或模式死亡風險或重大自治權喪失(如追求目標)的幾率。在精神病理學中,精神障礙通常由四種異常指標所決定,被稱為四個Ds:行為和情感的偏離規范,由疾病引發的個體痛苦、損害個體正常功能的機體障礙或機能失調,以及個人對自身或社會的危險。

導致人類精神出現障礙的原因,包括遺傳的混合物(如神經質),父母虐待行為對個體發育的影響,社會影響(如虐待,欺凌行為)和創傷事件,以及一些生物學影響(如創傷性腦損傷和感染)等。

目前,人們普遍認為,理解心理障礙需要全面考慮生物和社會因素的影響,因此生物心理社會學模型通常被用來研究這種現象。這些模型將精神障礙廣泛地分為認知障礙或行為障礙。認知障礙是由潛在認知機制所引發的的異常功能引,而行為障礙是通過發展,環境和社會互動所學到的。

精神障礙的診斷通常基于對癥狀及構成各種疾病類型障礙的評估。一個用于全面評估精神障礙的框架是由美國精神病學家出版協會( APA )發布的診斷和統計精神疾病手冊( DSM )。本手冊提供了通用語言和標準的精神障礙分類標準。此外,最近隨著機器學習的進展,各種軟件和算法工具也被研發并用于幫助提高精神障礙的分類和診斷準確性。

此外,精神障礙的治療通常是一種或兩種方法的混合。一種是心理治療,這是通過一系列心理學技巧進行認為干預的一種形式。藥物治療是另一種針對性的方法,還可以二者的混合來治療精神障礙。

▌精神病理學與AI安全性

圖1 AI和AGI與精神病理學的關系

如上圖1所示,我們建立精神病理學與AI、AGI之間的關系,并從建模與驗證,診斷,及治療三個主要領域進行研究。

建模與驗證

考慮到人類精神病理學與AI之間存在可描述的相似性,為了打開AI安全性研究的大門,我們需要以一種工程的方式,建立數學模型,研究并驗證其中的相似性。在認知和醫學科學領域已存在一些精神障礙的動力學模型,在這里我們對這些疾病進行定量分析和探索,并基于神經經濟學,復雜適應系統,控制理論和動態數據驅動的范例,開發新的AI和AGI模型。

此外,為了驗證模型并確保隨后理論的正確性,我們還需要開發實驗框架和仿真平臺。在任意的、獨立的上下文情景中,這些平臺必須能夠提供廣泛實驗的手段,對出現的動態行為和認知疾病進行分析,并且還能夠兼容各種不同的代理和環境模型。

疾病的診斷與分類

這部分主要是用于研究并開發人工智能障礙得診斷技術。在人工智能安全工程的背景下,診斷指的是兩個相互關聯的任務:第一個是異常行為的檢測,第二個是對檢測到的異常行為進行分類治療。因此,我們需要開發相應的機器學習方法來診斷并對疾病進行分類處理。

此外,在仿真訓練相關疾病和注釋情景下,我們還可以從模型中學習到不良行為的通用指標。一旦模型檢測到錯誤行為,下一步就是進行特征化并對導致這種行為的疾病進行分類。然而,這個過程的先決條件是需要一系列不同的疾病和相應的診斷標準。因此,我們還需要匯編一些有代表性和經過實驗驗證的疾病。

疾病治療

當AI代理診斷出疾病時,簡單地停用或重置代理的做法并不總是可行的。在這種情況下,我們希望代理能夠傾向于通過最小破壞性的技術去治療糾正錯誤的行為,同時保留代理所學到的有用特征。這樣的治療需要滿足一些具有挑戰性的要求。

高級的AI代理通常都是很復雜的自適應系統,因此可能其中一個組件的微小擾動可能都會導致局部或整體產生意想不到的后果。因此,有效的治療手段必須是完全微創或非侵入性。受精神病理學相似性的啟發,我們提出了兩種一般方法治療疾病。一種是矯正訓練,這是采用行為療法的一種方式。

這種方法是需要在特定的環境或情境下重新訓練我們的代理,以便通過新的學習經驗去糾正或緩解有害的行為。第二種方法與藥物治療類似,AI代理的獎勵信號是通過外部手段人為地操縱并調整它們的行為策略。

▌結論

當前對于AI安全性的研究主要側重于設計和緩解問題,AI和AGI的復雜性將使得這種分析變得困難。考慮到診斷并治療AI、AGI中實際目標的不良行為,我們提出采用精神病理學的方法研究AI、AGI的安全性工程。

我們依次介紹了AI、AGI安全性工程,分析了人類疾病與精神病理學之間的相似之處,并建立精神病理學與AI、AGI安全性之間的關系,提出了包括建模與驗證、診斷與分類,及疾病治療的三步驟方案,打開了安全性工程的研究大門。我們希望本文的研究能夠為未來的研究和發展奠定堅實的基礎。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238265
  • 智能體
    +關注

    關注

    1

    文章

    144

    瀏覽量

    10575

原文標題:應對AI失控,研究人員提出用“人格障礙治療”解決問題

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    解決MCU應用系統中上電暫態時輸出失控的方法

    的常規IO在上電暫態過程中是弱上拉輸出的,即輸出邏輯1,如果用常規正向思維往往會采用正邏輯設計,即高電平有效,那么上電暫態中就非常可能會有失控現象,采用負邏輯即可解決。上電暫態中,IO輸出隨著電源的建立
    發表于 12-08 10:54

    基于像素失控的剖析

    。二、像素失控的原因: 1、LED自身品質不佳。2、使用方法不當。3、失控的最大誘因是靜電放電引起,靜電放電導致LED管失效的機理非常復雜,設備、工具、人體等均有可能帶有靜電對其放電
    發表于 06-12 11:43

    讓海外的智能硬件在國內成為爆品,可能嗎?

    導語:還記得《星球大戰》中萌萌的BB-8機器人嗎?這個出現在迪士尼新片中的萌寵機器人,被授權給美國玩具商Sphero公司研發生產,1月13日出現在了京東智能的活動上。我們看到的許多智能
    發表于 10-31 18:56

    全彩LED顯示屏像素失控怎么辦?

    晶膠、PPA 杯等材料熱膨脹系數的差異,引發其內部應力的不同而產生的。靜電放電導致LED失效的機理,非常復雜,設備、工具、器皿及人體均有可能帶有靜電對其放 電,這種靜電少則幾百伏,高則幾萬伏,放電
    發表于 09-21 16:16

    電機在高速旋轉時會中斷或失控

    `make flash`時無法燒錄固件其他可能不會產生錯誤代碼的問題電機在高速旋轉時會中斷或失控(ie: > 5000 RPM)靜止時電機振動或發出噪音電機位置控制出現過沖或在目標位置震蕩電機開...
    發表于 09-17 09:00

    基于4位單片機SH66P58的智能脂秤方案設計

    介紹基于4位單片機SH66P58的智能脂秤方案設計,對量產設計可能發生的問題做了相關說明。智能
    發表于 11-29 07:42

    淺析鋰電池正極材料熱失控的真正原因

    通過將復合電極熱失控前后的相分布進行單個電極顆粒層面的成像,并將多種相分離現象在熱失控前后的相關性進行了納米級別的可視化,專家發現熱失控可能與導電劑以及粘結劑的分布呈現密切的相關性。
    的頭像 發表于 07-24 11:24 ?5230次閱讀

    失控擴散的防御措施有哪些

    在目前的熱失控擴散的防御措施里面,核心的還是談性價比,模組和 Pack 層面,前者花的成本更多一些,需要很多的措施來在第一個電芯出現失控之后就地阻止第二個電芯熱失控,在最近幾個月 B
    的頭像 發表于 01-16 16:52 ?2208次閱讀

    如何應對無法根除的鋰電熱失控

    充電電池發熱屬于正常現象,但是涉及電池安全,如何應對無法根除的鋰電熱失控
    的頭像 發表于 12-25 21:07 ?531次閱讀

    元宇宙電影失控玩家

    失控玩家》是近期比較火爆的電影,《失控玩家》腦洞很大,給元宇宙增添無限想象力,電影里面體現了關于人工智能覺醒的答案,展現了現實和虛擬世界高度融合,里面的數字NPC角色可以為我們提供服務。
    的頭像 發表于 11-05 10:35 ?1895次閱讀

    聯匯科技發布自主智能 OmBot 歐姆智能及 OmBot OS 操作系統

    智能的發展都表現出極大興趣,寄予厚望。 大語言模型的出現,無疑給 AI 智能的發展帶來了
    的頭像 發表于 07-11 14:07 ?483次閱讀
    聯匯科技發布自主<b class='flag-5'>智能</b><b class='flag-5'>體</b> OmBot 歐姆<b class='flag-5'>智能</b><b class='flag-5'>體</b>及 OmBot OS 操作系統

    鋰電池熱失控氣體產生原因、分析方法

    設計缺陷、電池使用不當以及惡劣工作環境。以下將對這三個方面進行詳盡、詳實、細致的分析,介紹相應的分析方法。 首先,電池設計缺陷是導致鋰電池熱失控氣體產生的一個重要原因。電池的設計缺陷可能表現為材料選擇不當、結構
    的頭像 發表于 12-08 15:55 ?1212次閱讀

    鋰離子電池熱失控過程,不同鋰電池熱失控反應一樣嗎?

    非常復雜的化學性質,可能會導致熱失控,這對于電池的穩定性和安全性構成了挑戰。 不同種類的鋰離子電池在熱失控過程中可能表現出不同的反應和行為。然而,大多數鋰離子電池在熱
    的頭像 發表于 01-10 15:16 ?647次閱讀

    極限失控的大模型使電力系統面臨的跨域攻擊風險及應對措施

    分析大規模生成式預訓練模型(以下簡稱為大模型)發生極限失控、使電力系統面臨的跨域攻擊風險及相關的應對措施,以期引起業內對這一風險的重視、討論與行動。基于大模型的現狀、發展趨勢以及它與人工智能反叛之間
    發表于 07-22 12:09 ?0次下載

    聚徽-工控一出現黑屏怎么處理

    工控一出現黑屏可能有多種原因,以下是一些可能的解決方法:
    的頭像 發表于 08-16 09:24 ?530次閱讀
    主站蜘蛛池模板: 日本漫画之无彩翼漫画| 忘忧草在线社区WWW日本-韩国| 三级网站视频| 亚洲色在线| free高跟丝袜秘书hd| 国产露脸无码A区久久| 两个奶头被吃得又翘又痛| 色综合a在线| 在线 国产 欧美 亚洲 天堂 | 亚洲 欧美 清纯 校园 另类| 51xx午夜影视福利| 国产噜噜噜精品免费| 牛牛在线精品视频| 亚洲色大成网站WWW永久麻豆| www.一级毛片| 九九热久久只有精品2| 三级黄在线播放| 中文字幕视频在线观看| 国产精品高清视亚洲一区二区| 两性午夜刺激爽爽视频| 亚洲 国产 日韩 欧美 在线| 草莓视频在线播放视频| 久久久综合中文字幕久久| 无套内射无矿码免费看黄| ass女人下部欣赏| 久草在线在线精品观看| 手机在线国产视频| 99青草青草久热精品视频| 花蝴蝶高清观看免费| 日日摸夜添夜夜夜添高潮| 91九色麻豆| 精品一区二区免费视频蜜桃网 | 中文字幕本庄优花喂奶| 国产美熟女乱又伦AV| 人妻久久久精品99系列AV| 中文在线日韩亚洲制服| 国产亚洲精品久久久999蜜臀| 全黄H全肉禁乱公| 在线亚洲中文精品第1页| 国产一区免费在线观看| 色即是空之甜性涩爱|