標簽　>　智能體

智能體

+關(guān)注1人關(guān)注

智能體，顧名思義，就是具有智能的實體，英文名是Agent。以云為基礎(chǔ)，以AI為核心，構(gòu)建一個立體感知、全域協(xié)同、精準判斷、持續(xù)進化、開放的智能系統(tǒng)。智能體是人工智能領(lǐng)域中一個很重要的概念。任何獨立的能夠思考并可以同環(huán)境交互的實體都可以抽象為智能體。

文章：147個瀏覽：10590次帖子：0個

全部技術(shù) 資訊資料帖子視頻產(chǎn)品方案企業(yè)

智能體技術(shù)

Atari游戲史上最強通關(guān)算法來了——Go-Explore！

普通的強化學(xué)習(xí)算法通常無法從蒙特祖瑪?shù)牡谝粋€房間（得分400或更低）中跳出，在Pitfall中得分為0或更低。為了解決這類挑戰(zhàn)，研究人員在智能體到達新狀...

2018-12-03 標簽：智能體強化學(xué)習(xí) 1.7萬 0

如何讓多個智能體學(xué)會一起完成同一個任務(wù)，學(xué)會彼此合作和相互競爭

多智體強化學(xué)習(xí)（Multi-agent reinforcement learning, MARL）假設(shè)有一組處在相同環(huán)境下的自主智能體。在MARL中學(xué)習(xí)...

2018-06-27 標簽：人工智能智能體強化學(xué)習(xí) 1.7萬 0

多智能體系統(tǒng)的特點

在多智能體系統(tǒng)中，每個智能體具有獨立性和自主性，能夠解決給定的子問題，自主地推理和規(guī)劃并選擇適當?shù)牟呗裕⒁蕴囟ǖ姆绞接绊懎h(huán)境。

2019-01-10 標簽：智能體多智能體系統(tǒng) 1.5萬 0

智能體的基本特性

本視頻主要詳細介紹智能體的基本特性，分別是自治性（Autonomy）、反應(yīng)性（Reactive）、主動性（Proactive）、社會性（Social）、進化性。

2019-01-12 標簽：智能體 8324 0

強化學(xué)習(xí)的經(jīng)典基礎(chǔ)性缺陷可能限制它解決很多復(fù)雜問題

這些都是除了從零學(xué)習(xí)之外的強化學(xué)習(xí)方法。特別是元學(xué)習(xí)和零次學(xué)習(xí)體現(xiàn)了人在學(xué)習(xí)一種新技能時更有可能的做法，與純強化學(xué)習(xí)有差別。一個元學(xué)習(xí)智能體會利用先驗知...

2018-07-14 標簽：智能體深度學(xué)習(xí)強化學(xué)習(xí) 7909 0

基于模型的學(xué)習(xí)vs無模型學(xué)習(xí)

需要注意的是，這種方法只能應(yīng)用于偶爾發(fā)生的馬爾科夫決策過程。原因是在計算任意返回之前，這一episode就要停止。我們并不在每次動作結(jié)束后就更新，而是在...

2018-11-22 標簽：智能體強化學(xué)習(xí) 7160 0

DeepMind的“星際2”智能體AlphaStar實際上是演化算法？

在AlphaStar中，用于訓(xùn)練智能體的基于人口的訓(xùn)練策略（PBT）是使用拉馬克進化（LE）的模因算法：在內(nèi)環(huán)中，使用反向傳播連續(xù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)，而在外環(huán)...

2019-02-13 標簽：智能體深度學(xué)習(xí)DeepMind 5807 0

用PopArt進行多任務(wù)深度強化學(xué)習(xí)

按照以往的做法，如果研究人員要用強化學(xué)習(xí)算法對獎勵進行剪枝，以此克服獎勵范圍各不相同的問題，他們首先會把大的獎勵設(shè)為+1，小的獎勵為-1，然后對預(yù)期獎勵...

2018-09-16 標簽：人工智能智能體強化學(xué)習(xí) 5687 0

DeepMind開源了一個內(nèi)部強化學(xué)習(xí)庫TRFL

TRFL庫包含實現(xiàn)經(jīng)典RL算法以及更前沿技術(shù)的許多函數(shù)。這里提供的損失函數(shù)和其他操作是在純TensorFlow中實現(xiàn)的。它們不是完整的算法，而是在構(gòu)建功...

2018-10-19 標簽：智能體強化學(xué)習(xí)DeepMind 5084 0

DeepMind和OpenAI攻克蒙特祖瑪?shù)膹?fù)仇并沒有看上去意義那么重大

在這篇文章中，我想討論的是，這些方法是為了解決蒙特祖瑪?shù)膹?fù)仇游戲的第一個關(guān)卡，以及為什么在游戲環(huán)境以及Deep RL的長期目標中，這些方法并沒有看上去意...

2018-07-24 標簽：智能體強化學(xué)習(xí) 4926 0

基于TensorFlow的開源強化學(xué)習(xí)框架 Dopamine

對于新的研究人員來說，能夠根據(jù)既定方法快速對其想法進行基準測試非常重要。因此，我們?yōu)?Arcade 學(xué)習(xí)環(huán)境支持的 60 個游戲提供四個智能體的完整培訓(xùn)...

2018-08-31 標簽：智能體強化學(xué)習(xí)TensorFlow 4923 0

伯克利那個會“18般武藝”的DeepMimic模型開源了！

整個DeepMimic所需要的input分為三部分：一個被稱為Character的Agent模型；希望Agent學(xué)習(xí)的參考動作（reference mo...

2018-10-19 標簽：AI 智能體強化學(xué)習(xí) 4910 0

多智體深度強化學(xué)習(xí)研究中首次將概率遞歸推理引入AI的學(xué)習(xí)過程

在傳統(tǒng)的多智體學(xué)習(xí)過程當中，有研究者在對其他智能體建模 (也即“對手建模”, opponent modeling) 時使用了遞歸推理，但由于算法復(fù)雜和計...

2019-03-05 標簽：AI 智能體強化學(xué)習(xí) 4909 0

伯克利RISELab推出了多主體強化學(xué)習(xí)包Ray RLlib 0.6.0

在緩解交通擁堵方面，只需要控制極少量自動駕駛車輛的速度，就能大幅度提高交通流的效率。多主體強化學(xué)習(xí)就可以用于這樣的場景，在混合駕駛的情況下我們暫時無法通...

2018-12-17 標簽：智能體強化學(xué)習(xí) 4625 0

一種在視覺語言導(dǎo)航任務(wù)中提出的新方法，來探索未知環(huán)境

視覺語言導(dǎo)航（vision-language navigation, VLN）任務(wù)指的是引導(dǎo)智能體或機器人在真實三維場景中能理解自然語言命令并準確執(zhí)行。...

2019-03-05 標簽：智能體自然語言 nlp 4492 0

如何讓AI符合人類的意圖？如何創(chuàng)建符合用戶意圖的智能體？

近年來，強化學(xué)習(xí)在許多復(fù)雜游戲環(huán)境中取得了令人矚目的成績，從Atari游戲、圍棋、象棋到Dota 2和星際爭霸II，AI智能體在越來越復(fù)雜的領(lǐng)域迅速超越...

2018-11-24 標簽：AI 機器學(xué)習(xí)智能體 4263 0

利用視頻游戲語料庫，訓(xùn)練一個GAN模型為超級馬里奧兄弟生成游戲級別

在視頻游戲中，馬里奧游戲級別有不同的表征Level Corpus (VGLC) 和Mario AI 框架，這兩種都是基于tile的表征形式。具體地說，以...

2018-07-25 標簽：GAN 機器學(xué)習(xí)智能體 4115 0

一種新型的基于情景記憶的模型，能夠讓智能體用“好奇心”探索環(huán)境

當你在超市中搜索時，心里可能會想：現(xiàn)在我在肉類區(qū)域，所以接下來可能到水產(chǎn)品區(qū)。這些都應(yīng)該是相近的。如果你預(yù)測錯了，可能會驚訝：誒？怎么是蔬菜區(qū)？從而得到...

2018-10-27 標簽：谷歌智能體強化學(xué)習(xí) 3980 0

終于，AI還是對《王者榮耀》下手了

如圖所示。玩家使用左下角轉(zhuǎn)向按鈕來控制移動，而右下角則設(shè)置按鈕來控制技能。可通過主屏幕觀察周圍環(huán)境，還可以通過左上角迷你地圖了解完整的地圖情況，其中可觀...

2018-12-25 標簽：神經(jīng)網(wǎng)絡(luò)AI 智能體 3713 0

強化學(xué)習(xí)環(huán)境研究，智能體玩游戲為什么厲害

強化學(xué)習(xí)作為一種常用的訓(xùn)練智能體的方法，能夠完成很多復(fù)雜的任務(wù)。在強化學(xué)習(xí)中，智能體的策略是通過將獎勵函數(shù)最大化訓(xùn)練的。獎勵在智能體之外，各個環(huán)境中的獎...

2018-08-18 標簽：智能體強化學(xué)習(xí) 3626 0

12 3 下一頁

相關(guān)話題

換一批

加速度傳感器

加速度傳感器

+關(guān)注

加速度傳感器是一種能夠測量加速度的傳感器。通常由質(zhì)量塊、阻尼器、彈性元件、敏感元件和適調(diào)電路等部分組成。
OBD

OBD

+關(guān)注

OBD是英文On-Board Diagnostic的縮寫，中文翻譯為“車載診斷系統(tǒng)”。這個系統(tǒng)隨時監(jiān)控發(fā)動機的運行狀況和尾氣后處理系統(tǒng)的工作狀態(tài)，一旦發(fā)現(xiàn)有可能引起排放超標的情況，會馬上發(fā)出警示。
傅里葉變換

傅里葉變換

+關(guān)注

盡管最初傅里葉分析是作為熱過程的解析分析的工具，但是其思想方法仍然具有典型的還原論和分析主義的特征。“任意”的函數(shù)通過一定的分解，都能夠表示為正弦函數(shù)的線性組合的形式，而正弦函數(shù)在物理上是被充分研究而相對簡單的函數(shù)類，這一想法跟化學(xué)上的原子論想法何其相似！
TOF

TOF

+關(guān)注
角度傳感器

角度傳感器

+關(guān)注

角度傳感器，顧名思義，是用來檢測角度的。它的身體中有一個孔，可以配合樂高的軸。當連結(jié)到RCX上時，軸每轉(zhuǎn)過1/16圈，角度傳感器就會計數(shù)一次。
L298

L298

+關(guān)注
DMD

DMD

+關(guān)注

DMD是一種整合的微機電上層結(jié)構(gòu)電路單元，利用COMS SRAM記憶晶胞所制成。DMD上層結(jié)構(gòu)的制造是從完整CMOS內(nèi)存電路開始，再透過光罩層的使用，制造出鋁金屬層和硬化光阻層交替的上層結(jié)構(gòu)
OV7620

OV7620

+關(guān)注

ov7620是一款CMOS攝像頭器件，是彩色CMOS型圖像采集集成芯片，提供高性能的單一小體積封裝，該器件分辨率可以達到640X480，傳輸速率可以達到30幀。
MC9S12XS128

MC9S12XS128

+關(guān)注

HCS12X系列單片機簡介 Freescale 公司的16位單片機主要分為HC12 、HCS12、HCS12X三個系列。HC12核心是16位高速CPU12核，總線速度8MHZ；HCS12系列單片機以速度更快的CPU12內(nèi)核為核心，簡稱S12系列，典型的S12總線速度可以達到25MHZ。
TDC-GP2

TDC-GP2

+關(guān)注
干擾器

干擾器

+關(guān)注

干擾器有多種類型，如GPS干擾器是適用于長途客車司機以及一些不想被GPS信號追蹤到的人群的一個機器，手機信號干擾器主要針對各類考場、學(xué)校、加油站、教堂、法庭、圖書館、會議中心（室）、影劇院、醫(yī)院、政府、金融、監(jiān)獄、公安、軍事重地等禁止使用手機的場所。
重力傳感器

重力傳感器

+關(guān)注

采用彈性敏感元件制成懸臂式位移器，與采用彈性敏感元件制成的儲能彈簧來驅(qū)動電觸點，完成從重力變化到電信號的轉(zhuǎn)換，廣泛應(yīng)用在中高端智能手機和平板電腦內(nèi)。
線束

線束

+關(guān)注
半導(dǎo)體工藝

半導(dǎo)體工藝

+關(guān)注
機械臂

機械臂

+關(guān)注
MPSoC

MPSoC

+關(guān)注
Genesys

Genesys

+關(guān)注
直流無刷電機

直流無刷電機

+關(guān)注

無刷直流電機由電動機主體和驅(qū)動器組成，是一種典型的機電一體化產(chǎn)品。無刷電機是指無電刷和換向器（或集電環(huán)）的電機，又稱無換向器電機。早在十九紀誕生電機的時候，產(chǎn)生的實用性電機就是無刷形式，即交流鼠籠式異步電動機，這種電動機得到了廣泛的應(yīng)用。
半導(dǎo)體制冷片

半導(dǎo)體制冷片

+關(guān)注
聲紋識別

聲紋識別

+關(guān)注

聲紋識別，生物識別技術(shù)的一種，也稱為說話人識別，包括說話人辨認和說話人確認。聲紋識別就是把聲信號轉(zhuǎn)換成電信號，再用計算機進行識別。不同的任務(wù)和應(yīng)用會使用不同的聲紋識別技術(shù)，如縮小刑偵范圍時可能需要辨認技術(shù)，而銀行交易時則需要確認技術(shù)。
零序

零序

+關(guān)注
ATmega16單片機

ATmega16單片機

+關(guān)注
直流電壓

直流電壓

+關(guān)注

凡是電流方向不隨時間變化的電流稱為直流電壓。電流值可以全為正值，也可以全為負值。在直流電流中又可分為兩種：穩(wěn)恒直流和脈動直流。直流輸電技術(shù)已經(jīng)由簡單的端對端工程朝著大規(guī)模多端輸電的方向發(fā)展，這些工程將是未來直流電網(wǎng)的組成部分，將相同電壓等級的直流工程連接成網(wǎng)遠比不同電壓等級下的獨立工程更經(jīng)濟、便捷。
LPC2368

LPC2368

+關(guān)注
緩沖電路

緩沖電路

+關(guān)注
Buck-Boost

Buck-Boost

+關(guān)注

buck是降壓型電路，boost是升壓型電路，可以分開單獨使用，buck-boost電路就是把2種電路合在一起，可升可降。buck-boost拓撲電路可以實現(xiàn)升降壓功能，常見的buck-boost電路有兩種，第一種是輸入與輸出電壓極性相反，只需采用一個開關(guān)管和二極管。另外一種是采用兩個開關(guān)管和兩個二極管，可實現(xiàn)同極性電壓升降壓功能。
識別技術(shù)

識別技術(shù)

+關(guān)注

所謂識別技術(shù)，也稱為自動識別技術(shù)，通過被識別物體與識別裝置之間的交互自動獲取被識別物體的相關(guān)信息，并提供給計算機系統(tǒng)供進一步處理。
電磁繼電器

電磁繼電器

+關(guān)注

電磁繼電器是一種電子控制器件，它具有控制系統(tǒng)（又稱輸入回路）和被控制系統(tǒng)（又稱輸出回路），通常應(yīng)用于自動控制電路中，它實際上是用較小的電流、較低的電壓去控制較大電流、較高的電壓的一種“自動開關(guān)”。故在電路中起著自動調(diào)節(jié)、安全保護、轉(zhuǎn)換電路等作用。
制冷片

制冷片

+關(guān)注
VCM

VCM

+關(guān)注

換一批

電機控制	DSP	氮化鎵	功率放大器	ChatGPT	自動駕駛	TI	瑞薩電子
BLDC	PLC	碳化硅	二極管	OpenAI	元宇宙	安森美	ADI
無刷電機	FOC	IGBT	逆變器	文心一言	5G	英飛凌	羅姆
直流電機	PID	MOSFET	傳感器	人工智能	物聯(lián)網(wǎng)	NXP	賽靈思
步進電機	SPWM	充電樁	IPM	機器視覺	無人機	三菱電機	ST
伺服電機	SVPWM	光伏發(fā)電	UPS	AR	智能電網(wǎng)	國民技術(shù)	Microchip

瑞薩	沁恒股份	全志	國民技術(shù)	瑞芯微	兆易創(chuàng)新	芯海科技	Altium
德州儀器	Vishay	Micron	Skyworks	AMS	TAIYOYUDEN	納芯微	HARTING
adi	Cypress	Littelfuse	Avago	FTDI	Cirrus LogIC	Intersil	Qualcomm
st	Murata	Panasonic	Altera	Bourns	矽力杰	Samtec	揚興科技
microchip	TDK	Rohm	Silicon Labs	圣邦微電子	安費諾工業(yè)	ixys	Isocom Compo
安森美	DIODES	Nidec	Intel	EPSON	樂鑫	Realtek	ERNI電子
TE Connectivity	Toshiba	OMRON	Sensirion	Broadcom	Semtech	旺宏	英飛凌
Nexperia	Lattice	KEMET	順絡(luò)電子	霍尼韋爾	pulse	ISSI	NXP
Xilinx	廣瀨電機	金升陽	君耀電子	聚洵	Liteon	新潔能	Maxim
MPS	億光	Exar	菲尼克斯	CUI	WIZnet	Molex	Yageo
Samsung	風(fēng)華高科	WINBOND	長晶科技	晶導(dǎo)微電子	上海貝嶺	KOA	Echelon
Coilcraft	LRC	trinamic

放大器	運算放大器	差動放大器	電流感應(yīng)放大器	比較器	儀表放大器	可變增益放大器	隔離放大器
時鐘	時鐘振蕩器	時鐘發(fā)生器	時鐘緩沖器	定時器	寄存器	實時時鐘	PWM 調(diào)制器
視頻放大器	功率放大器	頻率轉(zhuǎn)換器	揚聲器放大器	音頻轉(zhuǎn)換器	音頻開關(guān)	音頻接口	音頻編解碼器
模數(shù)轉(zhuǎn)換器	數(shù)模轉(zhuǎn)換器	數(shù)字電位器	觸摸屏控制器	AFE	ADC	DAC	電源管理
線性穩(wěn)壓器	LDO	開關(guān)穩(wěn)壓器	DC/DC	降壓轉(zhuǎn)換器	電源模塊	MOSFET	IGBT
振蕩器	諧振器	濾波器	電容器	電感器	電阻器	二極管	晶體管
變送器	傳感器	解析器	編碼器	陀螺儀	加速計	溫度傳感器	壓力傳感器
電機驅(qū)動器	步進驅(qū)動器	TWS	BLDC	無刷直流驅(qū)動器	濕度傳感器	光學(xué)傳感器	圖像傳感器
數(shù)字隔離器	ESD 保護	收發(fā)器	橋接器	多路復(fù)用器	氮化鎵	PFC	數(shù)字電源

開關(guān)電源	步進電機	無線充電	LabVIEW	EMC	PLC	OLED	單片機
5G	m2m	DSP	MCU	ASIC	CPU	ROM	DRAM
NB-IoT	LoRa	Zigbee	NFC	藍牙	RFID	Wi-Fi	SIGFOX
Type-C	USB	以太網(wǎng)	仿真器	RISC	RAM	寄存器	GPU
語音識別	萬用表	CPLD	耦合	電路仿真	電容濾波	保護電路	看門狗
CAN	CSI	DSI	DVI	Ethernet	HDMI	I2C	RS-485
SDI	nas	DMA	HomeKit	閾值電壓	UART	機器學(xué)習(xí)	TensorFlow

Arduino	BeagleBone	樹莓派	STM32	MSP430	EFM32	ARM mbed	EDA
示波器	LPC	imx8	PSoC	Altium Designer	Allegro	Mentor	Pads
OrCAD	Cadence	AutoCAD	華秋DFM	Keil	MATLAB	MPLAB	Quartus

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

智能體

智能體技術(shù)

相關(guān)標簽

相關(guān)話題

關(guān)注此標簽的用戶(1人)

C++	Java	Python	JavaScript	node.js	RISC-V	verilog	Tensorflow
Android	iOS	linux	RTOS	FreeRTOS	LiteOS	RT-THread	uCOS
DuerOS	Brillo	Windows11	HarmonyOS

林超文PCB設(shè)計：PADS教程，PADS視頻教程	鄭振宇老師：Altium Designer教程，Altium Designer視頻教程
張飛實戰(zhàn)電子視頻教程	朱有鵬老師：海思HI3518e教程，HI3518e視頻教程
李增老師：信號完整性教程，高速電路仿真教程	華為鴻蒙系統(tǒng)教程，HarmonyOS視頻教程
賽盛：EMC設(shè)計教程，EMC視頻教程	杜洋老師：STM32教程，STM32視頻教程
唐佐林：c語言基礎(chǔ)教程，c語言基礎(chǔ)視頻教程	張飛：BUCK電源教程，BUCK電源視頻教程
正點原子：FPGA教程，F(xiàn)PGA視頻教程	韋東山老師：嵌入式教程，嵌入式視頻教程
張先鳳老師：C語言基礎(chǔ)視頻教程	許孝剛老師：Modbus通訊視頻教程
王振濤老師：NB-IoT開發(fā)視頻教程	Mill老師：FPGA教程，Zynq視頻教程
C語言視頻教程	RK3566芯片資料合集
朱有鵬老師：U-Boot源碼分析視頻教程	開源硬件專題