色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智能體已經(jīng)能像人一樣刷視頻了?國內(nèi)聯(lián)匯科技OmAgent智能體試用!

新眾報(bào) ? 來源:jf_48880855 ? 作者:jf_48880855 ? 2024-11-22 18:59 ? 次閱讀

智能體已經(jīng)能像人一樣刷視頻了?國內(nèi)知名大模型獨(dú)角獸級(jí)別公司,資深AI玩家聯(lián)匯科技退出了OmAgent智能體,已經(jīng)開啟試用。


當(dāng)你正在觀看一部緊張刺激的動(dòng)作電影,忽然好奇:

“那個(gè)角色到底是在哪一集說的那句話?”

“這里的背景音樂是什么?”

又或者在一場(chǎng)足球比賽中,你錯(cuò)過了那個(gè)決定性的進(jìn)球,卻又想再次回放。諸如此類的需求,如果僅憑人力尋找,無疑存在極大的工作量。

但是 AI 能夠?yàn)闄C(jī)器配置雙眼與大腦,讓它們能夠看懂視頻、理解劇情,對(duì)于普通人來說,這不僅是提高了搜索效率,更是擴(kuò)展我們與數(shù)字世界的互動(dòng)方式。

英偉達(dá)最新發(fā)布的 NVIDIA AI Blueprint 希望幫助人們解決這一問題。這是一種預(yù)訓(xùn)練的、可自定義 AI 工作流,他為開發(fā)者構(gòu)建和部署用于典型用例的生成式 AI 應(yīng)用程序提供了一套完整的解決方案。

比如在英偉達(dá)提供的試用界面中,你可以選擇三個(gè)視頻片段中的一個(gè)進(jìn)行內(nèi)容問答

wKgaoWdAZACAAiaPAAEkwiGwqls755.png

在幾輪測(cè)試過后,我們發(fā)現(xiàn) Blueprint 對(duì)視頻問答還是有不錯(cuò)的效果的。你可以提問某個(gè)事件發(fā)生的時(shí)間,也可以提問某個(gè)對(duì)象的狀態(tài)。
例如當(dāng)我們提問 “工人在什么時(shí)候掉落了箱子”,Blueprint 可以正確的回答出時(shí)間區(qū)間。二類似于 “叉車往哪個(gè)方向開” 這種基于連續(xù)過程的問題,Blueprint 也可以輕松應(yīng)答。
不過對(duì)于某些細(xì)節(jié),例如 “誰撿起了掉在地上的箱子”,Blueprint 則給出了錯(cuò)誤的答案。

wKgZoWdAZACAbe6-AADGVe1SurQ102.png

尤其令人遺憾的是,在試用過程中我們不斷遇到流量限制,無限驗(yàn)證等問題,試用體驗(yàn)可以說一言難盡。并且目前 Blueprint 仍然處于早期申請(qǐng)使用制階段,沒有辦法快速進(jìn)行使用。

wKgaoWdAZAGAL0xhAAFFNrr4ZdM801.png

Blueprint 之外,我們還有什么選擇?

經(jīng)過一番搜索和調(diào)研,我們?cè)?Github 上發(fā)現(xiàn)了 OmAgent 這個(gè)項(xiàng)目,這是一個(gè)多模態(tài)智能體框架,提供了同樣強(qiáng)大的視頻問答功能。

wKgZoWdAZAGAS8aLAAFgY5obiRk207.png

項(xiàng)目地址:https://github.com/om-ai-lab/OmAgent

OmAgent 是什么

OmAgent 是一個(gè)開源的智能體框架,支持簡(jiǎn)單快速地面向設(shè)備進(jìn)行智能體系統(tǒng)的開發(fā),為智能手機(jī)、智能可穿戴設(shè)備、智能攝像頭乃至機(jī)器人等各類硬件設(shè)備賦能。OmAgent 為各種類型的設(shè)備創(chuàng)建了一個(gè)抽象概念,并大大簡(jiǎn)化了將這些設(shè)備與最先進(jìn)的多模態(tài)基礎(chǔ)模型和智能體算法相結(jié)合的過程,使每個(gè)人都能基于設(shè)備建立最有趣的 AI 應(yīng)用。

wKgaoWdAZAKAaM5MAADlcoPXPys526.png

OmAgent 的設(shè)計(jì)架構(gòu)遵循三個(gè)基本原則:
1. 基于圖的工作流編排,支持分支、循環(huán)、并行等復(fù)雜邏輯操作;2. 原生多模態(tài),提供對(duì)音視圖文等多種模態(tài)數(shù)據(jù)的支持;3. 設(shè)備中心化,提供便捷的設(shè)備連接和交互方法。
簡(jiǎn)單來說,開發(fā)者可以基于 OmAgent 設(shè)計(jì)開發(fā)基于圖工作流編排的面向設(shè)備的原生多模態(tài)智能體。這里的設(shè)備不光包含智能手機(jī),智能可穿戴設(shè)備(智能眼鏡等),智能家居,還包括命令行以及 web 端,開發(fā)者只需要專注于智能體本身,而不用分神處理設(shè)備。
OmAgent 項(xiàng)目里提供了 6 個(gè)示例項(xiàng)目,由淺入深展示了如何搭建一個(gè)智能體的完整過程,其中視頻理解智能體工作流被 EMNLP 2024 主會(huì)收錄,實(shí)現(xiàn)了和 Blueprint Demo 相似的功能。


OmAgent 表現(xiàn)如何?


根據(jù)項(xiàng)目文檔只需要進(jìn)行簡(jiǎn)單的配置就可以將 OmAgent 部署運(yùn)行在本地環(huán)境。我們首先對(duì) Blueprint 提供的測(cè)試視頻進(jìn)行預(yù)處理,在這個(gè)階段視頻會(huì)被分解為若干個(gè)片段,每個(gè)片段會(huì)被大模型進(jìn)行總結(jié),并向量化存儲(chǔ)在數(shù)據(jù)庫中。接下來使用之前的問題對(duì) OmAgent 進(jìn)行測(cè)試,可以看到智能體可以正確定位事件以及發(fā)生的時(shí)間。
Q: When did the worker drop the box?

A:

wKgZoWdAZAOAD3bnAAFzkSYaMrs552.png

Q: Which direction did the forklift go?

A:

wKgaoWdAZAOASgm2AAGehcmUwq4016.png


Q: Who picked up the box that fell on the ground?

A:

wKgZoWdAZAOARBJBAADmjQr1png710.png

接下來我們進(jìn)行更復(fù)雜的測(cè)試,OmAgent 可以支持音頻信息以及超長(zhǎng)視頻索引。我們選取了最近大火的劇集《雙城之戰(zhàn)》第二季第一集作為素材,基于其中的畫面和劇情進(jìn)行提問。
Q: 凱特琳收到的鑰匙代表了什么?

A:

wKgaoWdAZASAcdA1AAEdrKqU-UI948.png


Q: 凱特琳和蔚在爭(zhēng)執(zhí)些什么?

A:

wKgZoWdAZASAV-WbAAFZb73r65Q400.png

Q: 視頻最后幾個(gè)議員在討論什么?

A:

wKgaoWdAZASATh9wAAEBsHz15Rs437.png


Q: 議員開會(huì)的時(shí)候誰闖入了進(jìn)來?

A:

wKgZoWdAZAWARw98AAFgj5fdgO8724.png

可以看到,即使面對(duì)如此復(fù)雜的視頻素材,OmAgent 依然可以游刃有余。
除了視頻問答之外,OmAgent 的最大特點(diǎn)是可以將智能體直接應(yīng)用在硬件設(shè)備上,我們也對(duì)此進(jìn)行了測(cè)試。使用項(xiàng)目提供的 app,我們可以運(yùn)行示例項(xiàng)目中的穿衣搭配推薦智能體。智能體會(huì)根據(jù)你的需求,以及你已有的衣櫥信息,為你推薦合適的穿衣建議。在這個(gè)過程中智能體會(huì)和用戶進(jìn)行多輪溝通以確定用戶需求,并最終返回最合適的搭配。

如果想了解更多OmAgent智能體技術(shù)信息,可以通過聯(lián)匯科技官網(wǎng)聯(lián)系!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    157

    瀏覽量

    10595
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2488

    瀏覽量

    2856
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+兩本互為支持的書

    之極。 《計(jì)算機(jī)視覺之PyTorch數(shù)字圖像處理》為《具身智能機(jī)器系統(tǒng)》提供感知和識(shí)別能力,而《具身智能機(jī)器系統(tǒng)》則為《計(jì)算機(jī)視覺之P
    發(fā)表于 01-01 15:50

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】1.初步理解具身智能

    影響與發(fā)展,提供全球及國內(nèi)行業(yè)趨勢(shì)的見解。書中詳細(xì)討論新興領(lǐng)域面臨的諸多挑戰(zhàn),從應(yīng)用的不確定性、昂貴的成本到倫理問題,為讀者呈現(xiàn)了當(dāng)前形勢(shì)的現(xiàn)實(shí)視角。 接下來,書中深入探討了具
    發(fā)表于 12-28 21:12

    【「具身智能機(jī)器系統(tǒng)」閱讀體驗(yàn)】+初品的體驗(yàn)

    解決許多技術(shù)的和非技術(shù)的挑戰(zhàn),如提高智能的自主性、處理復(fù)雜環(huán)境互動(dòng)的能力及確保行為的倫理和安全性。 未來的研究需要將視覺、語音和其他傳感技術(shù)與機(jī)器技術(shù)相結(jié)合,以探索更加先進(jìn)的知識(shí)表示和記憶模塊,利用強(qiáng)化學(xué)習(xí)進(jìn)
    發(fā)表于 12-20 19:17

    《具身智能機(jī)器系統(tǒng)》第1-6章閱讀心得之具身智能機(jī)器系統(tǒng)背景知識(shí)與基礎(chǔ)模塊

    Intelligence)這概念有深入理解。本書開篇和大部分書籍文章一樣,都是立足宏觀角度,先把視角引申到世界經(jīng)濟(jì)形勢(shì)。書中闡述具身智能機(jī)器
    發(fā)表于 12-19 22:26

    AI智能是什么_AI智能如何重塑企業(yè)業(yè)務(wù)流程

    AI技術(shù)的飛速發(fā)展令人矚目。就在企業(yè)領(lǐng)導(dǎo)者們剛開始熟悉AI助手時(shí),AI智能Agent(國際版)已經(jīng)迅速成為討論的焦點(diǎn)。它們之所以受到廣泛關(guān)注,是因?yàn)檎缑课粏T工都將配備AI助手一樣
    的頭像 發(fā)表于 12-19 17:55 ?303次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器系統(tǒng) | 了解AI的下個(gè)浪潮!

    試用評(píng)測(cè)資格! 早就聽大佬們說,具身智能是人工智能的下波浪潮,也是AI未來的趨勢(shì)! 最近,具身智能的概念更是炙手可熱,備受矚目! 不論是這
    發(fā)表于 11-11 10:20

    封裝一樣的磁棒電感通用嗎

    電子發(fā)燒友網(wǎng)站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費(fèi)下載
    發(fā)表于 10-28 11:15 ?0次下載

    工控一體機(jī)在智能機(jī)器領(lǐng)域應(yīng)用的優(yōu)勢(shì)與市場(chǎng)展望

    隨著科技的不斷發(fā)展,智能機(jī)器人在工業(yè)領(lǐng)域扮演著越來越重要的角色。而工控一體機(jī)作為智能機(jī)器的核心部件之,具有許多獨(dú)特的優(yōu)勢(shì),為
    的頭像 發(fā)表于 10-14 16:41 ?343次閱讀
    工控<b class='flag-5'>一體</b>機(jī)在<b class='flag-5'>智能</b>機(jī)器<b class='flag-5'>人</b>領(lǐng)域應(yīng)用的優(yōu)勢(shì)與市場(chǎng)展望

    如何讓智能客服真人一樣對(duì)話?容聯(lián)七陌揭秘:多Agent大模型

    科技云報(bào)到原創(chuàng)。 ? ? 經(jīng)歷多年的“答非所問”、“問三不知”,很多人已經(jīng)厭倦所謂的“智能客服”。哪怕是技術(shù)
    的頭像 發(fā)表于 09-26 18:41 ?477次閱讀
    如何讓<b class='flag-5'>智能</b>客服<b class='flag-5'>像</b>真人<b class='flag-5'>一樣</b>對(duì)話?容聯(lián)七陌揭秘:多Agent大模型

    長(zhǎng)虹發(fā)布滄海智能AI TV與智家AI大模型

    2024年德國柏林消費(fèi)電子展覽會(huì)(IFA2024)盛大啟幕,長(zhǎng)虹集團(tuán)攜全球首款滄海智能AI TV與長(zhǎng)虹美菱智家AI大模型驚艷亮相。滄海智能
    的頭像 發(fā)表于 09-10 18:21 ?881次閱讀

    請(qǐng)問全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?

    全差分運(yùn)算放大器般運(yùn)算放大器一樣設(shè)計(jì)加法器嗎?
    發(fā)表于 08-09 06:26

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDEKeil一樣指定不同文件下的代碼編譯
    發(fā)表于 07-23 06:22

    Meta高管稱大語言模型永遠(yuǎn)無法人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產(chǎn)品備受矚目,但其背后的大型語言模型(LLM)永遠(yuǎn)無法實(shí)現(xiàn)像人類一樣的推理和計(jì)劃能力。
    的頭像 發(fā)表于 05-27 09:50 ?450次閱讀

    智能傳感器有什么不一樣

    走向市場(chǎng)。 智能傳感器的結(jié)構(gòu)及特點(diǎn) 傳感器的五官一樣,是獲取信息的重要工具。它在工業(yè)生產(chǎn)、國防建設(shè)和科學(xué)技術(shù)領(lǐng)域發(fā)揮著巨大的作用。但與飛速發(fā)展的計(jì)算機(jī)相比較,作為“五官”的傳感器遠(yuǎn)
    的頭像 發(fā)表于 05-07 09:23 ?402次閱讀
    主站蜘蛛池模板: 美女被免费喷白浆视频| 狼与美女谐音歌词| 热思思| 在线高清电影理论片4399| 嘟嘟嘟WWW在线观看视频高清| 母狗黄淑珍| 最近中文字幕高清中文字幕MV| 久久精品国产在热亚洲| 野花日本高清在线观看免费吗| 黑人猛挺进小莹的体内视频| 亚洲AV无码专区国产乱码网站| 国产成人在线小视频| 特级毛片内射WWW无码| 攻把受做得合不拢腿play| 色欲天天天综合网免费| 国产99久久九九免费精品无码| 色噜噜狠狠色综合中文字幕| 古代荡乳尤物H妓女调教| 色橹橹欧美在线观看视频高| 国产 亚洲 中文在线 字幕 | 超碰人热人人热人人看| 青青草原直播| 成人国产一区| 视频成人app永久在线观看| 国产成人自拍视频在线观看| 无套暴躁白丝秘书| 国产亚洲精品 在线视频 香蕉 | 在线观看成年人免费视频| 九九热在线视频| 中文字幕亚洲欧美日韩2019 | 日本精品在线观看视频| 灌满内射HP1V1| 校园女教师之禁区| 黑人巨大交牲老太| 又黄又爽又无遮挡在线观看免费| 久青草国产在线观看视频| 99爱免费视频| 日本三级按摩推拿按摩| 国产精品免费大片一区二区| 亚洲国产精品线在线观看| 久久爱狠狠综合网|