人的大腦和自監督學習模型的相似度有多高?
麥吉爾大學和魁北克人工智能研究所(Mila)的計算神經科學家布萊克-理查茲(Blake Richar....
OpenCV中支持的非分類與檢測視覺模型
前面給大家分別匯總了OpenCV中支持的圖像分類與對象檢測模型,視覺視覺任務除了分類與檢測還有很多其....
灰度共生矩陣(GLCM)基本原理
灰度共生矩陣(Gray Level CO-Occurrence Matrix-GLCM)是圖像特征分....
二值圖像分析最常見的方式
二值圖像分析最常見的一個主要方式就是輪廓發現與輪廓分析,其中輪廓發現的目的是為輪廓分析做準備,經過輪....
基于一致性的半監督語義分割方法
語義分割是一項重要的像素級別分類任務。但是由于其非常依賴于數據的特性(data hungary), ....
低分辨率行為識別技術具有廣泛的應用價值
安防監控是智慧城市的重要組成部分。然而,在城市監控場景下,行人目標往往距離攝像頭遠,所占像素小,這為....
谷歌宣布了一門新的編程語言Carbon
正如微軟創建TypeScript來更新JavaScript那樣,Carbon作為一種在C++基礎上開....
圖像修復面臨兩個關鍵問題
圖像修復是指對圖像缺失區域進行補全,是計算機視覺的基本任務之一。該方向有許多實際應用,例如物體移除、....
一個YOLO系列的算法實現庫YOLOU
這里主要是對于YOLO系列經典化模型的訓練對比,主要是對于YOLOv5、YOLOv6、YOLOv7以....
OpenCV4.x可實現加載模型與執行推斷
OpenCV4.x發布以后,有很多新的特性與黑科技支持,無論是支持OpenVINO加速、圖計算模塊、....
一種使用Mask Transformer進行全景分割的端到端解決方案
在 CVPR 2022 上發表的「CMT-DeepLab: Clustering Mask Tran....
基于配準的少樣本異常檢測的框架
近年來,異常檢測在工業缺陷檢測、醫療診斷,自動駕駛等領域有著廣泛的應用。“異常”通常定義為 “正常”....
如何擴大卷積來消除與Transformer的性能差距
首先,先讓我 brainstorm 一下。當你看到 neural network scaling 這....
關于Next-ViT 的建模能力
由于復雜的注意力機制和模型設計,大多數現有的視覺 Transformer(ViT)在現實的工業部署場....
一個大規模多任務學習框架μ2Net
這種方法可以提高每個任務的質量,并在收斂時間、訓練實例數量、能源消耗等方面提高模型效率。本文提出的機....
單個CNN就能夠在多個數據集上實現SOTA
然而,由于卷積核的離散性,傳統的 CNN 不能跨分辨率使用。當考慮具有相同 CNN 的不同維度數據時....
如何實現遙感圖像等超大尺寸圖像快速識別
目前比較成熟的衛星圖像識別算法并不少,但大多依托于強大的計算資源,為了用有限的計算資源實現大尺寸圖像....
英偉達宣布全新編程平臺—QODA量子優化設備架構
與 CUDA 類似,QODA 是開放的、統一的環境,后者適用于當今一些最強大的計算機和量子處理器,可....
圖像修復與處理經典論文回顧和精讀
在實踐中,僅僅通過優化隱向量z難以準確重建ImageNet這樣的復雜真實圖像。訓練GAN的數據集(I....
單應性矩陣計算函數與應用
其中scene_corners為對象在場景圖像中的四點坐標,獲得坐標以后就可以繪制對應的矩形,從而在....
存在一種完美的編程語言嗎?
Xous 開發的第一年都是使用’no-std’完成的,代價是占用大量內存空間且復雜性高。盡管可以編寫....
OpenCV種支持標準卷積邊緣填充做法
OpenCV在使用卷積進行圖像處理過程種,如何處理邊緣像素與錨定輸出兩個技術細節一直是很多人求而不得....
Imagen的工作原理解讀
在這部分,作者展示了 Imagen 的整體架構,并對其它的工作原理做了高級解讀;然后依次更透徹地剖析....
有關batch size的設置范圍
我們知道,batch size 決定了深度學習訓練過程中,完成每個 epoch 所需的時間和每次迭代....