国产一区二区三区三州86295_视频一区二区国产_国产日韩综合导航_日韩亚洲大尺度高清

你的位置:首頁 > 互連技術(shù) > 正文

最適合 AI 應(yīng)用的計算機(jī)視覺類型是什么?

發(fā)布時間:2023-11-20 責(zé)任編輯:lina

【導(dǎo)讀】計算機(jī)視覺是指為計算機(jī)賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計算機(jī)缺乏像人類一樣憑直覺產(chǎn)生視覺和畫面的能力。我們必須給予計算機(jī)一些算法,以便處理領(lǐng)域特異性任務(wù)。


計算機(jī)視覺是指為計算機(jī)賦予人類視覺這一技術(shù)目標(biāo),從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用。計算機(jī)缺乏像人類一樣憑直覺產(chǎn)生視覺和畫面的能力。我們必須給予計算機(jī)一些算法,以便處理領(lǐng)域特異性任務(wù)。


本文著眼于使計算機(jī)能夠像人類一樣通過“看”來感知世界,從這一視角對人工智能 (AI) 進(jìn)行了探討。我將簡要比較每一類計算機(jī)視覺,尤其關(guān)注在本地而不是依賴基于云的資源收集和處理數(shù)據(jù),并根據(jù)數(shù)據(jù)采取行動的嵌入式系統(tǒng)。


什么是計算機(jī)視覺?


20 世紀(jì) 60 年代,計算機(jī)視覺已經(jīng)能夠執(zhí)行從頁面上讀取文本(光學(xué)字符識別)和識別圓形或矩形等形狀這類任務(wù)。從那時起,計算機(jī)視覺便成為 AI 的核心領(lǐng)域之一,它包括了任何從數(shù)據(jù)中感知、綜合或推斷含義的計算機(jī)系統(tǒng)。

計算機(jī)視覺有三種方法:


  • 傳統(tǒng)計算機(jī)視覺是指用來處理諸如運動估計、全景圖像拼接或直線檢測等任務(wù)的編程算法。傳統(tǒng)計算機(jī)視覺使用標(biāo)準(zhǔn)信號處理和邏輯來處理任務(wù)。工程師需要手動選擇用于從圖像中提取含義的函數(shù),然后在處理任務(wù)的算法中使用所生成的特征。Canny 邊緣檢測算法可以找出運動的輪廓,光流算法可以找出運動的矢量,這有助于在圖像或運動跟蹤后續(xù)圖像中分離出物體。對于需要根據(jù)此任務(wù)或環(huán)境進(jìn)行校準(zhǔn)的參數(shù),需要手動或通過輔助算法做出調(diào)整。

  • 經(jīng)典機(jī)器學(xué)習(xí)計算機(jī)視覺需要由專家來“打造”特征集,供機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練。其中許多特征是與傳統(tǒng)計算機(jī)視覺應(yīng)用所共有的。并非所有特征都有用,因此需要進(jìn)行分析以去除無信息特征;機(jī)器學(xué)習(xí)算法將使用這些特征進(jìn)行訓(xùn)練,以便找出可能難以手動分離的模式。若要有效地實現(xiàn)這些算法,需要具備圖像處理和機(jī)器學(xué)習(xí)方面的專業(yè)知識。

  • 深度學(xué)習(xí)計算機(jī)視覺屬于機(jī)器學(xué)習(xí),但使用的是非常龐大的神經(jīng)網(wǎng)絡(luò)模型,對大量未經(jīng)處理的“原始”數(shù)據(jù)進(jìn)行運算。深度學(xué)習(xí)對計算機(jī)視覺產(chǎn)生了重大影響,它將特征提取操作拉入模型之中,使得算法可以學(xué)習(xí)信息最豐富的特征,而無需專業(yè)知識來手動打造特征集。深度學(xué)習(xí)甚至能夠更好地分離出微妙的模式,但對計算和內(nèi)存的要求更高。


那么,哪一類計算機(jī)視覺最好呢?


這最終取決于表 1 中概述的幾個因素。此表只是籠統(tǒng)地進(jìn)行概括,其中的準(zhǔn)確性和任務(wù)復(fù)雜性等指標(biāo)依賴于具體用例。


最適合 AI 應(yīng)用的計算機(jī)視覺類型是什么?

表 1:計算機(jī)視覺技術(shù)比較


經(jīng)典機(jī)器學(xué)習(xí)計算機(jī)視覺介于傳統(tǒng)方法和深度學(xué)習(xí)方法之間;與其他兩種方法相比,能夠從中受益的應(yīng)用集合規(guī)模較小。在簡單直接、高通量或安全攸關(guān)的應(yīng)用中,傳統(tǒng)計算機(jī)視覺可能準(zhǔn)確而高效。深度學(xué)習(xí)通用性超強(qiáng)、開發(fā)難度超低,并且在復(fù)雜應(yīng)用中的準(zhǔn)確性超高,如在高密度設(shè)計的印刷電路板 (PCB) 裝配驗證期間用于發(fā)現(xiàn)微小的缺失元件。


一些應(yīng)用可以通過同時采用多種類型的計算機(jī)視覺算法而受益,相互取長補短。這種方法常用于環(huán)境非常多變的安全攸關(guān)型應(yīng)用中,如駕駛輔助系統(tǒng)。例如,您可以并行采用基于傳統(tǒng)計算機(jī)視覺方法的光流和深度學(xué)習(xí)模型來跟蹤附近的車輛,并且使用一種算法對結(jié)果進(jìn)行融合,從而確定兩種方法是否一致。如果不一致,系統(tǒng)可能會警告駕駛員或啟動安全操控。


替代方法是依次使用多種類型的計算機(jī)視覺。條形碼讀取器可以使用深度學(xué)習(xí)來定位感興趣區(qū)域,對這些區(qū)域進(jìn)行裁剪,然后使用傳統(tǒng)計算機(jī)視覺算法進(jìn)行解碼。


深度學(xué)習(xí)在計算機(jī)視覺應(yīng)用中的益處


與傳統(tǒng)計算機(jī)視覺和經(jīng)典機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)由于在研究、開源和商業(yè)社區(qū)中非常受歡迎,因此始終具有較高的準(zhǔn)確性,并且在迅速改進(jìn)。圖 1 從開發(fā)者的角度總結(jié)了這三種技術(shù)在數(shù)據(jù)流方面的差異。


2-1.jpg

圖 1:各種計算機(jī)視覺方法的數(shù)據(jù)流


深度學(xué)習(xí)是一種計算密集型方法。然而,由于處理能力、速度、加速器(如神經(jīng)處理單元和圖形處理單元)的改進(jìn),以及對矩陣和向量運算的軟件支持的提升,計算要求增加的問題得以緩解,即使在嵌入式系統(tǒng)上也是如此。諸如 AM62A7 等微處理器可以利用硬件加速器,以很高的幀率運行深度學(xué)習(xí)算法。


計算機(jī)視覺實踐


TI AM6xA 產(chǎn)品組合(如 AM62A7)中的處理器包含深度學(xué)習(xí)加速硬件和輔助軟件,有利于傳統(tǒng)及深度學(xué)習(xí)計算機(jī)視覺任務(wù)。在 TDA4VM 和 AM68PA 等處理器上,數(shù)字信號處理器內(nèi)核(如 C66x)以及用于光流和立體聲深度估計的硬件加速器還能為高性能傳統(tǒng)計算機(jī)視覺任務(wù)賦能。


借助能夠同時支持傳統(tǒng)計算機(jī)視覺和深度學(xué)習(xí)計算機(jī)視覺的處理器,將有可能打造出與科幻夢想相媲美的工具。自動購物車將會簡化購物過程;手術(shù)和醫(yī)療機(jī)器人將指導(dǎo)醫(yī)生發(fā)現(xiàn)早期疾病征兆;移動機(jī)器人將會修剪草坪和遞送包裹。請參閱 TI 的邊緣 AI 視覺頁面,探究嵌入式計算機(jī)視覺如何改變世界。

(來源:德州儀器)


免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進(jìn)行處理。


推薦閱讀:

77GHz 毫米波雷達(dá)傳感器如何應(yīng)對腳踢開啟系統(tǒng)面臨的挑戰(zhàn)

熱烈慶祝瑞森半導(dǎo)體成立10周年

熄燈不停產(chǎn),這樣的超級工廠是如何打造出來的?

利用USB-C實現(xiàn)并聯(lián)電池充電如何幫助提升用戶體驗

英特爾CEO:加速IDM 2.0轉(zhuǎn)型,推進(jìn)代工服務(wù)發(fā)展


特別推薦
技術(shù)文章更多>>
技術(shù)白皮書下載更多>>
熱門搜索
共模電感 固態(tài)盤 固體繼電器 光傳感器 光電池 光電傳感器 光電二極管 光電開關(guān) 光電模塊 光電耦合器 光電器件 光電顯示 光繼電器 光控可控硅 光敏電阻 光敏器件 光敏三極管 光收發(fā)器 光通訊器件 光纖連接器 軌道交通 國防航空 過流保護(hù)器 過熱保護(hù) 過壓保護(hù) 焊接設(shè)備 焊錫焊膏 恒溫振蕩器 恒壓變壓器 恒壓穩(wěn)壓器
?

關(guān)閉

?

關(guān)閉