《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 解決方案 > 最適合 AI 應(yīng)用的計算機(jī)視覺類型是什么,?

最適合 AI 應(yīng)用的計算機(jī)視覺類型是什么,?

2023-11-15
來源:德州儀器
關(guān)鍵詞: 德州儀器 AI 計算機(jī)視覺

  計算機(jī)視覺是指為計算機(jī)賦予人類視覺這一技術(shù)目標(biāo),,從而賦能裝配線檢查到駕駛輔助和機(jī)器人等應(yīng)用,。計算機(jī)缺乏像人類一樣憑直覺產(chǎn)生視覺和畫面的能力。我們必須給予計算機(jī)一些算法,,以便處理領(lǐng)域特異性任務(wù),。

  本文著眼于使計算機(jī)能夠像人類一樣通過“看”來感知世界,,從這一視角對人工智能 (AI) 進(jìn)行了探討。我將簡要比較每一類計算機(jī)視覺,,尤其關(guān)注在本地而不是依賴基于云的資源收集和處理數(shù)據(jù),,并根據(jù)數(shù)據(jù)采取行動的嵌入式系統(tǒng)。

  什么是計算機(jī)視覺,?

  20 世紀(jì) 60 年代,,計算機(jī)視覺已經(jīng)能夠執(zhí)行從頁面上讀取文本(光學(xué)字符識別)和識別圓形或矩形等形狀這類任務(wù)。從那時起,,計算機(jī)視覺便成為 AI 的核心領(lǐng)域之一,,它包括了任何從數(shù)據(jù)中感知、綜合或推斷含義的計算機(jī)系統(tǒng),。

  計算機(jī)視覺有三種方法:

  • 傳統(tǒng)計算機(jī)視覺是指用來處理諸如運(yùn)動估計,、全景圖像拼接或直線檢測等任務(wù)的編程算法。傳統(tǒng)計算機(jī)視覺使用標(biāo)準(zhǔn)信號處理和邏輯來處理任務(wù),。工程師需要手動選擇用于從圖像中提取含義的函數(shù),然后在處理任務(wù)的算法中使用所生成的特征,。Canny 邊緣檢測算法可以找出運(yùn)動的輪廓,,光流算法可以找出運(yùn)動的矢量,這有助于在圖像或運(yùn)動跟蹤后續(xù)圖像中分離出物體,。對于需要根據(jù)此任務(wù)或環(huán)境進(jìn)行校準(zhǔn)的參數(shù),,需要手動或通過輔助算法做出調(diào)整。

  • 經(jīng)典機(jī)器學(xué)習(xí)計算機(jī)視覺需要由專家來“打造”特征集,,供機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,。其中許多特征是與傳統(tǒng)計算機(jī)視覺應(yīng)用所共有的。并非所有特征都有用,,因此需要進(jìn)行分析以去除無信息特征,;機(jī)器學(xué)習(xí)算法將使用這些特征進(jìn)行訓(xùn)練,以便找出可能難以手動分離的模式,。若要有效地實(shí)現(xiàn)這些算法,,需要具備圖像處理和機(jī)器學(xué)習(xí)方面的專業(yè)知識。

  • 深度學(xué)習(xí)計算機(jī)視覺屬于機(jī)器學(xué)習(xí),,但使用的是非常龐大的神經(jīng)網(wǎng)絡(luò)模型,,對大量未經(jīng)處理的“原始”數(shù)據(jù)進(jìn)行運(yùn)算。深度學(xué)習(xí)對計算機(jī)視覺產(chǎn)生了重大影響,,它將特征提取操作拉入模型之中,,使得算法可以學(xué)習(xí)信息最豐富的特征,而無需專業(yè)知識來手動打造特征集,。深度學(xué)習(xí)甚至能夠更好地分離出微妙的模式,,但對計算和內(nèi)存的要求更高,。

  那么,哪一類計算機(jī)視覺最好呢,?

  這最終取決于表 1 中概述的幾個因素,。此表只是籠統(tǒng)地進(jìn)行概括,其中的準(zhǔn)確性和任務(wù)復(fù)雜性等指標(biāo)依賴于具體用例,。

97.JPG

  表 1:計算機(jī)視覺技術(shù)比較

  經(jīng)典機(jī)器學(xué)習(xí)計算機(jī)視覺介于傳統(tǒng)方法和深度學(xué)習(xí)方法之間,;與其他兩種方法相比,能夠從中受益的應(yīng)用集合規(guī)模較小,。在簡單直接,、高通量或安全攸關(guān)的應(yīng)用中,傳統(tǒng)計算機(jī)視覺可能準(zhǔn)確而高效,。深度學(xué)習(xí)通用性超強(qiáng),、開發(fā)難度超低,并且在復(fù)雜應(yīng)用中的準(zhǔn)確性超高,,如在高密度設(shè)計的印刷電路板 (PCB) 裝配驗(yàn)證期間用于發(fā)現(xiàn)微小的缺失元件,。

  一些應(yīng)用可以通過同時采用多種類型的計算機(jī)視覺算法而受益,相互取長補(bǔ)短,。這種方法常用于環(huán)境非常多變的安全攸關(guān)型應(yīng)用中,,如駕駛輔助系統(tǒng)。例如,,您可以并行采用基于傳統(tǒng)計算機(jī)視覺方法的光流和深度學(xué)習(xí)模型來跟蹤附近的車輛,,并且使用一種算法對結(jié)果進(jìn)行融合,從而確定兩種方法是否一致,。如果不一致,,系統(tǒng)可能會警告駕駛員或啟動安全操控。

  替代方法是依次使用多種類型的計算機(jī)視覺,。條形碼讀取器可以使用深度學(xué)習(xí)來定位感興趣區(qū)域,,對這些區(qū)域進(jìn)行裁剪,然后使用傳統(tǒng)計算機(jī)視覺算法進(jìn)行解碼,。

  深度學(xué)習(xí)在計算機(jī)視覺應(yīng)用中的益處

  與傳統(tǒng)計算機(jī)視覺和經(jīng)典機(jī)器學(xué)習(xí)相比,,深度學(xué)習(xí)由于在研究、開源和商業(yè)社區(qū)中非常受歡迎,,因此始終具有較高的準(zhǔn)確性,,并且在迅速改進(jìn)。圖 1 從開發(fā)者的角度總結(jié)了這三種技術(shù)在數(shù)據(jù)流方面的差異,。

98.JPG

  圖 1:各種計算機(jī)視覺方法的數(shù)據(jù)流

  深度學(xué)習(xí)是一種計算密集型方法,。然而,由于處理能力,、速度,、加速器(如神經(jīng)處理單元和圖形處理單元)的改進(jìn),,以及對矩陣和向量運(yùn)算的軟件支持的提升,計算要求增加的問題得以緩解,,即使在嵌入式系統(tǒng)上也是如此,。諸如 AM62A7 等微處理器可以利用硬件加速器,以很高的幀率運(yùn)行深度學(xué)習(xí)算法,。

  計算機(jī)視覺實(shí)踐

  TI AM6xA 產(chǎn)品組合(如 AM62A7)中的處理器包含深度學(xué)習(xí)加速硬件和輔助軟件,,有利于傳統(tǒng)及深度學(xué)習(xí)計算機(jī)視覺任務(wù)。在 TDA4VM 和 AM68PA 等處理器上,,數(shù)字信號處理器內(nèi)核(如 C66x)以及用于光流和立體聲深度估計的硬件加速器還能為高性能傳統(tǒng)計算機(jī)視覺任務(wù)賦能,。

  借助能夠同時支持傳統(tǒng)計算機(jī)視覺和深度學(xué)習(xí)計算機(jī)視覺的處理器,將有可能打造出與科幻夢想相媲美的工具,。自動購物車將會簡化購物過程,;手術(shù)和醫(yī)療機(jī)器人將指導(dǎo)醫(yī)生發(fā)現(xiàn)早期疾病征兆;移動機(jī)器人將會修剪草坪和遞送包裹,。請參閱 TI 的邊緣 AI 視覺頁面,,探究嵌入式計算機(jī)視覺如何改變世界。



更多精彩內(nèi)容歡迎點(diǎn)擊==>>電子技術(shù)應(yīng)用-AET<<

mmexport1621241704608.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章,、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者,。如涉及作品內(nèi)容、版權(quán)和其它問題,,請及時通過電子郵件或電話通知我們,,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118,;郵箱:[email protected]