(映維網 2019年10月15日)在談論計算機視覺時,“追蹤”一詞經常出現。追蹤的種類有很多,具體需要取決于追蹤內容,追蹤方式,以及要實現的目標。在這篇博文中,英特爾向我們介紹了不同類型的追蹤,它們在上層方面的工作方式,以及潛在的用例。本文不探討將傳感器附著到對象的追蹤技術,如RFID標簽。下面是映維網的具體整理:
點擊此處添加圖片說明文字
1. 骨骼追蹤
骨骼追蹤的存在已有一段時間,而你以前可能已經見過,只是沒有意識到而已。微軟Kinect是最早的消費者骨骼追蹤示例之一,它主要是利用人體運動數據來支持玩家與游戲交互。
骨骼追蹤系統通常使用深度攝像頭來獲得最可靠的實時結果,但同時可以使用帶有開源軟件的2D攝像頭并以較低的幀頻追蹤骨骼。
簡而言之,骨骼追蹤算法可識別一個或多人的存在,以及他們頭部,身體和四肢的位置。某些系統同時可以追蹤手部或特定手勢,但并非所有骨骼追蹤系統都如此。大多數系統可以識別一系列的關節,如肩膀、肘部、腕部。然后,系統將在所有已識別的關節之間繪制線條,并用某種元素來代表頭部/頸部。
任何種類的深度攝像頭都可以幫助骨骼追蹤系統消除重疊/遮擋對象或肢體之間的歧義,并且相較于純2D攝像頭算法進一步適應不同的光照條件。今天,一系列的骨骼追蹤解決方案都支持英特爾實感深度攝像頭。
2. 手勢追蹤和手部追蹤
手勢追蹤和手部追蹤容易混淆,而它們確實存在共同點:兩者都允許用戶使用手部來與某種形式的數字內容進行交互。但是,我們通常可以將手勢追蹤視為僅限于配合手指姿態的特定手形,比如說拳頭或OK手勢。這種系統的優點是,它通常可以以高置信度識別手勢,缺點是人類用戶通常最多只能記住五個手勢及其代表意思。要訓練用戶掌握具有更多手勢的復雜系統,并且不會混淆,這通常需要更長的時間。
點擊此處添加圖片說明文字
手部追蹤系統通常沒有手勢追蹤系統明確,而它與骨骼追蹤類似。大多數手部追蹤系統一般是識別手指關節和骨骼,通常是用某種深度攝像頭來幫助解決遮擋和歧義情況。與單個手勢系統相比,手部追蹤系統允許用戶與數字內容進行更復雜的交互,因為各個手指可以通過多種方式與虛擬內容交互,如移動對象,縮放對象,按壓虛擬按鈕等等。
3. 對象追蹤
對象追蹤涉及兩個通常與之關聯的獨立功能:對象檢測和分類;追蹤對象移動的目標位置。利用機器學習或深度學習,我們可以使用多種方法來檢測對象。機器學習涉及利用已分類和標記的數千幅圖像來訓練系統,并通過所述數據識別新圖像中的未知對象。你可以訪問這個頁面進行嘗試,系統可識別你上傳或鏈接的任何圖像。
對于視頻或實時攝像頭饋送,一旦檢測到對象,你就可以以類似的方式逐幀操作,從而追蹤圍繞所述對象的邊界框。例如,在視頻中逐幀追蹤車輛。
4. 人像追蹤
取決于追蹤系統的最終目標,人像追蹤可以看作是對象追蹤(如確定商店中購物者的數量)或骨骼追蹤(支持人們與數字標牌交互)的子集。根據用例的不同,你可以采用手勢追蹤方法或骨骼追蹤方法,或通過對象追蹤方法來識別一幀中的人像。
點擊此處添加圖片說明文字
5. 眼動追蹤/注視點追蹤
眼動追蹤/注視點追蹤允許你僅使用眼睛來與數字系統進行交互。眼動追蹤系統涉及指向某人面部或靠近其眼睛的攝像頭(深度攝像頭或其他)。通過追蹤眼睛的運動(特別是瞳孔),系統可以測量用戶的視線方向。這在常規分析中非常有用:能夠確定用戶關注的內容元素可以提供有價值的用戶體驗見解。它在輔助功能解決方案中同樣非常有用,因為眼動追蹤可以減少或消除通過鼠標鍵盤來與屏幕進行交互的需求。例如,對于腕道癥候群患者而言,基于眼動追蹤的交互可能會感覺更舒適。Eyeware是支持英特爾實感D400系列深度攝像頭進行眼動追蹤/注視點追蹤的軟件。
6. SLAM追蹤
即時定位于地圖構建(SLAM)是一個不同于上面所述追蹤方案的概念。主要區別在于,SLAM設備能夠追蹤自身相對于世界的運動,它不是追蹤攝像頭視場內的對象的運動。諸如英特爾實感追蹤攝像頭T265這樣的SLAM設備結合了慣性傳感器和來自兩個攝像頭的視覺輸入,從而能夠精確追蹤自身在空間中的運動。這種技術在虛擬現實和增強現實頭顯中非常有用。微軟Hololens,以及Rift S和Oculus Quest都采用了自家的SLAM追蹤方法(有時稱為內向外追蹤)。SLAM追蹤對于機器人技術和無人機同樣十分有用,因為確定某物在的位置,以及它在空間中的移動方式可允許其精確地導航世界。
原文鏈接:https://yivian.com/news/67374.html
責任編輯: