主題|電腦視覺

20180124 cv

【大家都在做的電腦視覺,你不能不知道】

人工智慧時代賦與了人機互動(Human-Computer Interaction, HCI)新方式:

行動裝置的普及與功能日新月異,使得各種變臉app、自動修圖、濾鏡等影像處理功能成為生活中不可或缺的一部份。

發展許久的無人駕駛汽車技術、門牌辨識、或是醫學影像辨識,也都是透過電腦視覺(Computer Vision)與影像處理(Image Processing)來使得生活品質提高。

 

近期由於硬體設備的運算能力大幅提升,更是可以透過機器學習使電腦自我學習,這是巧合嗎?小編可不這麼認為。

深度學習(Deep Learning)領域中,最為熱門用於電腦視覺辨識的神經網路結構便是卷積神經網路(Convolution Neuron Network, CNN)。

 

以CNN對物件進行分類辨識來說,大致上做的事是將一張張的圖片切割成許多局部特徵(Feature),透過卷積的篩選機制,也就是以kernel針對剛剛提到的局部特徵進行比對,再對抓取出的特徵做池化(Pooling),使得抓取特徵本身更有效率,以免導致GPU軍備戰爭(誤)。每一層的最後以活化函數(Activation Function),如ReLU、tanh等函數對抓取結果進行非線性調整。層層堆疊的結果進入了全連接層(Fully Connected Layer),最後輸出辨識結果的機率值。

 

雖說CNN演算法乍看之下步驟很繁雜,和一般傳統演算法大相逕庭,但機器學習(Machine Learning)的最初起點就是模仿人類大腦的認知方式,我們不告訴電腦具體的演算法,而是「教」電腦辨識影像的特徵。

時至今日,電腦已經可透過圖片來自動抓取各種物件特徵,我們教會了電腦辨識來往的車子、人類的臉孔等複雜的圖像。

下一步,電腦還會學會些什麼呢?

 

天瓏提供最完整的學習資源,包含各類影像處理及應用叢書,也有多本介紹電腦視覺與影像處理領域中最強大的開源函式庫 OpenCV(Open Source Computer Vision Library)及開放圖示庫 OpenGL(Open Graphics library)的使用與實作規範。歡迎想進修的各位讀者們來選購!

活動書籍