257

 

 

科技與生活






人工智慧應用於停車場管理系統
文/普泉精舍護法會副會長、淡江大學資訊工程學系教授 洪文斌(傳承)


一、序言

  人工智慧(Artificial Intelligence,簡稱AI)已悄悄地融入到我們的日常生活當中。在這一波AI的浪潮中,其技術以機器學習(Machine Learning)為主,透過大量的資料或是圖片,自動歸納出其內在隱含的知識,進而達到學習的目的。其中又以深度學習(Deep Learning)最具代表性。

  深度學習是屬於類神經網路(Artificial Neural Networks)的研究領域,起源於1943年模擬生物神經細胞而建構的數學模型,歷經數十寒暑的起伏與發展,至今呈現波瀾壯闊之勢,深深地影響著我們未來的生活。在深度學習當中,除了傳統的深度神經網路(Deep Neural Networks,簡稱DNN)之外,尚有兩個主要的架構,一個是卷積神經網路(Convolutional Neural Networks,簡稱CNN),另一個是遞歸神經網路(Recurrent Neural Networks,簡稱RNN),分別在電腦視覺以及語音辨識和自然語言處理方面獲得相當優異的表現。

  CNN的神經網路架構主要是設計來模擬人類的視覺功能,對於物體的辨識,取得了極為突出的成就。在全世界非常有名的ImageNet電腦視覺競賽中,主辦方提供了120萬張影像當成訓練資料,這些圖片分別屬於1000個類別,平均一個類別含有1200張影像。而這些大量的圖片主要是用來在訓練階段時,能夠嘗試從圖片中自行學習歸納出分類的規則,建構預測的模型。另外有10萬張新的影像,用來測試已經訓練好的預測模型的效能。在2015年的競賽中,以CNN為主的ResNet技術,其辨識錯誤率降低至3.57%,首次低於人類平均5.1%的錯誤率,讓CNN進入了實用的階段,也引發了大量的研究與應用,例如:人臉辨識、工業檢測、醫療影像等。本文嘗試介紹深度學習的CNN辨識技術如何融入到大家所熟悉的停車場管理系統的核心技術──車牌辨識。

二、電腦視覺

  電腦視覺有四個主要功能,其說明如下,而這些功能目前幾乎都是基於CNN的技術。

  (1)物件分類(Object Classification):即辨識影像中的物件,又稱為影像辨識(Image Recognition)。例如圖一(a)的影像中,內含三角形、正方形、圓形等三種物件。

  (2)物件偵測(Object Detection):或稱為物件定位(Object Localization),將所辨識出的物件用矩形外框將其框起來。例如圖一(b)中,用紅色矩形框出三角形,洋紅色矩形框出圓形,藍色矩形框出三個正方形。

圖一:電腦視覺功能

  (3)語意分割(Semantic Segmen-tation):進一步用不同顏色表示不同的物體類別,可以很清楚看到其形狀。例如圖一(c)中,用紅色區塊表示三角形,洋紅色區塊表示圓形,藍色區塊表示正方形。在此例中,背景特別用黃色表示。

  (4)實例分割(Instance Seg-mentation):若影像中包含多個相同類別的物件,用不同顏色表示不同的物體。例如圖一(d)中,正方形有三個,分別用不同深淺的藍色表示。注意:雖然後面淺藍色正方形被前面正方形部分擋住(圓形也一樣被前面的正方形部分擋住),然而這個技術依然可以正確清晰地標示出物體的形狀與前後遮蔽的關係。

三、車牌辨識

  傳統的車牌辨識,主要由人工來選取物件的特徵,例如:顏色、形狀、邊緣、紋理等,然後進行後續的辨識。一般而言,車牌辨識包含有車牌定位和字元分割(如圖二紅色方框所示),然後再逐一進行字元辨識等步驟(因個資故,以車牌前三碼為例說明)。然因光照不均、日夜陰雨、髒污傾斜、背景干擾、特徵選取等問題,造成車牌辨識結果不甚理想。

圖二:傳統車牌辨識流程

  近年來,深度學習的CNN在電腦視覺中扮演著舉足輕重的角色,帶來了革命性的影響,獲得了極好的改進。其主要是因為透過大量資料的學習,電腦可以依據所提供的資料,自行找到最佳的特徵(而非人工所選取的特徵)來進行辨識,故而得到較好的結果。以下介紹利用深度學習的CNN來進行車牌辨識的一種簡明易懂的流程。因為CNN是屬於監督式學習,需要人工教導它要辨識什麼物體。在此車牌辨識的範例中,我們需要CNN學習找出車輛與車牌所在的位置,還要辨識車牌號碼的每個字元。因此需要蒐集大量各種情況的車牌影像,利用人工來標註車輛與車牌位置,乃至車牌字元等,以教導CNN如何定位與辨識。因此,這個階段需要花費較多的人力與時間。之後,利用CNN來訓練、學習車輛與車牌定位,此屬物件偵測。最後利用語意分割或實例分割來訓練、學習車牌字元辨識。當CNN神經網路已訓練好之後,後續車牌辨識的流程如圖三所示:

圖三:深度學習車牌辨識流程

  (1)車輛定位:為避免背景環境中也有文字的特徵,先偵測影像中的車輛。

  (2)車牌定位:在所找到車輛的方框內,繼續尋找車牌所在位置。

  (3)車牌分割與實例分割:將所找到的車牌,進行語意分割和實例分割,用不同顏色代表不同的英文字母與阿拉伯數字。在此例中,紅色區塊表示英文字母A,橙色為K,其他不同顏色代表不同的阿拉伯數字,中間的橫槓(—)以黃色表示,車牌其餘位置為白色。如此便可方便進行車牌字元辨識。一般而言,若訓練時的資料量夠大,涵蓋可能的各種情形,幾乎都可達到將近完美的辨識率。

四、實際應用

  由於車牌辨識系統的辨識率極佳,在封閉的區域內,可以達到保安的效果,目前已大量應用於校園門口、賣場的停車場、各大樓的停車場和收費停車場等。還可以將高速公路視為動態的巨型停車場,在出入的閘道口上架設攝影機,再利用車牌辨識來計算旅程為計費的依據。此外,若在辦公大樓地下停車場,也可以透過適當的電子指示標識,引導外賓停車。另外,警察也可以用馬路上的監視攝影機,利用車牌辨識來查緝贓車、協尋遺失車輛等,以提升社會治安。

  由於車牌辨識可以搭配進出時間與停留時間,因此可以搭配AI的另一項技術——大數據,進一步進行數據的統計分析,除取得統計的日報、週報、月報之外,也可以預測尖峰與離峰時間,乃至個別車輛的停車行為。此外,可以隨時得知停車場內的動態,作適當的調配。在都會區中,一位難求的情況下,若將多個停車場加以連線,使用者可以上網查詢附近何處還有空位,可帶來更便利的停車服務。

五、結語

  科技的創新,其目的是提供方便性與安全性,以提升人類的生活。神經網路經過近八十年漫長的演進,達到目前深度學習的階段,CNN技術可以媲美人類的視覺系統,若善加利用,可以造福人群,例如本文所談的車牌辨識技術,就是一例。相信未來一定會有更多的AI應用,普及於世,造福人類,讓我們拭目以待,擁抱未來AI科技所帶來的便利。



單元首頁