媒體來源: 與非網
2016年,Google旗下DeepMind公司開發的AlphaGo 戰勝圍棋世界冠軍李世石, 一“棋” 激起千層浪,成為了人工智能時代到來的分水嶺。機器戰勝人類背后的主要工作原理是機器深度學習:模仿人腦神經網絡特征,對樣本數據內在的規律進行訓練,進而推理。讓機器模仿人腦的機制來解釋數據(圖像、聲音、文字等),是實現人工智能的必經之路。
支撐AlphaGo深度學習的硬件是Google開天辟地的推出了TPU (Tensor Processing Unit張量處理單元)系列人工智能芯片,這是為神經網絡加速的專用芯片。它的橫空出世,打破了GPU (Graphics Processing Unit圖像處理單元) 曾一度稱霸神經網絡訓練和推理的市場局面,也將人工智能芯片產業市場規模推向了火山爆發式的高度。
數十億的端側設備的智能化需求催生了端側AI芯片的廣闊市場。Edge TPU 是Google 推出的TPU端側芯片,可以在客戶的應用本地運行人工智能算法,從而大大節省延時和功耗。端側AI芯片是智能設備的核心組件,也是人工智能時代的重要的基礎設施。
在這一廣闊市場中,對于系統廠商而言,計算和部署效率 —— 從每元錢每度電能獲得的芯片性能,部署實施的成本,元器件是否穩定可靠 —— 成為了對功耗和成本有要求的應用和系統廠商評估AI芯片的標準。
換句話說,如果A芯片1T算力能跑出B芯片2T算力的性能,功耗和成本又比B芯片低,A芯片理所當然的會更加受到市場的青睞。另外,相對于協處理器芯片,SoC(片上系統)主芯片更受青睞。芯片的CPU,ISP,編解碼能力,接口豐富度等方面是系統廠商選擇核心芯片的重要考量因素。協處理器需要外掛一顆主處理器來運行,而SoC主芯片可以一顆芯片獨立完成任務,綜合來看性能、成本、功耗角度更具優勢。

肇觀電子 N161 SoC芯片
將AI芯片新貴肇觀電子的N161芯片的開發板和最近比較受歡迎的Google Edge TPU在一起做對比評測,肇觀電子的N161芯片,在保證FP16的精度下,跑用于圖片分類的InceptionV4網絡模型算法,1T算力跑14.41幀/秒,而Google Edge TPU 用4T算力跑9幀/秒。在保證INT8的精度下,兩顆芯片跑用于圖片分類的ResNet-50算法,N161芯片1T算力跑46幀/秒,Google Edge TPU 4T算力跑17.86幀/秒;跑用于圖片檢測的MobileNetV1_SSD網絡模型算法,N161芯片1T算力跑103.63幀/秒,而Google Edge TPU 4T算力跑90.91幀/秒。

圖 | 針對3種算法,N161以1T模式算力對比Google Edge TPU 4T算力,每秒可計算的圖片數量
如果看單位算力下兩顆芯片的比較,呈現出的是更加令人印象深刻的性能對比:

圖 | 針對5種算法,N161以每TOPS算力對比Google Edge TPU 每TOPS算力,每秒可計算的圖片數量
Google Edge TPU和肇觀電子N161都是世界領先的AI芯片;兩個芯片的開發板上手都很快,工具鏈都很好用;在AI性能和效率上肇觀電子N161具有明顯優勢。Edge TPU是協處理器,要搭配電腦共同運行,而N161是SoC主芯片獨立工作,無需電腦即可運行,部署方便,適應性更廣。
AI芯片的計算效率,取決于芯片對于AI相關的數據和算法的處理效率,其基礎是對AI運算過程中涉及到的軟硬件做精細的數學建模、制定邊界條件確定下的最優且可擴展的軟硬件整體架構、優化的芯片設計及實現。做出業界領先的AI芯片,其既需要深厚的數學理論功底,又需要豐富的芯片設計經驗,還需要對下游系統和應用的深刻理解,總體來看門檻很高。
在全球,人工智能正在逐漸改變各行各業。AI芯片作為人工智能的基礎設施,其重要性不言而喻。人工智能在端側的應用最為廣泛,端側AI芯片有著巨大的市場。每個應用和系統廠商都在尋找在性能、功耗、成本等方面的綜合因素下合用的AI芯片。端側AI芯片領域具有典型的市場為新涌現、高增長且市場廣闊、高技術門檻等特征。歷史上,每次科技變革所帶來的新的需求催生了新的市場,涌現了新的公司;新興公司往往更能適應新的市場而逐漸勝出,引領科技的前進。