2016年,人工智能技術被推上了研究和商業(yè)的風口浪尖,
從“深藍” 到Master,從駕駛輔助到自動駕駛,從Alexa到Google
Home,從大學教授到企業(yè)領袖,人工智能技術在互聯(lián)網(wǎng)行業(yè)遍地開花,同時也對人們心目中的傳統(tǒng)行業(yè)--制造業(yè)帶來了巨大的沖擊與商機。
從“深藍”到Master
繼IBM“深藍”在國際象棋對決中戰(zhàn)勝世界冠軍卡斯帕羅夫,Waston在危機邊緣戰(zhàn)勝人類冠軍Ken和Brad,Eugene挑戰(zhàn)圖靈的“TheImitation
Game”后,人工智能在一個更加復雜的領域—圍棋中再次超過了人類的最高水平,AlphaGo以4:1的比分戰(zhàn)勝了韓國圍棋大師李世乭,其升級版Master更是在弈城網(wǎng)上取得60:0:1的不敗戰(zhàn)績。同樣是在對弈比賽中戰(zhàn)勝頂尖人類選手,“深藍”到Master的發(fā)展充分體現(xiàn)出了人類科技進步在計算方法和計算資源上的長足進步。如果說“深藍”是憑借其運算速度通過遍歷戰(zhàn)勝了人類,那么Master是在此基礎上通過優(yōu)化的搜尋算法,決策支持和計算架構遍歷了當時覺得不可能實現(xiàn)的所有可能。Master所用到的Deep
Reinforcement Learning結合了當今AI領域研究的兩大前沿技術Deep Learning(DL)和Reinforcement
Learning(RL),創(chuàng)造性的使用DL的方式,通過棋局的圖片評估落子的優(yōu)先級,再結合RL,通過自我“對弈”的方式更新深度神經元網(wǎng)絡的參數(shù),最終帶領人類真正意義上站在了“智能”的門口。AlphaGo最重要的成就并不是采用了性能多么優(yōu)秀的電腦,而是第一次讓程序可以近似人類的方式去感知、學習、思考和決策。
無論是Master這樣已經存在的,還是在《西部世界》中的BICAMERAL
MIND,人工智能已經大跨步的走進了我們的生活。目前來看,人類所有的外部感知能力例如溫度,加速度等都早已可使用現(xiàn)有的傳感器技術實現(xiàn),基于機器學習,統(tǒng)計學習的方法更是幫助機器在聽(語音助手),看(computer
vision),讀(NLP),寫(handwriting
recognition),思考(Optimization)等多方面超越人類平均水平。有人預測奇點理論正在以很快的速度成為現(xiàn)實。我們不去探討人工智能的技術本質或是它的倫理問題,如果人工智能真的被規(guī)?;貞茫敲茨軌驅θ祟惿鐣硎裁礃拥母淖兒蛢r值?
走出“楚門的世界”
在與Master交手前,棋手柯潔在自己的微博上如是說,可謂一語道出了智能化的真諦。如果智能化僅僅停留在遍歷搜索,相似度分析的層面,那對人類的進步又有何意義。作者看來,人工智能和大數(shù)據(jù)分析最重要的核心就是要能夠為人類提供全新的認識問題和解決問題的方式,用機器純理性的“思維”方式去輔助人類的思維與決策。
決定人類社會進步速度的最本質的制約要素是“認知的邊界”,所謂知識的邊界則是基于前人的經驗與規(guī)則所構建的無形的域。
就像《楚門的世界》當中,劇組為楚門所構建的整個生態(tài),無形的禁錮了他認識問題,解決問題的能力。而當人的認知和判斷無法滿足不斷增長的數(shù)據(jù)維度和問題復雜度時,依靠人的知識和經驗去驅動和創(chuàng)造的過程就會有邊界。以圖像識別為例,基于人類經驗的數(shù)據(jù)分析方法,首先使用濾波器對原始圖像經行降噪,在使用濾波器經行圖像邊界識別,最終使用模式識別的方法分辨圖像中不同的物體。這樣的方式,其核心在于濾波器的選擇,濾波器的參數(shù)配置以及分類器的選擇都需要經驗支持,不同的組合形式其最終模型輸出的結果差距明顯。如今使用的基于深度學習的CNN方法,將濾波器的類型及參數(shù)選擇基于依賴于最終分類器輸出結果的表現(xiàn),使用反向傳播算法,不斷優(yōu)化模型結構與參數(shù)。這樣的方法,基于大量原始數(shù)據(jù),從數(shù)據(jù)中發(fā)現(xiàn)規(guī)律,提取有效特征,最終實現(xiàn)更加準確地決策支持。
除了深度神經元網(wǎng)絡研究,機器學習和人工智能領域的研究包括遷移學習,無監(jiān)督或半監(jiān)督學習,特征工程,增強學習,對抗網(wǎng)絡等的不斷創(chuàng)新,為人工智能在更多領域的應用和價值創(chuàng)造提供了有力的理論支撐。遷移學習,無監(jiān)督或半監(jiān)督學習的研究實現(xiàn)了將統(tǒng)一的模型或模塊的推廣和啟發(fā)式應用,類似于人類知識積累到一定程度之后觸類旁通。特征工程的研究,提供了在海量數(shù)據(jù)當中依照業(yè)務需求或者既定規(guī)則抽取或者重構有效信息的方法,為認識和研究高維度下的數(shù)據(jù)科學問題提供了有效地工具。增強學習,對抗網(wǎng)絡等研究領域的不斷創(chuàng)新為在數(shù)據(jù)樣本不足,數(shù)據(jù)不完善前提下的智能化問題提供了全新的思路。
從“人工智能”到“工業(yè)智能”
從計算機,互聯(lián)網(wǎng)行業(yè)出身的智能化技術,正在以勢不可當?shù)膭蓊^橫掃全球各個領域。智能化與工業(yè)的結合更是引得全球矚目。從德國的工業(yè)4.0到美國的工業(yè)互聯(lián)網(wǎng),從GE的Predix到IBM的PMQ,可以看出,工業(yè)與智能化技術的結合也必將是下一個風口。
智能的核心在于決策和執(zhí)行,而決策的核心在于感知和判斷。在工業(yè)系統(tǒng)中,IoT技術,
包括傳感器技術,數(shù)據(jù)傳輸,數(shù)據(jù)管理等不斷發(fā)展,為智能化技術實施提供了可靠的感知基礎。但是目前的工業(yè)界大都以人的決策和反饋為核心,這就導致系統(tǒng)中有很大一部分的價值并沒有被釋放出來。系統(tǒng)越是復雜,人的學習曲線就會越緩慢,而當人的學習曲線比技術的進步速度慢時,人就會成為制約技術進步和應用的瓶頸。而人工智能為工業(yè)帶來的第一個革命性的改變,就是擺脫人類認知和知識邊界的限制,為決策支持和協(xié)同優(yōu)化提供可量化依據(jù)。
現(xiàn)階段,工業(yè)智能的應用尚處于探索階段,結合工業(yè)領域的特性,在實施階段需要著重考慮以下幾點:
一.問題的定義
在應用人工智能方法解決工業(yè)問題時,首先要確定需要解決的問題,一定要避免“拿著錘子找釘子”的情況,不能為了使用算法而徒增問題的復雜度。首先需要將實際問題抽象成可用建模方法解決的問題,需要人員的經驗輔助。微軟亞洲研究院鄭宇博士也強調“培養(yǎng)一個真正的數(shù)據(jù)科學家需要七到十年時間”。這里的時間其實是對個人基本功以及實戰(zhàn)經驗的非強制指標。
二. 問題的邊界
工業(yè)問題與圍棋問題不同,其解決問題的邊界定義不明確,沒有明確的規(guī)則。這樣就為解決方案的設計帶來了很大的不確定性。一切模型可以解決的問題都是在前提條件所包含的問題域內,沒有一個方案是可以涵蓋所有的情況,所以在制定工業(yè)智能方案時一定要緊密結合業(yè)務來定義問題邊界,最終確定解決方案。
工業(yè)智能,在智能化算法和技術層面也擁有自身的特點和挑戰(zhàn):
一. 機理模型是關鍵基礎
工業(yè)智能所要解決的問題大都是針對特定設備的特定問題,其數(shù)據(jù)表征應該符合設備運行的機理。在大量雜亂的數(shù)據(jù)當中,依照設備運行機理可以幫助選擇、構建出更加有用的變量,為決策支持提供有效依據(jù)。特征工程,非監(jiān)督式學習很大一部分研究工作就是針對如何從海量數(shù)據(jù)提取有效特征。基于機理的特征提取方法在傳統(tǒng)的故障診斷上應用廣泛,例如軸承故障診斷中所用到的失效頻率。在大數(shù)據(jù)分析,人工智能沖擊傳統(tǒng)行業(yè)的同時,傳統(tǒng)行業(yè)的分析方法也在人工智能領域得到應用,在2017年的AAAI榮獲outstandingpaper
award的文章“Label-Free Supervision of NeuralNetworks with Physics and
Domain Knowledge”就是將機理模型加入神經元網(wǎng)絡的訓練當中得到優(yōu)化的網(wǎng)絡模型。
二. 數(shù)據(jù)的標準和技術仍有待發(fā)展
在工業(yè)領域,數(shù)據(jù)資源是發(fā)展智能化的一大障礙。眾所周知,在圖像識別領域有ImageNet,手寫識別有MNIST,UCI的機器學習數(shù)據(jù)庫也提供了大量標準,有標注的訓練數(shù)據(jù)組。在工業(yè)領域,數(shù)據(jù)獲取需要投入較大資金和時間,同時數(shù)據(jù)的標注需要專家知識協(xié)助,更增加了獲取大量標準數(shù)據(jù)組的難度。除此之外,受限于傳感器技術,設備使用狀態(tài)等,經常會出現(xiàn)關鍵數(shù)據(jù)無法獲取的情況。上述條件就導致在模型開發(fā)時,經常會遇到樣本量小,不平衡數(shù)據(jù)組,數(shù)據(jù)質量差,數(shù)據(jù)不完整,缺少失效狀態(tài)數(shù)據(jù)等問題。所以,IoT、遷移學習、增強學習、半監(jiān)督式學習的研究對于工業(yè)智能技術的發(fā)展至關重要。
三. 一體化解決方案 - 從“產品”到“能力”的全方位交付
在解決方案的設計上,工業(yè)智能是多層次,高準確度的解決方案,有時還需要實時計算與回饋。這樣的特點就要求所訓練和部署的模型計算速度快,結果準確,不確定性小。因此,需要有能夠靈活重構的工業(yè)數(shù)據(jù)應用模塊,以快速開發(fā)解決工業(yè)系統(tǒng)中碎片化問題的應用。同時可以看出,工業(yè)智能的解決方案不是僅僅依賴于智能算法,整個鏈條上的每一環(huán)節(jié)的共同進步才可以保證技術的進步。那么,可以通過可視化的編程環(huán)境降低數(shù)據(jù)分析和應用開發(fā)的門檻,以及通過培訓,是企業(yè)的工程師可以根據(jù)自己的經驗和需求開發(fā)個性化的預測和分析應用,來保證持續(xù)地解決企業(yè)在發(fā)展過程中遇到的問題。
中國特色工業(yè)智能之路
我國工業(yè)智能化起步較晚,工業(yè)基礎相對落后,但是我們是設備使用大國,設備保有量和設備使用數(shù)據(jù)保有量都是當之無愧的世界第一。結合設備、業(yè)務場景和智能算法,依靠成熟的CPS理論框架,相信我國一定會在工業(yè)智能引領世界發(fā)展。