“無論結(jié)果如何,勝利(受益)的一方都是人類。”
8月6日的舊金山,一支由人類組成的《Dota 2》隊伍以1:2輸給了5名人工智能組成的機(jī)器人戰(zhàn)隊。
第一局比賽中,人類戰(zhàn)隊到最后也沒能摧毀AI方的任何一座塔,在經(jīng)濟(jì)和擊殺數(shù)雙雙落后的情況下失敗。第二局人類方開局取得了一些優(yōu)勢,拿下了一血,在經(jīng)濟(jì)上稍稍領(lǐng)先了AI,但在20分鐘左右,AI迅速組織集結(jié)和轉(zhuǎn)移,借人類方對此準(zhǔn)備不足的機(jī)會,摧毀了人類方的幾座堡壘,很快又取得了勝利。
至于人類獲勝的第三局,現(xiàn)場觀眾為AI們指定了5位比較脆弱的英雄,人類方則拿到了堪稱完美的陣容。選擇完陣容之后,系統(tǒng)給出的AI勝率只有不到3%,人類也沒有辜負(fù)如此優(yōu)勢的局面,在40分鐘時攻破了AI的基地,取得這場人機(jī)大戰(zhàn)中唯一的勝利。
如果說這場對戰(zhàn)中人類有什么值得慶幸的,那就是這支《Dota 2》戰(zhàn)隊并非頂尖職業(yè)隊伍,一半以上成員是已經(jīng)退役的前職業(yè)選手,還有一名游戲解說,他們經(jīng)驗豐富,但之前沒有在一起進(jìn)行過團(tuán)隊訓(xùn)練,配合的默契度肯定無法保證。
這套擊敗了他們的AI軟件全名是“OpenAI Five”,由非營利組織OpenAI研發(fā)。OpenAI成立于2015年末,一直專注于前沿的機(jī)器學(xué)習(xí),所有研究成果都在網(wǎng)上公布供所有人使用。他們研發(fā)的Dota AI一年前已經(jīng)在公眾面前亮相,它在1v1的《Dota 2》對戰(zhàn)中擊敗了職業(yè)選手Dendi,那時它尚且不會團(tuán)隊作戰(zhàn)。到了今年6月,學(xué)會5v5的OpenAI Five在《Dota 2》的天梯上游覽了一圈,和業(yè)余玩家們互有勝負(fù)。
現(xiàn)在,這個進(jìn)步飛速的AI的下一個目標(biāo),是Dota界最權(quán)威的賽事TI錦標(biāo)賽,在那里,它們將和這個世界上真正的最強(qiáng)Dota玩家競爭。
這當(dāng)然不是AI第一次在游戲領(lǐng)域擊敗人類。兩年前的3月,Google DeepMind開發(fā)的圍棋軟件AlphaGo擊敗了韓國棋手李世石,成為近年來AI戰(zhàn)勝人類的最著名案例。追溯到更早以前,1997年,人工智能深藍(lán)擊敗了國際象棋世界冠軍卡斯帕羅夫。只是到了最近,我們已經(jīng)越來越習(xí)慣這類事件的發(fā)生??萍嫉倪M(jìn)步總是這樣,在人們徹底習(xí)慣以前,人工智能和人類的每次對決都能引發(fā)話題。
這次也一樣,網(wǎng)絡(luò)輿論中會有一些情緒化的表達(dá),諸如“血虐”“吊打”一類的詞語在新聞標(biāo)題中頻頻出現(xiàn)。在關(guān)于AI與人的討論中,總有很多報道喜歡詳細(xì)描寫人類在進(jìn)步迅速的AI面前是如何慘敗、如何不堪一擊的。
事情當(dāng)然沒有那么夸張,AI目前的能力仍然有很大的不足。簡單來講,現(xiàn)在的諸多AI仍然沒有脫出我們所熟知的那個套路:“對人類很難的事對AI非常簡單——比如瞬間判斷和反應(yīng),有些對人類簡單至極的事對AI卻非常困難——比如理解合作和長遠(yuǎn)的收益”。
此次《Dota 2》的人機(jī)比賽之中,OpenAI調(diào)用了Valve官方的bot接口,而非直接從屏幕上讀取像素信息。這樣AI們立刻就能獲得人類玩家需要仔細(xì)觀察理解才能得到的信息——對手的血量、位置和隊友的狀態(tài)等等。OpenAI承認(rèn),他們還做不到真正讓AI像人一樣玩游戲,因為“那將需要數(shù)不勝數(shù)的GPU同時運(yùn)作”。
比賽中AI們只能從18個英雄中選擇5個參賽,而《Dota 2》實際上一共有100多個英雄。不僅如此,比賽還加入了諸多限制,不能使用圣劍、掃描,每個英雄都有5個無敵的信使,等等。這讓人機(jī)大戰(zhàn)和真實的《Dota 2》對戰(zhàn)大相徑庭。
2016年底,暴雪宣布與開發(fā)出AlphaGo的DeepMind合作,讓AI在《星際爭霸2》的游戲環(huán)境里進(jìn)行特訓(xùn),協(xié)助人工智能研究發(fā)展,結(jié)果并不那么令人滿意。DeepMind承認(rèn),“目前的深度學(xué)習(xí)AI還存在巨大的瓶頸”,他們說,現(xiàn)在AI的《星際爭霸2》水平很差,連游戲自帶的簡單電腦都打不過,學(xué)過最高明的技巧只是讓人族的建筑飛到空中逃跑,還只是碰巧試出來的。
事實證明,這些利用深度學(xué)習(xí)的游戲AI確實還有很長的路要走。在韓國舉辦的一場人機(jī)對抗《星際爭霸》表演賽中,由AI競賽的前三名AI分別迎戰(zhàn)普通學(xué)生玩家和頂級職業(yè)選手宋炳具。AI方先以5:1的好成績擊敗了兩名普通玩家,但輪到宋炳具上場后,AI就表現(xiàn)得有些力不從心。宋炳具連勝3場,由于他獲勝太快,活動的時間還剩不少,主辦方安排了臨時的加賽,讓Facebook研發(fā)的AI CherryPi也登場參加比賽,結(jié)果仍敗在這位頂尖“星際”玩家的手下。
在AI問題上,游戲公司們看得更加長遠(yuǎn)和開放。今年3月,EA已經(jīng)在自己的游戲《戰(zhàn)地》中開始訓(xùn)練AI,它們很快就學(xué)會了在生命值較低和沒有彈藥時采用不同的模式行動,不過在單人行動時它們表現(xiàn)得還是很蠢,比如會莫名其妙地開始原地轉(zhuǎn)圈……
負(fù)責(zé)這項訓(xùn)練的人工智能實驗室表示,他們的目標(biāo)不是為了創(chuàng)造出能擊敗人類的AI,而是創(chuàng)造能給玩家?guī)砀嗫鞓敷w驗的AI,為了達(dá)成這一目的,AI太過“厲害”顯得沒什么必要。
育碧也已經(jīng)在2017年和一位名叫Daniel Holden的程序員合作。他們想改變以往游戲角色動畫全是由預(yù)先捕捉動作制作的方法,希望直接利用AI將用戶的操作映射到游戲角色身上,這樣AI會自動根據(jù)玩家操作生成游戲動畫,需要儲存的數(shù)據(jù)大大減少。
不僅是歐美廠商,日本大廠Konami在《實況足球2017》里也引入了人工智能系統(tǒng)“TeamVision”,這個系統(tǒng)會使玩家操作的球隊學(xué)習(xí)玩家的踢球風(fēng)格與擅長的玩法,從而做出隊員的優(yōu)化,讓玩家能感受到球隊在與你一同成長進(jìn)步。對手的球隊也會利用AI適應(yīng)、學(xué)習(xí)玩家的戰(zhàn)術(shù),從而改變自己的策略,讓比賽更富有挑戰(zhàn)性。Konami的解釋是,這套系統(tǒng)的目的在于激勵玩家采用新的戰(zhàn)略和思路,游戲難度仍然是按照玩家事先選擇的水平,AI只是保證比賽“更加真實”。
從另一個角度上說,就算AI的游戲水平確實比人類玩家高了,似乎也沒什么值得害怕的。深藍(lán)出現(xiàn)之后,整個國際象棋界確實受到了影響,觀眾們看棋、高手們訓(xùn)練都非常依賴于AI的各種提示,但是國際象棋沒有就此消失,反而發(fā)展良好,整個業(yè)界的整體規(guī)模和水平都得到了長足的進(jìn)步。與1995年相比,國際棋聯(lián)的活躍棋手已經(jīng)從1億人增長到了6億人,會員國從120個提高到了188個,擁有1萬個正式比賽和10萬個非正式比賽。
AlphaGo擊敗圍棋界的高手們之后,不同于大眾的憂心忡忡和輿論的悲觀論調(diào),棋手們卻普遍有一種欣喜的感覺,棋手高飛龍這么說:“我們可以將之化為工具來研究圍棋。人機(jī)對弈的必要性可能超出大家的想象,利用AlphaGo進(jìn)行拆棋,是不能錯過的光明的未來?!北籄I擊敗的世界級棋手李世石、柯潔都在多個場合表示,AI讓他們看到了棋道上的新思路。圍棋界因為這些新聞獲得了前所未有的關(guān)注度,這項古老的棋類游戲借此勢頭,可能因而獲得更多新鮮血液。
在這次的《Dota 2》人機(jī)大戰(zhàn)中,國外解說們多次提到,人類選手可以從AI身上學(xué)到很多之前沒人想過的技巧,比如快速集合轉(zhuǎn)移的價值和對補(bǔ)給品的使用。
不管AI們現(xiàn)在水平如何,從長遠(yuǎn)來看,很可能的情形是AI越來越強(qiáng),總有一天會比所有人類玩家都要強(qiáng)。這件事早晚會發(fā)生,畢竟在人類歷史上,機(jī)器打敗人這種事已經(jīng)發(fā)生過很多次了。
中國年輕的圍棋高手柯潔在被AlphaGo擊敗幾個月后曾經(jīng)說:“作為棋手,下棋對我來講是一件挑戰(zhàn)自我的事情。我希望跟強(qiáng)大的對手去比賽,不管對手是AI,還是人類棋手,都是很令人激動的。我希望去跟他們進(jìn)行比賽,這是有意義的,是我人生中寶貴的經(jīng)歷。之前我在烏鎮(zhèn)跟AlphaGo下完之后說我再也不會跟人工智能下棋了,但是我現(xiàn)在食言了。因為我覺得一個棋手是應(yīng)該弈無止境的,是需要去挑戰(zhàn)其他對手的?!?/p>
既然國際象棋沒有因為“深藍(lán)”而消失,圍棋界也沒有因為AlphaGo而毀滅,在電子游戲領(lǐng)域,AI擊敗人類本身也承載不了太多的情緒。人類的游戲、比賽本身就是有意義的,它們有趣、令人激動,是所有玩家寶貴的體驗。就像我們沒有把法拉利賽車?yán)?00米短跑賽道上讓它和人類比賽一樣,AI們被設(shè)計出來的目的也不是進(jìn)入游戲和人類玩家一較高低,它們理應(yīng)讓玩家更加快樂地享受游戲。
AI在游戲上打敗人類,這更不值得恐懼或者悲哀,畢竟AI們也是由人類開發(fā)出來的,它們自己就是人類智慧的結(jié)晶,存在的目的也是為人類服務(wù)。AI們在游戲上戰(zhàn)勝人類,只代表人類在不斷超越過去的自己,在這條道路上,人類又踏上了新的臺階,還代表著玩家們以后可以享受更加智能的AI服務(wù)。
不管怎樣,正如OpenAI聯(lián)合創(chuàng)始人Greg Brockman所說,“無論結(jié)果如何,勝利(受益)的一方都是人類?!?/p>