美國卡內(nèi)基梅隆大學(xué)的研究人員利用神經(jīng)網(wǎng)絡(luò)技術(shù)開發(fā)了一種人工智能殺人機器人。不過,好在這種機器人只能用在游戲《毀滅戰(zhàn)士》(Doom)中。
你或許認(rèn)為,由于游戲中的死亡都是虛擬的,所以無關(guān)緊要。但是在電腦眼中,一切都是虛擬的。所以,即便是應(yīng)用到現(xiàn)實世界,人類在它們眼中也跟游戲角色沒有區(qū)別。
你或許有一個問題:這種人工智能殺人機器人與之前的游戲中內(nèi)置的電腦有何區(qū)別?畢竟,之前的游戲也可以與電腦對戰(zhàn)。

這些人工智能機器人都可以在游戲中自主運行,了解各種參數(shù)、坐標(biāo)、優(yōu)勢、地點、槍械型號和衛(wèi)生設(shè)備。但與之前的電腦角色相同的是,它們可以通過程序?qū)μ囟ㄓ螒騾?shù)做出特定反應(yīng)。
這款人工智能機器人由桂拉米·拉普爾(Guillaume Lample)和戴文德拉·辛格·錢普洛特(Devendra Singh Chaplot)開發(fā)。它玩游戲的方式與人類相同,它也會盯著屏幕,識別角色環(huán)境和方位,然后在地圖上尋找出路,射擊任何移動的物體。

事實上,之前已經(jīng)有一些類似的人工智能技術(shù),可以通過自學(xué)《Space Invaders》等簡單的游戲來找到獲得高分的辦法。但這個最新的人工智能機器人較之前的技術(shù)提升了一個等級。
整個的神經(jīng)網(wǎng)絡(luò)主要是通過像素數(shù)據(jù)接受訓(xùn)練,跟人類觀看屏幕的方式類似——但制作者也有一點作弊的行為:他們幫助機器人通過游戲引擎獲得基本的洞察力,了解屏幕上是否有敵人或其他物品。
這套人工智能系統(tǒng)的強化策略如下:如果能夠撿起東西,迅速移動,并殺死對方,便可獲得褒獎;如果受傷或死亡,則會受到懲罰。這套系統(tǒng)最終的表現(xiàn)好于游戲內(nèi)置的電腦和人類選手。

整套系統(tǒng)分成兩部分,一部分是導(dǎo)航系統(tǒng),可以負(fù)責(zé)四處移動,收集東西,并學(xué)會如何解讀環(huán)境圖像。另外一部分則是設(shè)計系統(tǒng),可以了解何時有敵人出現(xiàn)在屏幕上,瞄準(zhǔn)合適的目標(biāo)后扣動扳機。