會自學的最強阿爾法狗誕生突破人類思維束縛

2017/10/19

　　美國谷歌旗下的英國子公司沉思科技（DeepMind Technologies）日前開發出了新版本圍棋用人工智慧（AI）「AlphaGo Zero」。此前的AlphaGo在擊敗全球頂級棋手時通過學習約3千萬專業棋手的對弈數據使自身變得強大。但AlphaGo Zero無需人類作出示範，也能反覆與自己對弈，借助自學創造出勝率最高的下法。

　　以前的AlphaGo對人類就已經具有壓倒性優勢，棋力達到史上最強。這種實力有助於將來在産業方面得到應用，例如通過大量數據自動找到調整電力供需的時機等。

　　英國科學雜誌《自然》雜誌10月19日發表了相關文章。谷歌僅向AlphaGo Zero 教授了圍棋規則。AlphaGo Zero 將現有的2種學習方法結合起來，分別通過2種方法思考下一手，還能對彼此思考出的結果進行參照。

柯潔與AlphaGo對弈（KYODO）

　　AlphaGo Zero最初是隨機落子，但通過反覆與自己對弈，迅速提高水準。在進行實驗3天後，面對2016年3月擊敗頂級棋手李世石時的舊版AlphaGo取得了100戰全勝。

　　人類在多年的圍棋歷史中不斷自主完善了被稱為「定式」的慣用下法。在試驗40天後，AlphaGo Zero已經與自己對弈 2900萬局，強大程度超過2016年5月時面對全球最強棋手柯潔九段取得3連勝的AlphaGo版本。據稱，AlphaGo Zero還開始掌握人類未知的下法。

　　美國圍棋協會主席安迪·奧肯等在發給《自然》雜誌的稿件中指出，「AlphaGo Zero在中盤階段的若干判斷簡直就像迷一樣」。另一方面，隨著人工智慧和人類在下棋時總結出了相同的定式，證明「人類長達數個世紀的圍棋活動取得的成果並非全部錯誤」。

　　沉思科技的首席執行官傑米斯·哈薩比斯在AlphaGo擊敗最強人類棋手時表示，「這是最後一次和人類對弈」。為達成「完全不依賴人類的人工智慧」這個目標，哈薩比斯在此後繼續對AlphaGo進行了改進。

　　此前，人工智慧曾將人類的對弈數據作為「教師」加以學習。因此有觀點指出，人工智慧雖然強大，但僅僅處於人類知識的延長線上。沉思科技通過讓人工智慧從零開始自學，採用被稱為「沒有教師的學習」方式，創造出了不受人類思維束縛的革新性人工智慧。

　　哈薩比斯表示，「人工智慧有可能推動人類的智力向前發展，給全人類帶來積極影響」。

　　沉思科技與英國國家醫療服務體系（NHS）展開合作，除了將人工智慧用於早期發現疑難雜症外，還將用於調整電力供需等方面。將來，還期待人工智慧在依靠人類力量難以解決的新材料開發、探究蛋白質生成機制等方面做出貢獻。

　　新技術將來還可能在産業方面做出貢獻。例如，從大量數據中發現人類難以意識到的提升效率的方式等。據悉，以各種用電數據為基礎，人工智慧將有助於節省電力。由於像AlphaGo Zero一樣的人工智慧可以「無師自通」，在宇宙和海洋等觀測數據不足的領域也有可能做出貢獻。

　　日本經濟新聞（中文版：日經中文網）川合智之華盛頓

相關新聞

會自學的最強阿爾法狗誕生 突破人類思維束縛

會自學的最強阿爾法狗誕生突破人類思維束縛