AI量産架空人物的技術在崛起
2019/11/21
能夠量産人工智慧(AI)學習用數據的被稱為「GAN」的技術正在崛起。日本初創企業DataGrid將該技術應用於自動生成實際不存在的模特圖像,另一家企業Preferred Networks也在推進對該技術的利用。該技術可加速AI的「深度學習」進程,還被期待應用於自動駕駛和醫療等領域。對於在積累AI學習用數據方面落後於中美的日本來説或將成為福音。
![]() |
DataGrid面向本間高爾夫製作的「實際不存在的」人物面孔 |
滿屏的面孔、面孔、面孔——打開製造和經銷高爾夫用品的本間高爾夫的網站,身穿該公司服裝的模特一個接一個地登場。數量達一萬人左右。從容貌等來看沒有任何不自然之處,但實際上這些「所有人」並不真實存在。所有模特都是被稱作「生成對抗網路(GAN)」的AI技術創造的架空人物。
製作出這些圖像的是東京大學旗下的初創企業DataGrid。利用了2個相互「對抗」的AI。
其中一個AI微調眼睛、鼻子的形狀和位置製作出圖像,然後由另一個AI來辨別圖像中的人物是不是真人。如果被識破,AI會分析原因,生成新的圖像再次挑戰。兩個AI在相互競爭的過程中,製作出宛如真人的面部圖像。負責策劃的博報堂MAGNET的佐佐木裕也感嘆道「最初製作出的很多是不自然的面孔,但慢慢地變得越來越自然」。
![]() |
目前主流的深度學習AI存在1個弱點。那就是要想使AI不斷進化必須讓AI學習大量的數據。
使用GAN技術的話,則能夠量産並非實際存在的數據。讓醫療用AI學習酷似真實圖像的手術圖像以及提高自動駕駛模擬試驗的水準將變得容易。為了使AI的學習速度實現飛躍式提高,全世界的IT企業展開了開發競爭。
DataGrid的岡田侑貴社長表示「本公司使用GAN,能夠1秒鐘生成1個人的面部圖像」。該公司從10月份開始利用該技術,與日本連鎖精品店URBAN RESEARCH等啟動「換裝」服務的實證試驗。分別準備好服裝和模特圖像,然後使用GAN製作出好似試穿服裝的圖像。
URBAN RESEARCH的萩原直樹執行董事稱「在服裝網站上,以往需要為1套商品拍攝100張照片」,使用GAN的話,能夠大幅降低模特攝影的成本。
除了實拍圖像外,動畫的登場人物也能通過GAN創造出來。Preferred Networks 4月開始面向企業法人推出可無限創造出動畫人物角色的「Crypko」服務。日本大型IT企業DeNA也在同樣的領域加緊推進開發。
GAN的應用範圍很廣。日本半導體商社MACNICA一直致力於提高自動駕駛的開發效率。使用GAN改變實際的圖像,製作出各種天氣、時間帶和地點的景象。該商社表示「無需讓車實際在公路上行駛,就能獲取圖像識別系統的學習用數據」。
三菱電機致力於提高使用圖像檢查不良品的AI的效率。在情報技術綜合研究所負責分析影像的杉本和夫表示,「只需很少的計算就能正確檢查出不良品」。NTT Communication Science Laboratories的田中宏研究員表示「考慮(利用GAN)生成客戶服務中心的應答語音」。
GAN的概念由美國谷歌的研究人員伊恩·古德費洛(Ian J. Goodfellow)2014年提出。之後,英偉達和蘋果等美國企業的研究令人矚目。
最近之所以日本企業也相繼進入該領域,是因為使用GAN技術的話,無需顧慮個人資訊問題就能生成大量的數據。這對於在積累AI學習數據方面落後於中美的日本企業來説,有望成為挽回劣勢的關鍵一招。
可能助長「深度偽造」
GAN等圖像生成技術也存在消極面。
隨著2020年美國總統大選的來臨,被稱為「深度偽造」(DeepFake)的假視頻技術越來越令人擔憂。有人對美國前總統歐巴馬等著名人士的演講視頻進行編輯並對外散佈,在虛假視頻中,演講的人看起來好像在説一些根本沒有事實依據的話。由於有可能會左右總統選舉的動向,美國眾議院情報委員會6月召開了有關深度偽造威脅和對策的聽證會。
深度偽造與普通人也並非沒有關係。在色情視頻中嵌入其他女性臉部圖像的「偽色情」(Fake Pornography)技術已經問世。如果專門在聲音上做文章的話,就有可能導致電話詐騙等的手段越來越高明。
企業也開始著手制定相關對策。美國Facebook和微軟9月宣佈,將與美國麻省理工學院(MIT)攜手,舉辦一場辨別深度偽造的技能競賽。美國Amazon Web Services(AWS)也表示予以合作。
日本通信商NTT也表示「為了舉辦識破虛假語音的競賽,開始以提供數據等形式展開合作」。開發虛假視頻檢測技術的初創企業也在不斷增加,比如從事網路風險檢測業務的日本Eltes等。
不過,這樣的舉措只不過是亡羊補牢。從目前看來,這樣的「貓鼠遊戲」今後仍將持續。
日本經濟新聞(中文版:日經中文網)花田亮輔,黑田弁慶
版權聲明:日本經濟新聞社版權所有,未經授權不得轉載或部分複製,違者必究。