教AI學習的「老師」越來越吃香

2020/07/03


       向人工智慧(AI)教授正確知識的工作越來越多。如果由人類為大量數據加上「註釋」並進行整理,就能提高AI的學習效率。美國Defined Crowd公司正在加快錄用因新冠疫情影響而增加的居家工作者,甚至還出現了組織當地老年人教授AI學習的企業。日本要在AI開發競爭中追趕英語圈國家,需要增加日語「教師」。

 

        「把音量調大」、「今天什麼天氣」,兵庫縣西宮市的家庭主婦小澤真佑子(28歲)在家把孩子哄睡之後,開始對著智慧手機説話。

 

       處理語音和圖像數據

 

       小澤反覆朗讀指定的短文或者將無意義地羅列在一起的單詞朗讀出來。這是在製作AI學習時使用的數據,目的是讓大型IT企業的AI揚聲器能夠正確解釋日語。多的時候需要連續工作2~3個小時,有時一個月能賺到10萬日元(約合人民幣6600元)。

 

       小澤所做的是一項叫做「Annotation」的工作,這個詞的意思是「註釋」。需要整理大量數據,引導AI高效學習,起到類似於教師的作用。工作中要處理的不只是語音數據,還包括在電腦上用邊框圈出圖像裏的特定部分,以讓AI能夠識別障礙物,借此培養出可對自動駕駛起到識別作用的AI

 

亞馬遜的註釋輔助工具。通過圈出圖像裏的汽車來提高AI的精度

 

       因新冠疫情擴大,AI的老師在全球範圍內增加。小澤所屬的DefinedCrowd公司將各IT公司和企業研發部門等委託的註釋工作介紹給在其平臺上註冊的人員。自2月以後註冊會員迅速增加,全球超過30萬人。該公司首席執行官(CEO)丹妮拉·布拉加(Daniela Braga)指出,「實體的工作崗位迅速減少,尋找線上工作的人越來越多」。

 

 

       此外,谷歌和亞馬遜等主導AI開發的美國IT巨頭也認為必須要通過人類進行微調。微軟的試驗顯示,只要給此前只能辨別貓狗差異等的AI追加輸入約10張圖像,AI就能夠區分秋田犬和吉娃娃等犬種。

 


 

       只要準備適合學習的數據並指定方向,即可在短時間內開發出特定用途的AI。因此,各IT企業正在通過Defined Crowd等,增加教師人才的招聘。

 

       向AI展示人類的工作

 

       此外,作為工作承接者的企業也在增加。以日本保聖那集團旗下的保聖那JOBHUB為例,4月註釋業務的營業收入增至上年同月的4.3倍。在面向零售店和餐飲的人才派遣銳減的情況下,圖像識別工作等的委託正在成為新的盈利來源。

 

       最近正在增加的是識別位於線路架線和道路上的物體的工作。保聖那擁有的工作人員操作雲平臺上的工具,通過拍攝的影像,以紅框圈出電線桿和障礙物等。比起一開始就完全交給AI,向AI展示人類的操作、使之學會判斷標準更有效率。報酬因圖像種類不同而存在差異,一般每處理1張圖像可獲得5~11日元(約合人民幣0.33~0.73元)。

 

       從事IT服務的日本Light Cafe瞄準的是「老奶奶」。3月開始利用青森縣八戶市的基地,委託當地60~70多歲的男女從事註釋工作。要開發校對日語的AI,需要確保native speaker(母語者)。

 

       Light Cafe攜手越南的企業,委託當地的員工進行註釋。不過,該公司認為日語由日本國內來完成更有效率。在日本接受過學校教育的人更能準確理解漢字與假名混雜的句子和短語等。

 

       註釋在日本日趨受到關注,但海外更加領先。在印度,以低價格提供英語註釋服務的企業正在崛起,推動著快速的AI開發。在使用者較多的英語圈和中文圈,則具備採取人海戰術的優勢。

 

       美國調查公司Grand View Research的統計顯示,註釋的世界市場規模2027年將達到26億美元,增至2019年的近7倍。北美佔世界市場的4成,英語圈的領先顯而易見。要積極培育日語相關的AI,需要有充分運用家庭主婦和老年人等被忽視的人才的機制。

 

版權聲明:日本經濟新聞社版權所有,未經授權不得轉載或部分複製,違者必究。