fb人手訓練AI辨識力 斥逾三千萬印度組審查軍團

By on May 7, 2019

原文刊於信報財經新聞專欄「StartupBeat創科鬥室

Facebook(fb)被指在印度透過外判公司聘請大量合約工,以人手審查fb平台的大小資訊,從而訓練人工智能(AI)的辨識能力。(路透社圖片)

Facebook(fb)被指在印度透過外判公司聘請大量合約工,以人手審查fb平台的大小資訊,從而訓練人工智能(AI)的辨識能力。(路透社圖片)

路透消息報道,社交平台Facebook(fb)在印度海得拉巴(Hyderabad),透過外判公司Wipro Ltd. 聘請大量合約工,以人手審查fb平台的大小資訊,包括過去5年發布的數百萬張照片、狀態更新、共享連結、聊天截圖等,藉此提高人工智能(AI)的辨識能力。

了解喜好 提升使用體驗

消息指出,fb去年4月推出了Wipro項目,向印度外判商批出400萬美元(約3120萬港元)合同,並組建了一支達260多人的「審查軍團」,有不願透露身份的員工稱,他們主要的工作是標籤帖文的主題,例如是食物、自拍還是動物;當中涉及什麼場合(譬如度假照片、悼念文章),或作者背後的動機,究竟是策劃活動、打氣,抑或開玩笑等。每則帖文平均審查兩次,確保分析準確。

據聞相關工作至少持續至今年底,每位合約工平均每天審查700個項目,而這些帖文來自全球用戶,以隨機方式抽樣處理,文字以英文、印地語及阿拉伯語為主。

被問到內部審查社交帖文,路透引述fb回應指此舉旨在更了解用戶喜好,協助公司開發新功能,例如消費者在網上購物時,向他們推介相關產品。另一方面,為fb培訓一種自動化工具,讓廣告商贊助視頻時,避免牽涉成人、政治等敏感內容。

事實上,以人手標籤內容,亦稱為「數據詮釋」(Data Annotation),是一種新興行業。無論Alphabet旗下的自駕分支Waymo,以至電商巨擘Amazon的語音助理功能,均須聘請海量人手,利用大量數據培訓AI系統,改善使用體驗。

擅取資料 或違歐盟私隱例

歐盟去年5月通過《一般資料保護規例》(GDPR),要求公司收集及使用個人數據時有嚴格規定,在許多情況下都要得到對方同意,亦要明確說明其使用目的,並可根據用戶要求刪除數據。倘若數據洩漏對用戶私隱產生不利影響,企業必須在72小時內向外公開通報。

fb表示,標籤及審查帖文可更了解用戶喜好,有利開發新功能;不過有法律專家稱,fb此項舉措,或違反歐盟私隱條例。(路透社圖片)

fb表示,標籤及審查帖文可更了解用戶喜好,有利開發新功能;不過有法律專家稱,fb此項舉措,或違反歐盟私隱條例。(路透社圖片)

fb本身的數據政策內容,沒有明確提到手動分析。據路透諮詢的法律專家稱,如今與業務合作夥伴分享數據,或為fb帶來新私隱問題。雖然以內部形式處理,惟難免涉及用戶資料;用戶亦無法退出計劃,對會否牴觸GDPR存有一定疑問。

美國參議院情報委員會副主席Mark Warner在一份聲明指出,大型平台從用戶獲取大量數據,用於愈來愈廣泛的用途上,卻未有向用戶作相應補償。據知Warner正起草法案,要求fb披露用戶數據的價值,並告知其數據如何變現(Monetized)。

支持 StartupBeat

如欲投稿、報料,發佈新聞稿或採訪通知,按這裡聯絡我們