You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

GPT-4心智能力如14歲童 通過評估測驗 微軟視AGI雛形

By on March 28, 2023

原文刊於信報財經新聞「StartupBeat創科鬥室

人工智能(AI)聊天機械人ChatGPT,以出色對答能力備受矚目。微軟研究人員發表長達154頁報告,顯示OpenAI新推出的GPT-4模型成功通過經典心理測驗「Sally-Anne測試」,心智能力相當於14歲孩童;同時,毋須提示便完成數學、編碼、視覺、醫學、法律等任務,可以合理地被視為「通用人工智能」(Artificial General Intelligence, AGI)系統的雛形。

Sally-Anne測試通常用於評估兒童的「心智理論」(Theory of Mind)能力,即探討他們「能否理解別人的心理狀態及觀點」。測試會模擬一個情景,Sally及Anne共處一室,Sally首先拿起皮球,放在籃子內,然後離開房間。Anne看到Sally離開後,偷偷從籃子拿出皮球,再放進一個盒子蓋起來,之後問小孩「Sally回來後去哪兒找球」?

「Sally-Anne測試」常用於評估兒童的心智能力。(ResearchGate網上圖片)

付費版可外掛享即時資訊

部分兒童回答Sally會去盒子找皮球,但這答案是錯誤的,因為Sally並不知道Anne早已把皮球移走。由於具備一定心智水平的兒童,才會意識到Sally不知皮球被移走,所以正確答案是「到原本的籃子找皮球」。在2010年的一項實驗結果中,6到8歲的兒童答對率是65.5%,而9到14歲兒童答對率是91.9%。

為免GPT-4搜尋以往的答案,微軟研究人員特別把題目改為Alice與Bob,GPT-4同樣答對。台灣AI初創iKala行政總裁程世嘉在Facebook提到,以類神經網路為基礎訓練出來的這些AI,無人知道它是如何運作,卻投放到市場讓人人使用,坦言「現況真的非常令人擔心」。

微軟稱,GPT-4可視為AGI系統的早期版本。(法新社資料圖片)

此外,OpenAI上周五為付費版ChatGPT Plus用戶,推出官方外掛(Plugin)。首批合作夥伴包括:Expedia、FiscalNote、Instacart、KAYAK、Klarna、Milo、OpenTable、Shopify、Slack、Speak、Wolfram及Zapier。用戶除了訂機票、查詢酒店格價,還能建立自己的AI App Store,亦可上網存取即時資訊,突破資料庫停留於2021年的限制。

Bing添功能搜尋量升13.6%

StatCounter網站數據顯示,谷歌(Google)仍然是搜尋市場霸主,截至今年2月坐擁93.37%市佔率,微軟旗下Bing市佔僅2.81%。網絡分析平台SimilarWeb上周三發表報告指出,自從上月初導入ChatGPT以來,微軟Bing錄得的訪問量,在28日間大幅增長13.6%,谷歌則稍降2.8%,惟雙方流量仍有82倍差距。

GPT-4可與Stable Diffusion結合,為3D城市建模生成截圖。(arXiv網上圖片)

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們