You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

港大初創LLM模型擁千億參數

By on June 1, 2023

原文刊於信報財經新聞「StartupBeat創科鬥室

生成式人工智能(Generative AI)熱潮席捲全球,不少開發者都標榜旗下大型語言模型(LLM)坐擁千億參數。香港大學計算機科學系衍生公司Stellaris AI日前宣布,推出具有千億參數的大型語言模型Stellaris GPT(SGPT),強調該模型完全由Stellaris AI團隊自主研發,並且不依賴於其他類似AI系統。

根據港大資料,SGPT研究團隊包括港大-渣打慈善基金金融科技學院總監兼計算機科學系教授姚兆明,以及其前博士生武繼坤,後者亦是Stellaris AI首席執行官。

跟其他LLM一樣,SGPT能理解語言、生成文本及代碼、基於知識回答問題,以至邏輯推理及評論新聞。港大稱,在數學、邏輯、倫理等其他大型模型失敗的極端複雜案例中,SGPT仍能提供正確答案。

港大計算機科學系教授姚兆明為SGPT研究團隊成員。(港大網上圖片)

中美發布佔全球八成

此外,路透引述由國家科技部旗下研究組織撰寫的《中國人工智能大模型地圖研究報告》提到,中國機構過去3年總共發布79個AI大模型。在2020年,中國發布的大模型僅兩個,美國則有11個;及至2021年,中國發布了28個大模型,令總數急增至30個。至於今年,中國暫時發布19個大模型,比美國多出一個。

內地新華網指出,中美兩國所發布的大模型數目,佔全球總數超過八成,而美國依然是全球之首。中國現有14個省區市投入於大模型開發,主要集中於北京及廣東,惟學術界及產業之間的聯合研發仍不足。報道又表示,自然語言處理(NLP)是目前中國大模型研發的重點領域,其次是多模態領域,而電腦視覺及智能語音相對少。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們