開源大模型賽道迎來重磅新品。
當(dāng)?shù)貢r間2月21日,谷歌宣布正式推出全新的開源大語言模型(LLM)“Gemma”, 旨在幫助開發(fā)人員和研究人員負(fù)責(zé)任地構(gòu)建人工智能。
據(jù)介紹,Gemma大模型與谷歌規(guī)模最大、能力最強(qiáng)的人工智能模型Gemini共享技術(shù)和基礎(chǔ)架構(gòu),“受到 Gemini的啟發(fā),Google DeepMind和Google其他團(tuán)隊合作開發(fā)了Gemma,并用拉丁語中意為‘寶石’的gemma為其命名。”
不過相比Gemini,Gemma更加輕量化。同時,Gemma依舊保持免費使用,其模型權(quán)重也一并開源,并且允許商用。
谷歌共發(fā)布了兩種不同權(quán)重規(guī)模的模型,分別為Gemma 2B(20億參數(shù))和Gemma 7B(70億參數(shù))。每種規(guī)模都有預(yù)訓(xùn)練和指令微調(diào)版本,允許所有組織(無論規(guī)模大。┴(fù)責(zé)任地進(jìn)行商用和分發(fā)。
谷歌發(fā)布Gemma的同日,風(fēng)頭正盛的芯片制造商英偉達(dá)也宣布,已與谷歌達(dá)成合作,確保Gemma模型在其芯片上順利運行。英偉達(dá)還表示,旗下聊天機(jī)器人軟件Chat With RTX也將馬上支持Gemma。
值得注意的是,谷歌還強(qiáng)調(diào),Gemma能在關(guān)鍵基準(zhǔn)上越級碾壓更大的模型。更為令人印象深刻的是,谷歌Gemma可以在筆記本電腦上運行。
谷歌方面表示,Gemini是我們當(dāng)今廣泛使用的最大、功能最強(qiáng)大的AI模型。與其他開放模型相比,Gemma 2B和7B能夠在其范圍內(nèi)實現(xiàn)同類最佳的性能。Gemma模型能夠直接在開發(fā)人員筆記本電腦或臺式計算機(jī)上運行,“值得注意的是,Gemma在關(guān)鍵基準(zhǔn)上超越了更大的模型,同時遵守我們安全和負(fù)責(zé)任的輸出的嚴(yán)格標(biāo)準(zhǔn)。”
在開源模型的同時,谷歌還公布了有關(guān)Gemma的性能、數(shù)據(jù)集組成和建模方法的詳細(xì)信息的技術(shù)報告。有研究人員在技術(shù)報告中發(fā)現(xiàn),Gemma支持的詞匯表大小達(dá)到了256K,這意味著它對英語之外的其他語言能夠提供更好、更快的支持。
Gemma與Meta公司發(fā)布的Llama 2的參數(shù)對比,來自谷歌官網(wǎng)
Gemma也第一時間在知名開源模型庫HuggingFace和HuggingChat上線。上線不久之后,在HuggingFace的“大語言模型榜單”上,Gemma 2B和7B模型已經(jīng)雙雙登頂。
AI行業(yè)專家、深度學(xué)習(xí)框架Keras的作者François Chollet更是對此表示,最強(qiáng)開源大模型的位置現(xiàn)在易主了。
Gemma的競爭對手Llama 3也發(fā)布在即。1月19日,Meta聯(lián)合創(chuàng)始人兼首席執(zhí)行官扎克伯格宣布,Meta正在訓(xùn)練Llama 3并且將以負(fù)責(zé)任地方式繼續(xù)開源。
聲明:
本文僅代表作者個人觀點,與新江南網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容,新江南網(wǎng)號系信息發(fā)布平臺,新江南網(wǎng)僅提供信息存儲空間服務(wù)。如有侵權(quán)請出示權(quán)屬憑證聯(lián)系管理員(yin040310@sina.com)刪除!
閱讀推薦
新聞爆料
點擊排行