小米AI大模型MiLM-6B曝光 64億參數同參數量級排名第1

科技巨頭們的AI大模型早已拉開了序幕,互聯(lián)網公司百度和阿里已經發(fā)布了各自的大模型,而近日騰訊也曝光了自己的大模型。科技訊今日發(fā)現(xiàn),雖然小米公司沒有公開宣布自己加入大模型之戰(zhàn),但我們卻在Github上發(fā)現(xiàn)了小米大模型的蹤影。

在Github小米這樣介紹MiLM-6B:MiLM-6B是由小米開發(fā)的一個大規(guī)模預訓練語言模型,參數規(guī)模為64億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。除了Github小米的AI大模型MiLM-6B還進入了C-Eval、CMMLU大模型評測榜單,截至當前,小米大模型在C-Eval 總榜單排名第10、同參數量級排名第 1。

小米AI大模型MiLM-6B曝光 64億參數同參數量級排名第1

根據 GitHub 項目頁給出的信息得知,MiLM-6B 是由小米公司開發(fā)的一個大規(guī)模預訓練語言模型,參數規(guī)模達 64 億。

而根據 C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學、技術、工程和數學教育)全部 20 個科目中,計量師、物理、化學、生物等多個項目獲得了較高的準確率。

小米AI大模型MiLM-6B曝光 64億參數同參數量級排名第1

MiLM-6B 模型目前已經在大多數文科科目中表現(xiàn)出了相對良好的準確度,不過在“法學、數學、編程、概率論、離散數學”等涉及“抽象思維”的科目中,還有一定進步空間。

在 10 個“社會科學”測試科目中,除“教育學和地理”外,該模型在其他 8 個科目中都獲得了較為理想的準確率。在人文科學的 11 個科目中,MiLM-6B 則在“歷史與法律”基礎上有著不錯的準確率表現(xiàn)。

AI 大模型 MiLM-6B 當下才首次曝光,不過完成度已經較高,在未來該模型可能會被用于小米旗下“小愛同學”等虛擬助理服務中。

原創(chuàng)文章,作者:小科同學,如若轉載,請注明出處:http://leeannwhittemore.com/article/575604.html

小科同學的頭像小科同學

相關推薦

發(fā)表回復

登錄后才能評論