阿里云通義千問多模態(tài)大模型Qwen-VL-Max重磅升級

若安丶 ? 2024年1月27日 20:28:00 ? AI

阿里云昨日公布了其多模態(tài)大模型研究的新進展，推出了升級版的通義千問視覺理解模型Qwen-VL-Max。這款模型在視覺推理能力和中文理解能力上都有了顯著提升，性能表現(xiàn)堪比GPT-4V和谷歌的Gemini Ultra。

Qwen-VL-Max的升級主要表現(xiàn)在以下幾個方面：

基礎(chǔ)能力：Qwen-VL-Max能夠準(zhǔn)確描述和識別圖片信息，并基于圖片進行信息推理和擴展創(chuàng)作。它還具備了視覺定位能力，能夠?qū)Ξ嬅嬷付▍^(qū)域進行問答。
視覺推理：新版模型能夠理解流程圖等復(fù)雜形式圖片，并能夠分析復(fù)雜圖標(biāo)。此外，它在看圖做題、看圖作文以及看圖寫代碼等任務(wù)上也達到了世界最佳水平。
圖像文本處理：Qwen-VL-Max的中英文文本識別能力顯著提高，支持百萬像素以上的高清分辨率圖和極端寬高比的圖像。它既能夠完整復(fù)現(xiàn)密集文本，也能從表格和文檔中提取信息。

與LLM（大語言模型）相比，多模態(tài)大模型擁有更大的應(yīng)用想象力。例如，研究者正在探索將多模態(tài)大模型與自動駕駛場景結(jié)合，為“完全自動駕駛”找到新的技術(shù)路徑。此外，將多模態(tài)模型部署到手機、機器人、智能音箱等端側(cè)設(shè)備，可以讓智能設(shè)備自動理解物理世界的信息，或者基于多模態(tài)模型開發(fā)應(yīng)用，輔助視力障礙群體的日常生活等等。

Qwen-VL-Plus和Qwen-VL-Max目前限時免費，用戶可以在通義千問官網(wǎng)、通義千問APP直接體驗Max版本模型的能力，也可以通過阿里云靈積平臺（DashScope）調(diào)用模型API。

總的來說，阿里云的通義千問多模態(tài)大模型Qwen-VL-Max在視覺推理和中文理解方面都展現(xiàn)出了強大的實力，其性能表現(xiàn)足以與GPT-4V和谷歌的Gemini Ultra相媲美。這將為用戶提供更豐富、更準(zhǔn)確的視覺信息理解和創(chuàng)作能力，推動AI技術(shù)在更多領(lǐng)域的應(yīng)用和發(fā)展。

原創(chuàng)文章，作者：若安丶，如若轉(zhuǎn)載，請注明出處：http://leeannwhittemore.com/article/624926.html

Qwen-VL-Max Qwen-VL-Max升級通義千問多模態(tài)大模型Qwen-VL-Max 通義千問多模態(tài)大模型Qwen-VL-Max升級阿里云

若安丶管理團隊

0 0

商業(yè)

阿里集團CEO吳泳銘：AI最大的想象力在于改變物理世界

阿里巴巴集團CEO、阿里云智能集團董事長兼CEO吳泳銘：“?過去22個月，AI發(fā)展速度超過任何歷史時期，但我們依然還處于AGI變革的早期。生成式AI最大的想象力，絕不是在手機屏幕上做一兩個新的超級app，而是接管數(shù)字世界，改變物理世界?！?/p>

藍(lán)鯊硬科技
2024年9月21日
AI

阿里云通義千問發(fā)布全新Qwen2系列AI模型：性能大幅提升，支持128K tokens長上下文

今日，阿里云通義千問（Qwen）宣布，經(jīng)過數(shù)月的持續(xù)研發(fā)和優(yōu)化，其AI開源模型系列已升級至Qwen2，并在Hugging Face和ModelScope上同步開源。此次升級不僅引入…

AI
2024年6月7日
AI

百度文心大模型ENIRE Speed和ENIRE Lite全面免費，加速AI應(yīng)用普及

在人工智能領(lǐng)域的激烈競爭中，百度文心大模型近日宣布了一項重磅消息：其兩款主力模型ENIRE Speed和ENIRE Lite將全面免費開放使用，即刻生效。這一舉措無疑將對整個行業(yè)產(chǎn)…

百度
2024年5月21日
AI

阿里云發(fā)布通義千問2.5大模型，能力全面升級，趕超GPT-4

昨日，在阿里云AI智領(lǐng)者峰會-北京站活動中，阿里云正式發(fā)布了通義千問2.5大模型，并宣稱其在多項能力上已全面趕超GPT-4，尤其在中文語境下的表現(xiàn)尤為突出。據(jù)阿里云官方介紹，通義…

科技新聞
2024年5月10日
AI

阿里云通義千問開源320億參數(shù)大語言模型，全系列已達七款

4月7日，阿里云宣布通義千問成功開源其最新的320億參數(shù)大語言模型——Qwen1.5-32B，至此通義千問已完成包括5億、18億、40億、70億、140億和720億參數(shù)在內(nèi)的全系列…

科技新聞
2024年4月8日
AI

阿里云啟用AI編程助手通義靈碼，助力程序員提升效率

近日，阿里云在內(nèi)部全面推行AI編程，借助通義靈碼這一智能編程助手，幫助程序員編寫代碼、閱讀代碼、檢查BUG以及優(yōu)化代碼等工作。這一創(chuàng)新舉措標(biāo)志著阿里云在智能化編程領(lǐng)域邁出了重要的一…

泡沫大盜
2024年4月3日
新聞

阿里云宣布通義千問720億參數(shù)模型開源

今日，阿里云宣布開源通義千問 720 億參數(shù)模型 Qwen-72B、18 億參數(shù)模型 Qwen-1.8B 及音頻大模型 Qwen-Audio，目前已上線阿里魔搭社區(qū)。

秋秋
2023年12月1日
新聞

阿里巴巴：吳泳銘接替張勇，阿里云智能集團分拆計劃繼續(xù)進行

阿里巴巴宣布吳泳銘先生將接替張勇先生出任阿里云智能集團代理董事長兼首席執(zhí)行官，委任于 2023 年 9 月 10 日生效

科技探索者
2023年9月11日
張勇發(fā)全員信：阿里云將分拆上市

阿里巴巴宣布啟動「1+6+N」組織變革以來，首個正式宣布「單飛」的業(yè)務(wù)落子阿里云智能集團

蘋果派
新聞 2023年5月19日
阿里云域名價格調(diào)整 2月1日起net英文域名續(xù)費上調(diào)至89元

據(jù)阿里云官網(wǎng)顯示，阿里云日前發(fā)布域名價格調(diào)整通知。

若安丶
新聞 2023年1月16日
阿里巴巴組織架構(gòu)大調(diào)整集團CEO張勇兼任阿里云智能總裁

昨日，阿里巴巴集團董事會主席兼CEO張勇發(fā)出全員郵件，宣布組織變化，并將新年關(guān)鍵字定為“進”。

若安丶
新聞 2022年12月30日
阿里云正式發(fā)布“汽車云”：已服務(wù)國內(nèi)超70%汽車企業(yè)

阿里云“汽車云”在 2022云棲大會上正式亮相。目前，阿里云“汽車云”在國內(nèi)已服務(wù)超過70%的汽車企業(yè)，小鵬、一汽、吉利、長城、長安、地平線等均已上云。

若安丶
智車 2022年11月7日
阿里云：2022云棲大會，11月3-5日杭州見

阿里云宣布，2022杭州·云棲大會將在11月3日至5日杭州·云棲小鎮(zhèn)舉行。

若安丶
新聞 2022年9月30日
阿里云獲評MongoDB年度新興市場最佳云合作伙伴

阿里云獲評MongoDB年度新興市場最佳云合作伙伴

蘋果派
新聞 2022年6月15日
阿里云產(chǎn)業(yè)智能OpenTrek正式發(fā)布 “封裝”五大產(chǎn)業(yè)智能核心技術(shù)

6月13日，在2022阿里云峰會上，阿里云智能副總裁、行業(yè)解決方案研發(fā)部負(fù)責(zé)人曾震宇發(fā)布“阿里云產(chǎn)業(yè)智能OpenTrek”

蘋果派
新聞 2022年6月13日
云原生能力再升級阿里云推出分布式容器平臺ACK One

6月13日，2022阿里云峰會上，阿里云基礎(chǔ)產(chǎn)品事業(yè)部負(fù)責(zé)人蔣江偉宣布，容器服務(wù)再升級，正式推出分布式云容器平臺ACK One及ACK云原生AI套件。

蘋果派
新聞 2022年6月13日
阿里云無影重大升級：開發(fā)者造出手術(shù)機器人、智能底盤和3D教學(xué)機

2022阿里云峰會發(fā)布無影架構(gòu)重大升級：通過全球計算網(wǎng)絡(luò)節(jié)點接近接入，開發(fā)者可以研制8K超高清未來終端形態(tài)，并在用戶端保持毫秒級數(shù)據(jù)應(yīng)用訪問體驗。6月15日起，用戶可在無影產(chǎn)品和自有終端開發(fā)中選用全新ASP云流協(xié)議。

蘋果派
新聞 2022年6月13日
阿里云發(fā)布云數(shù)據(jù)中心處理器CIPU

6月13日，阿里云宣布推出云基礎(chǔ)設(shè)施處理器CIPU（Cloud Infrastructure Processing Unit ），這是為新型云數(shù)據(jù)中心設(shè)計的專用處理器，將替代CPU成為云時代IDC的處理核心。

蘋果派
新聞 2022年6月13日
阿里云“大算力”支持嬴徹自動駕駛仿真提速20倍

阿里云“大算力”支持嬴徹自動駕駛仿真提速20倍

蘋果派
新聞 2022年5月24日
“1分鐘發(fā)現(xiàn)、5分鐘響應(yīng)、10分鐘處置”, 阿里云推出醫(yī)保全平臺智能運維方案

5月19日消息，記者獲悉，阿里云正式推出醫(yī)保全平臺智能運維方案，通過打造“1分鐘發(fā)現(xiàn)、5分鐘響應(yīng)、10分鐘處置”的運維技術(shù)體系，保障醫(yī)保信息平臺高效平穩(wěn)運行。

蘋果派
新聞 2022年5月19日

發(fā)表回復(fù)

登錄后才能評論

阿里云通義千問多模態(tài)大模型Qwen-VL-Max重磅升級

相關(guān)推薦

發(fā)表回復(fù)