業(yè)界最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型正式開(kāi)源

2023-12-01 11:53 來(lái)源：互聯(lián)網(wǎng) 我來(lái)投稿撤稿糾錯(cuò)

12月1日，阿里云舉辦通義千問(wèn)發(fā)布會(huì)，開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B。Qwen-72B在10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)創(chuàng)下開(kāi)源模型最優(yōu)成績(jī)，成為業(yè)界最強(qiáng)開(kāi)源大模型，性能超越開(kāi)源標(biāo)桿Llama 2-70B和大部分商用閉源模型。未來(lái)，企業(yè)級(jí)、科研級(jí)的高性能應(yīng)用，也有了開(kāi)源大模型這一選項(xiàng)。

通義千問(wèn)還開(kāi)源了18億參數(shù)模型Qwen-1.8B和音頻大模型Qwen-Audio。至此，通義千問(wèn)共開(kāi)源18億、70億、140億、720億參數(shù)的4款大語(yǔ)言模型，以及視覺(jué)理解、音頻理解兩款多模態(tài)大模型，實(shí)現(xiàn)“全尺寸、全模態(tài)”開(kāi)源。力度之大，業(yè)界無(wú)出其右。

業(yè)界最強(qiáng)開(kāi)源模型，填補(bǔ)中國(guó)LLM開(kāi)源領(lǐng)域空白

Qwen-72B基于3T tokens高質(zhì)量數(shù)據(jù)訓(xùn)練，延續(xù)通義千問(wèn)預(yù)訓(xùn)練模型一貫以來(lái)的強(qiáng)勢(shì)表現(xiàn)，在10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中奪得開(kāi)源模型最優(yōu)成績(jī)，在部分測(cè)評(píng)中超越閉源的GPT-3.5和GPT-4。

英語(yǔ)任務(wù)上，Qwen-72B在MMLU基準(zhǔn)測(cè)試取得開(kāi)源模型最高分；中文任務(wù)上，Qwen-72B霸榜C-Eval、CMMLU、GaokaoBench等基準(zhǔn)，得分超越GPT-4；數(shù)學(xué)推理方面，Qwen-72B在GSM8K、MATH測(cè)評(píng)中斷層式領(lǐng)先其他開(kāi)源模型；代碼理解方面，Qwen-72B在HumanEval、MBPP等測(cè)評(píng)中的表現(xiàn)大幅提升，代碼能力有了質(zhì)的飛躍。

在10大權(quán)威測(cè)評(píng)中，通義千問(wèn)720億參數(shù)模型獲得開(kāi)源模型最優(yōu)成績(jī)

通義千問(wèn)720億開(kāi)源模型部分成績(jī)超越閉源的GPT-3.5和GPT-4

Qwen-72B可以處理最多32k的長(zhǎng)文本輸入，在長(zhǎng)文本理解測(cè)試集LEval上取得了超越ChatGPT-3.5-16k的效果。研發(fā)團(tuán)隊(duì)優(yōu)化了Qwen-72B的指令遵循、工具使用等技能，使之能更好地被下游應(yīng)用集成。比如，Qwen-72B搭載了強(qiáng)大的系統(tǒng)指令（System Prompt）能力，用戶只用一句提示詞就可定制AI助手，要求大模型扮演某個(gè)角色或者執(zhí)行特定的回復(fù)任務(wù)。

用戶僅用一句提示詞就可創(chuàng)建自己的AI助手

此前，中國(guó)大模型市場(chǎng)還沒(méi)出現(xiàn)足以對(duì)標(biāo)Llama 2-70B的優(yōu)質(zhì)開(kāi)源模型。Qwen-72B填補(bǔ)了國(guó)內(nèi)空白，以高性能、高可控、高性價(jià)比的優(yōu)勢(shì)，提供不亞于商業(yè)閉源大模型的選擇?；赒wen-72B，大中型企業(yè)可開(kāi)發(fā)商業(yè)應(yīng)用，高校、科研院所可開(kāi)展AI for Science等科研工作。

從1.8B到72B， 通義千問(wèn) 率先實(shí)現(xiàn)全尺寸開(kāi)源

如果說(shuō)Qwen-72B“向上摸高”，抬升了開(kāi)源大模型的尺寸和性能天花板；發(fā)布會(huì)上的另一開(kāi)源模型Qwen-1.8B則“向下探底”，成為尺寸最小的中國(guó)開(kāi)源大模型，推理2K長(zhǎng)度文本內(nèi)容僅需3G顯存，可在消費(fèi)級(jí)終端部署。

從18億、70億、140億到720億參數(shù)規(guī)模，通義千問(wèn)成為業(yè)界首個(gè)“全尺寸開(kāi)源”的大模型。用戶可在魔搭社區(qū)直接體驗(yàn)Qwen系列模型效果，也可通過(guò)阿里云靈積平臺(tái)調(diào)用模型API，或基于阿里云百煉平臺(tái)定制大模型應(yīng)用。阿里云人工智能平臺(tái)PAI針對(duì)通義千問(wèn)全系列模型進(jìn)行深度適配，推出了輕量級(jí)微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗(yàn)證、在線服務(wù)部署等服務(wù)。

阿里云是國(guó)內(nèi)最早開(kāi)源自研大模型的科技企業(yè)，8月以來(lái)開(kāi)源了Qwen-7B、Qwen-14B和視覺(jué)理解模型Qwen-VL。幾款模型先后沖上HuggingFace、Github大模型榜單，得到中小企業(yè)和個(gè)人開(kāi)發(fā)者的青睞，累計(jì)下載量超過(guò)150萬(wàn)，催生出150多款新模型、新應(yīng)用。發(fā)布會(huì)現(xiàn)場(chǎng)，多位開(kāi)發(fā)者伙伴現(xiàn)身說(shuō)法，分享了他們用Qwen開(kāi)發(fā)專屬模型和特定應(yīng)用的實(shí)踐。

阿里云CTO周靖人表示，開(kāi)源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要，通義千問(wèn)將持續(xù)投入開(kāi)源，希望成為“AI時(shí)代最開(kāi)放的大模型”，與伙伴們共同促進(jìn)大模型生態(tài)建設(shè)。

通義千問(wèn)基座模型持續(xù)進(jìn)化，多模態(tài)探索業(yè)界領(lǐng)先

通義千問(wèn)在多模態(tài)大模型領(lǐng)域的探索也領(lǐng)先業(yè)界一步，當(dāng)天，阿里云首次開(kāi)源音頻理解大模型Qwen-Audio。

Qwen-Audio能夠感知和理解人聲、自然聲、動(dòng)物聲、音樂(lè)聲等各類語(yǔ)音信號(hào)。用戶可以輸入一段音頻，要求模型給出對(duì)音頻的理解，甚至基于音頻進(jìn)行文學(xué)創(chuàng)作、邏輯推理、故事續(xù)寫等等。音頻理解能夠賦予大模型接近人類的聽(tīng)覺(jué)能力。

通義大模型能“聽(tīng)”也能“看”。通義千問(wèn)8月開(kāi)源出視覺(jué)理解大模型Qwen-VL，迅速成為國(guó)際開(kāi)源社區(qū)最佳實(shí)踐之一。本次發(fā)布會(huì)又宣布了Qwen-VL的重大更新，大幅提升通用OCR、視覺(jué)推理、中文文本理解基礎(chǔ)能力，還能處理各種分辨率和規(guī)格的圖像，甚至能“看圖做題”。不論從權(quán)威測(cè)評(píng)成績(jī)還是真人體驗(yàn)的效果看，Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通義千問(wèn)閉源模型也在持續(xù)進(jìn)化，一個(gè)月前發(fā)布的通義千問(wèn)2.0版閉源模型，最近已進(jìn)階至2.1版，上下文窗口長(zhǎng)度擴(kuò)展到32k，代碼理解生成能力、數(shù)學(xué)推理能力、中英文百科知識(shí)、幻覺(jué)誘導(dǎo)抵抗能力分別提升30%、10%、近5%和14%。用戶可以在通義千問(wèn)APP免費(fèi)體驗(yàn)最新版本的閉源模型。

申請(qǐng)創(chuàng)業(yè)報(bào)道，分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處，共同探討創(chuàng)業(yè)新機(jī)遇！

相關(guān)標(biāo)簽: 大模型

相關(guān)文章

首屆通義千問(wèn)AI挑戰(zhàn)賽開(kāi)賽，參賽者可暢玩通義開(kāi)源模型家族

12月1日，首屆“通義千問(wèn)AI挑戰(zhàn)賽”開(kāi)賽，參賽者可免費(fèi)暢玩通義開(kāi)源模型家族，包括剛剛發(fā)布的720億參數(shù)模型Qwen-72B。主辦方為參賽者提供價(jià)值50萬(wàn)元的免費(fèi)云上算力和豐厚獎(jiǎng)金。賽事分為算法和Agent兩大賽道，前者聚焦通義千問(wèn)大模型的微調(diào)訓(xùn)練，希望通過(guò)高質(zhì)量的數(shù)據(jù)探索開(kāi)源模型的代碼能力上限，后

標(biāo)簽：

大模型
最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型開(kāi)源發(fā)布

12月1日通義千問(wèn)發(fā)布會(huì)，阿里云開(kāi)源通義千問(wèn)720億參數(shù)模型Qwen-72B。Qwen-72B在10個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)創(chuàng)下開(kāi)源模型最優(yōu)成績(jī)，成為業(yè)界最強(qiáng)開(kāi)源大模型，性能超越開(kāi)源標(biāo)桿Llama2-70B和大部分商用閉源模型，可適配企業(yè)級(jí)、科研級(jí)的高性能應(yīng)用。通義千問(wèn)當(dāng)天還開(kāi)源了18億參數(shù)模型Qwen-1.

標(biāo)簽：

大模型
掰開(kāi)安卓手機(jī)，滿屏都是三個(gè)字：大模型

這年頭，安卓廠商沒(méi)個(gè)大模型，都不敢開(kāi)手機(jī)發(fā)布會(huì)了。前腳OPPO剛用大模型升級(jí)了語(yǔ)音助手，后腳vivo就官宣自研手機(jī)AI大模型;小米發(fā)布會(huì)則直接將大模型當(dāng)場(chǎng)塞進(jìn)手機(jī)系統(tǒng)……其競(jìng)爭(zhēng)激烈程度，不亞于搶芯片首發(fā)。到底是怎么回事?究其原因，還是智能終端已經(jīng)成為了各類AIGC應(yīng)用的落地“新灘頭”。先是圖像生成大

標(biāo)簽：

大模型
加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務(wù)

基于容聯(lián)云自主研發(fā)的赤兔大模型能力，容聯(lián)云容犀機(jī)器人真正將大模型強(qiáng)大的理解能力、知識(shí)學(xué)習(xí)能力、總結(jié)能力、挖掘能力、推理能力融入于實(shí)際落地應(yīng)用中。開(kāi)創(chuàng)性的打造生成式場(chǎng)景化智能問(wèn)答、生成式智能輔助、AI運(yùn)營(yíng)話術(shù)庫(kù)，幫助企業(yè)洞悉更精準(zhǔn)的客戶真實(shí)需求，提升一線客服人員的專業(yè)服務(wù)能力，并代替人工完成大量低價(jià)值

標(biāo)簽：

大模型
從搜索到大模型，百度商業(yè)化的“驚險(xiǎn)一躍”

文：向善財(cái)經(jīng)關(guān)于百度，最近發(fā)生了這么兩件事兒。一個(gè)是華爾街分析師重申了對(duì)百度股票的買入評(píng)級(jí)和目標(biāo)價(jià)，但在該公司11月21日公布第三季度收益之前下調(diào)了第三季度收入預(yù)期。分析師給出的理由是，線下廣告支出走軟，以及2G資金減少之后，給智能交通帶來(lái)挑戰(zhàn)。另外一個(gè)是最近文心一言正式上線了專業(yè)版，并且開(kāi)始收費(fèi)，

標(biāo)簽：

百度

大模型

Manus官網(wǎng)突現(xiàn)“地區(qū)不可用”提示，中國(guó)區(qū)業(yè)務(wù)戰(zhàn)略性調(diào)整引關(guān)注

四個(gè)月前邀請(qǐng)碼炒至10萬(wàn)元，如今官網(wǎng)變灰、社交賬號(hào)清空，這家AI新貴的閃電遷移折射中國(guó)科技企業(yè)出海潮涌。7月11日，打開(kāi)Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示：“Manus在你所在的地區(qū)不可用”。而就在不久前，這個(gè)位置還顯示著“Manus中文版本正在開(kāi)發(fā)中”的樂(lè)觀聲明。同時(shí)，Manus官方微博和小紅書

標(biāo)簽：

ai智能
摩爾線程估值超 250 億，「中國(guó)英偉達(dá)」沖刺科創(chuàng)板

文/十界來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)圍繞算力自主的競(jìng)賽，正在科創(chuàng)板上演。近日，國(guó)產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書，擬募資約80億人民幣，成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者，也打響了“國(guó)產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書顯示，摩爾線程自2020年成立以來(lái)，主營(yíng)全功能GPU芯片的研發(fā)與銷售，以自主
百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞，百川智能的聯(lián)合創(chuàng)始人離職，這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵：(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽：(1)2025年7月10日，百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

標(biāo)簽：

人工智能

ai智能
百度智能云PaddleOCR 3.1正式發(fā)布：關(guān)鍵能力支持MCP

百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本，以突破性的多語(yǔ)言組合識(shí)別（MultilingualCompositionPerception,MCP）技術(shù)為核心，徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別，為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)

標(biāo)簽：

ai智能

ai技術(shù)
宇樹科技加速?zèng)_刺科創(chuàng)板IPO，人形機(jī)器人龍頭估值飆至120億元

“宇樹已形成硬件、算法、場(chǎng)景聯(lián)動(dòng)的業(yè)務(wù)飛輪，自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國(guó)力量?！笔壮藤Y本管理合伙人朱方文在追加投資時(shí)如是評(píng)價(jià)。7月7日，據(jù)每日經(jīng)濟(jì)新聞從宇樹科技投資方處獲悉，國(guó)內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹科技（UnitreeRobotics）已明確計(jì)劃于科創(chuàng)板IPO，預(yù)計(jì)

標(biāo)簽：

宇樹科技
OpenAI推出GPT-5：AI大統(tǒng)一時(shí)代的到來(lái)？

推理與多模態(tài)的終極融合，將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日，OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個(gè)強(qiáng)大模型，特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”，為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開(kāi)發(fā)者體驗(yàn)負(fù)

標(biāo)簽：

chatgpt

中小AI企業(yè)，沒(méi)有“高考”資格

高考一結(jié)束，忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問(wèn)……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉，去年高考期間，大模型的成績(jī)才勉強(qiáng)過(guò)一本線，今年集體晉升985。據(jù)悉，豆包甚至過(guò)了清北的錄取線。頭部大模型在高考“考場(chǎng)”上玩得不亦樂(lè)乎，中小AI創(chuàng)企的處境卻日益尷尬

標(biāo)簽：

ai智能
大模型搶灘高考志愿填報(bào)，能否頂替「張雪峰」們？

文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績(jī)放榜后，數(shù)千萬(wàn)考生和家長(zhǎng)將迎來(lái)另一場(chǎng)硬仗——填報(bào)志愿。今年，這一領(lǐng)域迎來(lái)了AI的全面介入，多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品，為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù)，2023年中國(guó)高考志愿填報(bào)市場(chǎng)付費(fèi)規(guī)模約9.5億元，近九成考生愿意借助志愿填報(bào)服

標(biāo)簽：

大模型
蘋果AI掉隊(duì)？現(xiàn)在唱衰或許還為時(shí)過(guò)早

蘋果還沒(méi)從WWDC25的“群嘲”中走出，又迎來(lái)了一次新的痛擊。據(jù)路透社報(bào)道，21日，蘋果公司遭到股東集體起訴，被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語(yǔ)音助手Siri所需的時(shí)間，導(dǎo)致iPhone銷量受影響、股價(jià)下滑，構(gòu)成證券欺詐。在這份訴訟中，庫(kù)克、首席財(cái)務(wù)官凱文·帕雷克及前首席財(cái)務(wù)官盧卡·馬埃

標(biāo)簽：

蘋果公司

ai智能
DeepSeek、豆包向左，盤古大模型向右

華為的盤古大模型終于推出新版本了。6月20日華為云計(jì)算CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線，盤古大模型5.5同步發(fā)布。不過(guò)，當(dāng)前國(guó)內(nèi)的AI大模型競(jìng)爭(zhēng)可謂是相當(dāng)激烈，華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從

標(biāo)簽：

deepseek

豆包ai

盤古大模型

加載更多

99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

業(yè)界最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型正式開(kāi)源

相關(guān)文章

首屆通義千問(wèn)AI挑戰(zhàn)賽開(kāi)賽，參賽者可暢玩通義開(kāi)源模型家族

最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型開(kāi)源發(fā)布

掰開(kāi)安卓手機(jī)，滿屏都是三個(gè)字：大模型

加速大模型落地，容聯(lián)云發(fā)布多款生成式智能服務(wù)

從搜索到大模型，百度商業(yè)化的“驚險(xiǎn)一躍”

Manus官網(wǎng)突現(xiàn)“地區(qū)不可用”提示，中國(guó)區(qū)業(yè)務(wù)戰(zhàn)略性調(diào)整引關(guān)注

摩爾線程估值超 250 億，「中國(guó)英偉達(dá)」沖刺科創(chuàng)板

百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

百度智能云PaddleOCR 3.1正式發(fā)布：關(guān)鍵能力支持MCP

宇樹科技加速?zèng)_刺科創(chuàng)板IPO，人形機(jī)器人龍頭估值飆至120億元

OpenAI推出GPT-5：AI大統(tǒng)一時(shí)代的到來(lái)？

中小AI企業(yè)，沒(méi)有“高考”資格

大模型搶灘高考志愿填報(bào)，能否頂替「張雪峰」們？

蘋果AI掉隊(duì)？現(xiàn)在唱衰或許還為時(shí)過(guò)早

DeepSeek、豆包向左，盤古大模型向右

熱門排行

編輯推薦

業(yè)界最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型正式開(kāi)源

相關(guān)文章

熱門排行

編輯推薦

業(yè)界最強(qiáng)開(kāi)源大模型來(lái)了！通義千問(wèn)720億參數(shù)模型正式開(kāi)源