“創(chuàng)新的速度比創(chuàng)新本身更重要。”埃隆·馬斯克曾這樣說到。
近日,由馬斯克所掌舵的特斯拉,在2024年世界人工智能大會上正式推出了第二代Optimus(擎天柱)人形機器人,距離第一代面世,僅過去9個月。
加速升級的人形機器人不負(fù)所望,成了今年WAIC大會(世界人工智能大會)的一大看點。除此以外,今年的WAIC大會還引發(fā)了哪些熱門話題?帶來了哪些前瞻指引?
開源和閉源,是互補關(guān)系
今年,華為盤古、百度文心、阿里通義、騰訊混元等國內(nèi)知名大模型悉數(shù)都參加了WAIC,大模型依舊是重頭戲之一。
大會開幕期間,在談及大模型閉源與開源的選擇時,兩大頭部企業(yè)陷入明顯分歧。百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏稱,模型開源無法做到眾人拾柴火焰高,商業(yè)化閉源模型才最能打。
阿里云CTO周靖人則重申了阿里云開源開放的選擇,并強調(diào)阿里兩年前決定將通義大模型開源開放,時至今日,通義千問已經(jīng)實現(xiàn)真正意義上的全尺寸、全模態(tài)開源,拉平了開源、閉源模型之間的差距。
相較而言,開源大模型和閉源大模型孰好孰壞,其實并沒有定論。
從技術(shù)層面來看,閉源由于不公開源代碼,安全性和服務(wù)質(zhì)量更高,而且可以通過銷售許可或提供基于模型的服務(wù)來盈利;但同時許可費高昂,外界難以審查監(jiān)管,而且升級迭代高度依賴內(nèi)部團(tuán)隊,速度有限。
開源則恰好相反,技術(shù)門檻和成本較低,吸引了全國范圍的開發(fā)者和研究者參與,創(chuàng)新和迭代速度更快,適配更多應(yīng)用領(lǐng)域,但無門檻的技術(shù)共享也帶來了權(quán)益被侵犯的風(fēng)險,質(zhì)量、穩(wěn)定性和安全性難以保證。
對比來看,閉源想要走向“成功”,唯一的路徑就是進(jìn)化為“超級應(yīng)用”,從而創(chuàng)造價值;而開源憑借獨有的兼容性打造了強有力的獲客手段。由此可見,看似截然不同的兩個方向背后,是由各自的商業(yè)利益驅(qū)使。
從應(yīng)用層面來看,開源和閉源并不像手機端的iOS系統(tǒng)或者安卓系統(tǒng)只能二選一,尤其在ToB的情況下,應(yīng)用端既需要技術(shù)共享也會考慮應(yīng)用安全性,還需要滿足多樣化需求。
對此,百川智能CEO王小川表示,預(yù)計未來將有80%的企業(yè)會用到開源大模型,因為閉源沒辦法對產(chǎn)品做更好的適配,或者成本特別高,閉源可以給剩下的20%提供服務(wù)。
由此可見,二者并不是非此即彼的對立關(guān)系,在不同產(chǎn)品和應(yīng)用場景中也可以是互補的關(guān)系。但歸根究底,大模型在發(fā)展之余如何創(chuàng)造價值,選擇開源還是閉源就不是核心問題,因為僅有基礎(chǔ)模型卻沒有應(yīng)用,就等同于一文不值。
AI落地的三大方向:大模型、機器人、終端產(chǎn)品
大模型作為人工智能大家族的組成部分,一直是熱議的話題之一。隨著WAIC 2024的落幕,AI應(yīng)用落地的最新趨勢也昭然若揭。
(一)大模型加速商業(yè)化
繼百模大戰(zhàn)后,大模型的“精耕細(xì)作”一直在持續(xù)。以ChatGPT和Sora為代表的大模型技術(shù),也已進(jìn)入新一輪迭代。從今年的WAIC來看,百度、阿里巴巴、騰訊、華為等行業(yè)巨頭帶來眾多新技術(shù)和新產(chǎn)品,展現(xiàn)了大模型在金融、醫(yī)療、政務(wù)等多個行業(yè)場景的應(yīng)用潛力。
截至目前,百度有千帆大模型平臺、文心一言,阿里有阿里云百煉、通義大模型,騰訊有騰訊云混元大模型、元寶大模型,字節(jié)跳動有火山方舟、豆包大模型等等。
在過去的2023年里,大模型的長文處理能力、數(shù)字能力、推理能力、RAG(檢索增強生成)、GPTs、多模態(tài)、原生應(yīng)用、開源等多方面都有大幅增強。同時,訓(xùn)練和部署成本、行業(yè)適配能力、幻想問題以及數(shù)據(jù)安全這四大挑戰(zhàn)也得以優(yōu)化和解決。
圖源來自數(shù)巔科技
在此基礎(chǔ)上,定制化的大模型給To B和To C業(yè)務(wù)帶來了非常深刻和徹底的改造,企業(yè)用戶和終端個人用戶也逐漸呈現(xiàn)剛性需求。基于此,To C產(chǎn)品可以通過不斷收集用戶反饋、積累模型的應(yīng)用實踐,來反哺ToB業(yè)務(wù),從而加速大模型商業(yè)化落地。
(二)機器人和AI高度結(jié)合
今年,人形機器人專區(qū)也是大會的一大亮點。在世博展覽館的中廳,18臺人形機器人組成陣列展示“才藝”,并與觀眾親切互動,可見機器人技術(shù)的協(xié)同效應(yīng)以及在"異構(gòu)群智"領(lǐng)域的重大突破。
隨著人形機器人和AI兩大領(lǐng)域的高速發(fā)展,產(chǎn)業(yè)進(jìn)入深度融合階段,AI大模型+人形機器人正掀起下一波技術(shù)熱潮。
從技術(shù)角度看,兩者在自然語言交互、知識庫與推理、多模態(tài)感知與決策、運動規(guī)劃、任務(wù)規(guī)劃與執(zhí)行、情感交互、持續(xù)學(xué)習(xí)等七個板塊均有結(jié)合應(yīng)用的可能性。
在實際應(yīng)用方面也已經(jīng)取得突破。比如WAIC 2024大會上,特斯拉的Optimus二代機器人將深度學(xué)習(xí)應(yīng)用于視覺感知,實現(xiàn)了精準(zhǔn)的目標(biāo)識別與抓取,而且可以直立行走,進(jìn)行路線規(guī)劃。
自然語言交互領(lǐng)域,Xiaomi CyberOne等人形機器人搭載大語言模型,實現(xiàn)了高自然度語音交互。情感交互領(lǐng)域,Hanson Robotics的Sophia機器人通過面部表情合成和聲音合成,實現(xiàn)了豐富的情感表達(dá)。
通過以上技術(shù)的融合,我們有望創(chuàng)造出具備感知、決策、規(guī)劃、控制、交互、學(xué)習(xí)等多維能力的人形機器人,最終賦予其真正的智能化、人性化。
(三)AI終端“新物種”涌現(xiàn)
除了大模型、人形機器人,AI的終端產(chǎn)品逐漸滲透至日常生活。正如三次工業(yè)革命,蒸汽時代誕生蒸汽機、電氣時代發(fā)明電燈泡、信息化時代創(chuàng)造計算機,每一件革命性的“新物種”都被應(yīng)用于終端場景,AI大航海時代的產(chǎn)物也將如此。
楊元慶展示AI PC新產(chǎn)品
今年,多個行業(yè)涌現(xiàn)了"終端新物種"。比如戴爾、聯(lián)想、華為的AI PC新產(chǎn)品、內(nèi)置大模型語音助手的雷鳥AR眼鏡X2 Lite、實現(xiàn)AI翻譯的時空壺同聲傳譯器X1,以及今年上半年被熱議最多的蘋果vision pro混合現(xiàn)實頭顯,等等。
追本溯源,終端產(chǎn)品的涌現(xiàn),主要得益于AI模型、AI應(yīng)用、AI硬件的協(xié)同發(fā)展。從AI產(chǎn)業(yè)結(jié)構(gòu)來看,產(chǎn)業(yè)鏈上游為基礎(chǔ)層,包括算力等,中游為算法和模型層,下游為應(yīng)用層。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕細(xì)作”,終端“新物種”應(yīng)運而生。
隨著AI生態(tài)和技術(shù)的不斷進(jìn)化,未來AI終端還將迎來架構(gòu)設(shè)計、交互方式、內(nèi)容、應(yīng)用生態(tài)等的全面創(chuàng)新和升級?;蛟S,我們會從提問“AI終端應(yīng)該長什么樣”,轉(zhuǎn)為好奇“AI終端會長什么樣”。
2024,開啟“AI+”時代
2024年,伴隨大數(shù)據(jù)處理、高性能計算、深度學(xué)習(xí)等技術(shù)的快速發(fā)展和成熟,人工智能已經(jīng)能夠解決大量的復(fù)雜問題,加上日益成熟的大模型技術(shù),人工智能的準(zhǔn)確度、效率、通用性、靈活性得到顯著提升。
應(yīng)用層面,隨著現(xiàn)代社會產(chǎn)生的數(shù)據(jù)開始爆發(fā)式增長,為人工智能的進(jìn)化提供了“養(yǎng)料”,人工智能得以更好地學(xué)習(xí)和理解現(xiàn)實世界。加之,個人用戶和企業(yè)客戶對于個性化、高效的服務(wù)需求日益增強。
在底層技術(shù)高速發(fā)展,以及市場需求的牽引下,人工智能(AI)已經(jīng)由“+AI”模式轉(zhuǎn)型至“AI+”模式的階段。
對比來看,早前的“+AI”階段,人工智能還只是一項補充技術(shù),被運用于傳統(tǒng)行業(yè)的既有業(yè)務(wù)流程和產(chǎn)品之中,目標(biāo)在于提升效率、解決特定問題。
如今的“AI+”階段,AI不再僅僅是業(yè)務(wù)流程的附屬部分,更是各行各業(yè)創(chuàng)新發(fā)展的重要驅(qū)動力,其核心在于數(shù)據(jù)驅(qū)動和自我學(xué)習(xí),利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行大量數(shù)據(jù)的訓(xùn)練,模擬人腦的學(xué)習(xí)機制,從而實現(xiàn)語音識別、圖像識別等多領(lǐng)域超越人類的表現(xiàn)。
這一階段跨越的完成,意味著AI從單純的技術(shù)附加工具轉(zhuǎn)向了引領(lǐng)行業(yè)變革的關(guān)鍵要素,從賦能單一功能升級為重塑整個業(yè)務(wù)形態(tài)。
業(yè)務(wù)形態(tài)的重塑具體到應(yīng)用場景,覆蓋了交通出行、生活服務(wù)、工業(yè)制造、文化傳播、醫(yī)療健康、農(nóng)村建設(shè)等多個領(lǐng)域。
AI+交通領(lǐng)域,在AI算法的加持下,車輛能夠處理海量的傳感器數(shù)據(jù),實現(xiàn)對車輛周圍環(huán)境的高精度感知。同時,還能預(yù)測其他車輛的行駛軌跡,為自動駕駛車輛提供決策依據(jù)。最重要的是,AI算法通過不斷學(xué)習(xí)和優(yōu)化,可以提升自動駕駛系統(tǒng)的性能和安全性。
AI+制造領(lǐng)域,由于大模型、機器學(xué)習(xí)、計算機視覺等細(xì)分技術(shù)實現(xiàn)突破,人工智能可以被應(yīng)用于制造業(yè)全流程各環(huán)節(jié),通過挖掘各單一環(huán)節(jié)的數(shù)據(jù)信息,進(jìn)而賦能整體的預(yù)測、生產(chǎn)、管理、決策,從而實現(xiàn)精細(xì)化管理,助力企業(yè)降本增效。
工信部數(shù)據(jù)顯示,經(jīng)過智能化改造,制造業(yè)研發(fā)周期縮短約20.7%、生產(chǎn)效率提升約34.8%、不良品率降低約27.4%、碳排放減少約21.2%。
長遠(yuǎn)來看,“AI+”的潛力已經(jīng)開始展現(xiàn)。
結(jié)語
2024年,AI應(yīng)用落地的想象力無效迸發(fā)。大模型加速商業(yè)化、AI 和人形機器人深度結(jié)合、終端新物種大量涌現(xiàn),大航海時代的歷史齒輪開始高速運轉(zhuǎn)。
不只是人工智能行業(yè),整個產(chǎn)業(yè)鏈也在加速擴容,AI+交通、AI+汽車、AI+文化、AI+制造等都開始從理論走向?qū)嵺`,走進(jìn)生產(chǎn)和生活。
“AI+”時代真的來了。
作者:琴聲奏響時
來源:松果財經(jīng)
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!
北京時間6月25日凌晨,多個地區(qū)的OpenAI用戶收到了一封來自官方的郵件。郵件顯示:“您所使用的APl流量來自O(shè)penAl目前不支持的地區(qū)。我們將從7月9日開始采取額外措施,阻止來自不在我們支持的國家和地區(qū)列表中的地區(qū)的APl接口?!彼^的API,就是應(yīng)用程序編程接口。開發(fā)者通過使用OpenAI的
每一次新舊代際轉(zhuǎn)換時,都會上演這樣的一幕:“暢想很多,落地很少”,AI原生應(yīng)用似乎也不例外。關(guān)于AI原生應(yīng)用的呼聲已經(jīng)持續(xù)一段時間,但普通用戶對“AI原生”依然陌生。除了新業(yè)態(tài)普及的周期性,AI原生應(yīng)用的爆發(fā)與否還涉及另一個議題,即怎么降低AI原生應(yīng)用開發(fā)的難度和門檻。剛剛結(jié)束的華為開發(fā)者大會202
近期,蘋果發(fā)布M4芯片,號稱“比當(dāng)今任何AIPC的任何神經(jīng)引擎都強!”緊隨其后微軟攜“Copilot+PCs”的概念加入AIPC激戰(zhàn)。截至目前,包括聯(lián)想、惠普、華為等多家主流PC廠商在內(nèi),已經(jīng)至少推出了超50款A(yù)IPC產(chǎn)品。AI重塑行業(yè)的機遇,誰都不想錯過。對于企業(yè)來說,能否積極擁抱AIPC十分關(guān)鍵
我花了2天時間,把松松最近1年的爆款文案+關(guān)鍵詞+情緒+口頭禪整理出來,4000多字的Prompt,都是一點點打出來的,再投喂到AI大模型里。使用的平臺包括:通義千問、文心一言、智譜清言。接下來我吐槽下這3家AI模型的創(chuàng)建指令(Prompt)的體驗:(注,本文只說指令功能,不說其他)(1)智譜清言智
四個月前邀請碼炒至10萬元,如今官網(wǎng)變灰、社交賬號清空,這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日,打開Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時,Manus官方微博和小紅書
文/十界來源/節(jié)點財經(jīng)一場圍繞算力自主的競賽,正在科創(chuàng)板上演。近日,國產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書,擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書顯示,摩爾線程自2020年成立以來,主營全功能GPU芯片的研發(fā)與銷售,以自主
“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場
“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機器人賽道不可忽視的中國力量?!笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日,據(jù)每日經(jīng)濟新聞從宇樹科技投資方處獲悉,國內(nèi)人形機器人領(lǐng)軍企業(yè)宇樹科技(UnitreeRobotics)已明確計劃于科創(chuàng)板IPO,預(yù)計
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個強大模型,特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負(fù)
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績才勉強過一本線,今年集體晉升985。據(jù)悉,豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎,中小AI創(chuàng)企的處境卻日益尷尬
文/二風(fēng)來源/節(jié)點財經(jīng)每年高考成績放榜后,數(shù)千萬考生和家長將迎來另一場硬仗——填報志愿。今年,這一領(lǐng)域迎來了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報產(chǎn)品,為考生提供院校和專業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國高考志愿填報市場付費規(guī)模約9.5億元,近九成考生愿意借助志愿填報服
蘋果還沒從WWDC25的“群嘲”中走出,又迎來了一次新的痛擊。據(jù)路透社報道,21日,蘋果公司遭到股東集體起訴,被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語音助手Siri所需的時間,導(dǎo)致iPhone銷量受影響、股價下滑,構(gòu)成證券欺詐。在這份訴訟中,庫克、首席財務(wù)官凱文·帕雷克及前首席財務(wù)官盧卡·馬埃
華為的盤古大模型終于推出新版本了。6月20日華為云計算CEO張平安宣布基于CloudMatrix384超節(jié)點的新一代昇騰AI云服務(wù)全面上線,盤古大模型5.5同步發(fā)布。不過,當(dāng)前國內(nèi)的AI大模型競爭可謂是相當(dāng)激烈,華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從