2025年6月17日,字節(jié)跳動(dòng)旗下智能助手豆包正式在電腦版及網(wǎng)頁(yè)端全量上線“AI播客”功能,用戶只需上傳PDF文檔或網(wǎng)頁(yè)鏈接,即可一鍵生成由兩位AI主播演繹的對(duì)話式播客節(jié)目。這一創(chuàng)新功能憑借高度擬人化的語(yǔ)音效果和秒級(jí)轉(zhuǎn)化效率,迅速引發(fā)內(nèi)容創(chuàng)作者、學(xué)生群體及職場(chǎng)人士的關(guān)注。
技術(shù)突破:真人級(jí)語(yǔ)音交互,秒級(jí)生成播客
據(jù)豆包團(tuán)隊(duì)介紹,該功能基于其自主研發(fā)的語(yǔ)音播客模型,通過(guò)流式模型與端到端技術(shù),將文本創(chuàng)作到音頻生成的全流程壓縮至數(shù)秒內(nèi)完成。生成的播客不僅音色自然、停頓合理,還融入了日常對(duì)話中的語(yǔ)氣詞和附和習(xí)慣,例如“嗯”“對(duì)”“其實(shí)呢”等口語(yǔ)化表達(dá),使對(duì)話更貼近真人交流場(chǎng)景。
內(nèi)測(cè)用戶反饋顯示,該功能尤其適用于處理長(zhǎng)篇學(xué)習(xí)資料或行業(yè)報(bào)告。例如,學(xué)生可將課堂PPT拍照上傳,AI自動(dòng)提取文字后生成深度講解的播客;職場(chǎng)人則可將網(wǎng)頁(yè)文章轉(zhuǎn)化為通勤路上的“聽(tīng)書(shū)”內(nèi)容。一位參與測(cè)試的用戶表示:“以前看一篇萬(wàn)字報(bào)告要半小時(shí),現(xiàn)在直接生成播客,邊走邊聽(tīng)效率翻倍。”
場(chǎng)景覆蓋:學(xué)習(xí)、工作、娛樂(lè)全適配
目前,豆包AI播客支持多種輸入方式:
文檔轉(zhuǎn)播客:上傳PDF、Word等格式文件,AI自動(dòng)解析內(nèi)容并生成對(duì)話; 鏈接轉(zhuǎn)播客:支持微信公眾號(hào)、知乎、騰訊文檔等公開(kāi)鏈接,一鍵抓取文字生成音頻; 拍照轉(zhuǎn)播客:通過(guò)手機(jī)拍攝PPT、書(shū)籍等紙質(zhì)資料,OCR識(shí)別后轉(zhuǎn)化為播客。
此外,用戶可自由選擇主播音色(如“新聞主播風(fēng)”“輕松對(duì)話風(fēng)”)及對(duì)話模式(男女對(duì)談、雙男或雙女組合),甚至自定義角色身份(如“專(zhuān)家訪談”“師生討論”)。例如,將學(xué)術(shù)論文轉(zhuǎn)化為“教授與學(xué)生探討”的播客,或把產(chǎn)品說(shuō)明書(shū)改寫(xiě)為“客服與用戶問(wèn)答”形式,極大提升了內(nèi)容的趣味性和可聽(tīng)性。
行業(yè)對(duì)比:差異化優(yōu)勢(shì)凸顯
與市場(chǎng)上同類(lèi)產(chǎn)品相比,豆包AI播客的核心競(jìng)爭(zhēng)力在于“低成本、高時(shí)效、強(qiáng)互動(dòng)”。例如,有道文檔FM雖支持多格式輸入,但生成音頻需手動(dòng)調(diào)整角色分配;而谷歌NotebookLM的中文播客功能則存在語(yǔ)言適配性不足的問(wèn)題。豆包團(tuán)隊(duì)表示,其模型通過(guò)海量中文對(duì)話數(shù)據(jù)訓(xùn)練,更符合國(guó)內(nèi)用戶的表達(dá)習(xí)慣。
目前,該功能已在豆包電腦版、網(wǎng)頁(yè)端及扣子空間平臺(tái)上線,手機(jī)端App也已開(kāi)啟小流量測(cè)試,預(yù)計(jì)近期全量開(kāi)放。豆包產(chǎn)品負(fù)責(zé)人透露,未來(lái)將推出“多角色扮演”功能,允許用戶上傳劇本或故事大綱,由AI生成多人對(duì)話的廣播劇,進(jìn)一步拓展內(nèi)容創(chuàng)作邊界。
市場(chǎng)影響:重新定義“聽(tīng)書(shū)”體驗(yàn)
隨著AI播客功能的普及,內(nèi)容消費(fèi)場(chǎng)景正從“閱讀”向“聆聽(tīng)”遷移。艾瑞咨詢數(shù)據(jù)顯示,2025年中國(guó)有聲內(nèi)容市場(chǎng)規(guī)模預(yù)計(jì)突破800億元,其中AI生成內(nèi)容占比將達(dá)30%。豆包AI播客的推出,不僅降低了播客創(chuàng)作門(mén)檻,也為教育、出版、傳媒等行業(yè)提供了新的內(nèi)容分發(fā)渠道。
例如,出版社可將新書(shū)章節(jié)轉(zhuǎn)化為播客試聽(tīng)片段,吸引讀者購(gòu)買(mǎi);企業(yè)則可將產(chǎn)品白皮書(shū)轉(zhuǎn)化為音頻,通過(guò)播客平臺(tái)觸達(dá)更多用戶。一位教育行業(yè)從業(yè)者評(píng)價(jià):“AI播客讓知識(shí)傳播更碎片化、更沉浸,未來(lái)或成為在線教育的重要工具。”
結(jié)語(yǔ):AI賦能內(nèi)容創(chuàng)作的新里程碑
豆包AI播客功能的上線,標(biāo)志著AI技術(shù)在內(nèi)容生成領(lǐng)域的又一次突破。從文本到音頻的“一鍵轉(zhuǎn)化”,不僅解放了用戶的雙手,更讓知識(shí)獲取變得更加高效、便捷。隨著技術(shù)的持續(xù)迭代,AI播客或?qū)⒊蔀槊總€(gè)人口袋里的“私人電臺(tái)”,重新定義信息傳播與消費(fèi)的方式。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
四個(gè)月前邀請(qǐng)碼炒至10萬(wàn)元,如今官網(wǎng)變灰、社交賬號(hào)清空,這家AI新貴的閃電遷移折射中國(guó)科技企業(yè)出海潮涌。7月11日,打開(kāi)Manus官網(wǎng)的用戶發(fā)現(xiàn)一則突兀提示:“Manus在你所在的地區(qū)不可用”。而就在不久前,這個(gè)位置還顯示著“Manus中文版本正在開(kāi)發(fā)中”的樂(lè)觀聲明。同時(shí),Manus官方微博和小紅書(shū)
文/十界來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)圍繞算力自主的競(jìng)賽,正在科創(chuàng)板上演。近日,國(guó)產(chǎn)全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書(shū),擬募資約80億人民幣,成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者,也打響了“國(guó)產(chǎn)英偉達(dá)”上市的第一槍。據(jù)招股書(shū)顯示,摩爾線程自2020年成立以來(lái),主營(yíng)全功能GPU芯片的研發(fā)與銷(xiāo)售,以自主
“AI大模型六小虎”百川智能危機(jī)重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞,百川智能的聯(lián)合創(chuàng)始人離職,這是王小川入局AI的第一道大坎。接下的成敗非常關(guān)鍵:(1)拿下河北(2)學(xué)習(xí)科大訊飛百川智能離職高端概覽:(1)2025年7月10日,百川智能技術(shù)聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的
百度AI團(tuán)隊(duì)今日正式推出PaddleOCR3.1版本,以突破性的多語(yǔ)言組合識(shí)別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級(jí)標(biāo)志著OCR領(lǐng)域首次實(shí)現(xiàn)對(duì)同一文檔內(nèi)任意混合語(yǔ)言文本的精準(zhǔn)識(shí)別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場(chǎng)
“宇樹(shù)已形成硬件、算法、場(chǎng)景聯(lián)動(dòng)的業(yè)務(wù)飛輪,自研率超95%的技術(shù)壁壘讓其成為全球機(jī)器人賽道不可忽視的中國(guó)力量。”首程資本管理合伙人朱方文在追加投資時(shí)如是評(píng)價(jià)。7月7日,據(jù)每日經(jīng)濟(jì)新聞從宇樹(shù)科技投資方處獲悉,國(guó)內(nèi)人形機(jī)器人領(lǐng)軍企業(yè)宇樹(shù)科技(UnitreeRobotics)已明確計(jì)劃于科創(chuàng)板IPO,預(yù)計(jì)
推理與多模態(tài)的終極融合,將徹底終結(jié)用戶在不同模型間切換的煩惱。7月7日,OpenAI正式確認(rèn)將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產(chǎn)品將整合現(xiàn)有的多個(gè)強(qiáng)大模型,特別是融合專(zhuān)注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”,為用戶提供前所未有的統(tǒng)一體驗(yàn)。OpenAI開(kāi)發(fā)者體驗(yàn)負(fù)
高考一結(jié)束,忙壞了海內(nèi)外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問(wèn)……掀起了一波“AI趕考”大戰(zhàn)。據(jù)悉,去年高考期間,大模型的成績(jī)才勉強(qiáng)過(guò)一本線,今年集體晉升985。據(jù)悉,豆包甚至過(guò)了清北的錄取線。頭部大模型在高考“考場(chǎng)”上玩得不亦樂(lè)乎,中小AI創(chuàng)企的處境卻日益尷尬
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)每年高考成績(jī)放榜后,數(shù)千萬(wàn)考生和家長(zhǎng)將迎來(lái)另一場(chǎng)硬仗——填報(bào)志愿。今年,這一領(lǐng)域迎來(lái)了AI的全面介入,多家互聯(lián)網(wǎng)大廠和教育公司紛紛推出智能志愿填報(bào)產(chǎn)品,為考生提供院校和專(zhuān)業(yè)選擇建議。據(jù)艾媒咨詢數(shù)據(jù),2023年中國(guó)高考志愿填報(bào)市場(chǎng)付費(fèi)規(guī)模約9.5億元,近九成考生愿意借助志愿填報(bào)服
蘋(píng)果還沒(méi)從WWDC25的“群嘲”中走出,又迎來(lái)了一次新的痛擊。據(jù)路透社報(bào)道,21日,蘋(píng)果公司遭到股東集體起訴,被指在信息披露中低估了將先進(jìn)生成式AI整合進(jìn)語(yǔ)音助手Siri所需的時(shí)間,導(dǎo)致iPhone銷(xiāo)量受影響、股價(jià)下滑,構(gòu)成證券欺詐。在這份訴訟中,庫(kù)克、首席財(cái)務(wù)官凱文·帕雷克及前首席財(cái)務(wù)官盧卡·馬埃
華為的盤(pán)古大模型終于推出新版本了。6月20日華為云計(jì)算CEO張平安宣布基于CloudMatrix384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,盤(pán)古大模型5.5同步發(fā)布。不過(guò),當(dāng)前國(guó)內(nèi)的AI大模型競(jìng)爭(zhēng)可謂是相當(dāng)激烈,華為的盤(pán)古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤(pán)古大模型5.5能否從