清華學霸引爆“長文本”大戰(zhàn)，大模型的應用前景清晰了嗎？

2024-04-02 13:30 來源：A5專欄我來投稿撤稿糾錯

文 | 智能相對論

作者 | 沈浪

Long-LLM（長文本大模型）時代似乎來得有些突然，而引爆這場熱潮的，竟是一家由清華學霸牽頭的本土AI初創(chuàng)企業(yè)。

前不久，月之暗面（Moonshot AI）公司宣布旗下對話式 AI 助理產品 Kimi 應用現已支持200萬字無損上下文輸入。

對比去年10月份Kimi上線時僅支持的20萬字，這一波升級直接提升了10倍文本處理能力，同時也引起了強烈的市場反應，特別是在資本市場，Kimi概念股應運而生，諸如九安醫(yī)療、華策影視、中廣天擇等都受益于Kimi概念而實現了股價不同程度的漲幅。

這些刺激更讓大模型領域徹底卷起了長文本大戰(zhàn)。

01 “長文本”大戰(zhàn)，卷的不是字數而是財力

阿里率先完成自家的大模型產品升級，強化長文本處理能力，免費面向大眾開放最高1000萬字的長文本處理能力。

360則緊隨其后，宣布旗下360智腦正式內測500萬字的長文本功能，并在360AI瀏覽器開放給用戶使用。

而百度也宣布在下個月進行版本升級，開放長文本能力，文字范圍會在200萬-500萬字。

目前，文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字，Claude3200k上下文約16萬漢字。

可以說，這一波熱潮直接把國內的大模型廠商一下子都拉進了百萬量級的長文本競賽，而主流廠商的入局也為這場“長文本”大戰(zhàn)增添了很多看頭。

目前來看，“長文本”大戰(zhàn)的賽點主要呈現在兩個方面。

一方面，是大模型的支持文本參數。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等，都在極力向市場爭“彩頭”，告訴用戶自家的長文本處理能力足夠“長”。

另一方面，是長文本處理能力的開放程度。有意思的是，Kimi是免費開放給用戶使用的，阿里通義千問的長文本處理功能也是免費的，360智腦、百度文心一言也沒有要收費的意思。——以“長文本”大戰(zhàn)為例，今年的大模型競爭遠比去年要“卷”得多。

還記得去年大火的妙鴨相機，以及各式各樣的圖片生成式服務，都或多或少地通過各種形式如充值、辦會員等，要求用戶付費才能體驗。

今年大模型領域的這把“火”燒得旺，也燒的離奇地“free”。

為什么？

Kimi自升級以來，就有大量用戶不斷涌入，激增的流量更是一度讓月之暗面（Moonshot AI）的服務器承受了巨大的壓力，一度陷入宕機，旗下的App和小程序都無法正常使用。

根據月之暗面（Moonshot AI）發(fā)布的官方消息，從3.20觀測到流量異常增高后，已經進行了5次擴容工作。推理資源會持續(xù)配合流量進行擴容，以盡量承載持續(xù)增長的用戶量。

簡單來說，用戶對長文本功能是非常有興趣的，相關的市場需求還在保持持續(xù)性的、爆炸性的增長。同時，大量的用戶涌進，不僅提高了大模型產品的知名度，更重要的是在大量用戶的基礎上通過類似于UGC的模式去探索大模型的應用，或許更能進一步推動Long-LLM（長文本大模型）的商業(yè)化進程。

當然，在這個過程中，不可避免地就得投入大量資金，一旦商業(yè)化加速，大模型廠商就得做好“卷”財力的準備。

阿里通義千問目前免費對所有人開放高達萬頁的文檔處理能力，如果要計算成本，按照目前最便宜的市價0.1元/頁，10000頁的文檔光解析費用就要1000元，這還不包括解析完成之后大模型處理文檔的成本?？紤]到通義千問網頁、APP、釘釘等多個端口的用戶基數，需要投入的資金恐怕不會是個小數目。

大模型的商業(yè)化在開始階段并非“賺錢”，而是“燒錢”。

02 長文本，直接“接駁”商業(yè)化場景

在大模型的商業(yè)化進程上，長文本的爆火是很關鍵的一環(huán)。

就大模型的技術原理而言，解決長文本問題是必要的。因為文本長度的提高，對應的模型能解決問題的邊界也將大幅提升，兩者呈現出明顯的正向關系。

傳統(tǒng)的文本處理模型受限于訓練結構，可支持的文本范圍都不算長，在處理復雜任務和深度專業(yè)知識（這一類知識往往都是長篇巨著）時，只能拆解輸入訓練，由此就有可能導致輸出的結果上下文邏輯不連貫不順暢等問題。

區(qū)別于傳統(tǒng)的文本處理模型，長文本模型就具備更準確的文本理解和生成能力以及更強大的跨領域遷移能力。這對于打造垂直領域的行業(yè)專家是一個非常必要的能力支持，比如面向一些長篇巨制的醫(yī)療文獻、法律文件、財務報告等，長文本模型就具備更好的理解能力，對應完成跨領域學習和應用，從而打造出更專業(yè)的醫(yī)療助理、法律助理以及金融助理等應用。

話不多說，實踐一下。

在這里，「智能相對論」向阿里通義千問相繼“投喂”了幾本長達數百頁的專業(yè)書籍，涵蓋以《高產母豬飼養(yǎng)技術有問必答》為代表的農業(yè)養(yǎng)殖、以《犬貓營養(yǎng)需要》為代表的寵物喂養(yǎng)等等小眾領域。

結果所能實現的效果確實令人驚訝，阿里通義千問不僅能高度概括總結這些長篇巨著的主要內容，還能有針對性的給出具體篇章的知識解答。比如，在《高產母豬飼養(yǎng)技術有問必答》一書中，「智能相對論」向其提問“夏季高溫提問應該如何飼養(yǎng)母豬？”很快就得到了書中的精煉解答。

這意味著什么？只要用戶有足夠多的專業(yè)書籍“投喂”給大模型，那么大模型就可以成長為一個專業(yè)的專家助理，幫助用戶快速解答相關專業(yè)問題。

在日常生活中，或許有很多書籍是我們沒辦法去仔細閱讀和學習的，但是只要有長文本大模型予以支持，那么基本上人人都能創(chuàng)造一個專業(yè)的垂直領域助理。

這或許會顛覆現在我們獲取信息、知識的渠道，去百度搜索或是去知乎提問、亦或是去小紅書討論這些路徑都將被替代。

在Kimi開放20萬字文本處理能力的時候，其做了一個簡單的對比，20萬字等于什么？答案是等于先秦的全部古籍。隨著長文本大模型進入百萬量級的迭代，那么這些能力還能實現進一步的進化，對應所賦予場景應用的機會就是無限的。

如今，在AI領域，Agent的話題也很火，被認為是下一個主流的應用形態(tài)。那么，打造Agent的關鍵是什么？答案正是大模型的長文本處理能力。

比如，Kimi就在幫助元隆雅圖等公司進行營銷升級，基于長文本處理能力來提供爆品文案分析、文案寫作、市場分析、輔助營銷策劃等功能。

盡管現在很多相關的應用還處在探索階段，但是誰又能確定下一個爆款應用不是出自自家的大模型+某個C端用戶的想法/某個企業(yè)客戶的業(yè)務融合？正因如此，大模型廠商們才不顧一切的升級并開放長文本功能，為下一場應用上的爆火做準備。

目前，長本文的火爆還只是技術上的，接下來的爆點大概率將是應用上的爆發(fā)。

03 寫在最后

2024年是大模型大規(guī)模走向商業(yè)化的關鍵一年。從Kimi的火爆程度來看，以長文本為代表的技術迭代走向C端引發(fā)了非常積極的反饋。同時，在「智能相對論」的實踐中，也預感這一能力隨著技術的成熟和完善，必然會在C端用戶的手中被“玩出花來”。

只是目前很多的“玩法”還缺乏打磨，顯得比較粗糙。OpenAI在發(fā)布GPT商店時，就期望要打造一個全新的生態(tài)，人人都能創(chuàng)造自己的專屬GPTs。

現在，擺在大眾面前的長文本熱潮，其實就是一個全民時代到來的信號。只要用戶有書，會投喂，那么同樣可以在國內的大模型平臺上打造出屬于自己想要的專業(yè)助理，進而延伸到應用端的火爆。

當然，在這個過程中，書籍的版權問題、平臺的審核問題以及巨大的流量涌入所帶來的諸多挑戰(zhàn)和問題，也是大模型走向商業(yè)化的難點。但是，其根本的方向是清晰的，Long-LLM（長文本大模型）時代已經拉開序幕，從技術到應用，接下來大模型廠商們有得卷了。

說實在，就目前各大廠商公布的參數，從500萬到1000萬，基本上也足夠用了。大模型在長文本技術層面或許不會再有什么值得卷了，哪怕是有也只是背地里正常迭代和發(fā)展。

接下來的爆點只能是往應用層面來看。不管是To C還是To B，誰家的平臺最先把大眾化的應用探索并驗證出來，再加以打磨推向大眾市場，那么誰就有可能成為下一個市場的寵兒。

*本文圖片均來源于網絡

此內容為【智能相對論】原創(chuàng)，

僅代表個人觀點，未經授權，任何人不得以任何方式使用，包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡，且未核實版權歸屬，不作為商業(yè)用途，如有侵犯，請作者與我們聯系。

•AI產業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能十萬個為什么》

•【重點關注領域】智能家電（含白電、黑電、智能手機、無人機等AIoT設備）、智能駕駛、AI+醫(yī)療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

靠“虛擬伴侶”賺錢的AI獨角獸，上市有點懸

虛擬伴侶，亂象叢生

標簽：

ai智能
Manus官網突現“地區(qū)不可用”提示，中國區(qū)業(yè)務戰(zhàn)略性調整引關注

四個月前邀請碼炒至10萬元，如今官網變灰、社交賬號清空，這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日，打開Manus官網的用戶發(fā)現一則突兀提示：“Manus在你所在的地區(qū)不可用”。而就在不久前，這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時，Manus官方微博和小紅書

標簽：

ai智能
摩爾線程估值超 250 億，「中國英偉達」沖刺科創(chuàng)板

文/十界來源/節(jié)點財經一場圍繞算力自主的競賽，正在科創(chuàng)板上演。近日，國產全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書，擬募資約80億人民幣，成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者，也打響了“國產英偉達”上市的第一槍。據招股書顯示，摩爾線程自2020年成立以來，主營全功能GPU芯片的研發(fā)與銷售，以自主
百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞，百川智能的聯合創(chuàng)始人離職，這是王小川入局AI的第一道大坎。接下的成敗非常關鍵：(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽：(1)2025年7月10日，百川智能技術聯合創(chuàng)始人謝劍將離職。他是百川只能的

標簽：

人工智能

ai智能
百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

百度AI團隊今日正式推出PaddleOCR3.1版本，以突破性的多語言組合識別（MultilingualCompositionPerception,MCP）技術為核心，徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現對同一文檔內任意混合語言文本的精準識別，為全球化企業(yè)、跨境業(yè)務及多元文化場

標簽：

ai智能

ai技術
宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

“宇樹已形成硬件、算法、場景聯動的業(yè)務飛輪，自研率超95%的技術壁壘讓其成為全球機器人賽道不可忽視的中國力量?！笔壮藤Y本管理合伙人朱方文在追加投資時如是評價。7月7日，據每日經濟新聞從宇樹科技投資方處獲悉，國內人形機器人領軍企業(yè)宇樹科技（UnitreeRobotics）已明確計劃于科創(chuàng)板IPO，預計

標簽：

宇樹科技

OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

推理與多模態(tài)的終極融合，將徹底終結用戶在不同模型間切換的煩惱。7月7日，OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產品將整合現有的多個強大模型，特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”，為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負

標簽：

chatgpt
中小AI企業(yè)，沒有“高考”資格

高考一結束，忙壞了海內外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據悉，去年高考期間，大模型的成績才勉強過一本線，今年集體晉升985。據悉，豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎，中小AI創(chuàng)企的處境卻日益尷尬

標簽：

ai智能
大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

文/二風來源/節(jié)點財經每年高考成績放榜后，數千萬考生和家長將迎來另一場硬仗——填報志愿。今年，這一領域迎來了AI的全面介入，多家互聯網大廠和教育公司紛紛推出智能志愿填報產品，為考生提供院校和專業(yè)選擇建議。據艾媒咨詢數據，2023年中國高考志愿填報市場付費規(guī)模約9.5億元，近九成考生愿意借助志愿填報服

標簽：

大模型
蘋果AI掉隊？現在唱衰或許還為時過早

蘋果還沒從WWDC25的“群嘲”中走出，又迎來了一次新的痛擊。據路透社報道，21日，蘋果公司遭到股東集體起訴，被指在信息披露中低估了將先進生成式AI整合進語音助手Siri所需的時間，導致iPhone銷量受影響、股價下滑，構成證券欺詐。在這份訴訟中，庫克、首席財務官凱文·帕雷克及前首席財務官盧卡·馬埃

標簽：

蘋果公司

ai智能

加載更多

99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

清華學霸引爆“長文本”大戰(zhàn)，大模型的應用前景清晰了嗎？

相關文章

靠“虛擬伴侶”賺錢的AI獨角獸，上市有點懸

Manus官網突現“地區(qū)不可用”提示，中國區(qū)業(yè)務戰(zhàn)略性調整引關注

摩爾線程估值超 250 億，「中國英偉達」沖刺科創(chuàng)板

百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

中小AI企業(yè)，沒有“高考”資格

大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

蘋果AI掉隊？現在唱衰或許還為時過早

熱門排行

編輯推薦

清華學霸引爆“長文本”大戰(zhàn)，大模型的應用前景清晰了嗎？

相關文章

熱門排行

編輯推薦

清華學霸引爆“長文本”大戰(zhàn)，大模型的應用前景清晰了嗎？