ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

2024-05-11 11:01 來源：互聯(lián)網我來投稿撤稿糾錯

隨著人工智能技術的飛速發(fā)展，大語言模型(Large Language Models, LLMs)在各行各業(yè)的應用日益廣泛，尤其是在軟件開發(fā)、數據分析、客戶服務等領域。蘑菇云創(chuàng)客空間[445期開放夜] 就以“ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您”這樣的主題，開展了一次深度的大語言模型的測評。開放夜現(xiàn)場測評了十幾個國內外大語言模型，測評角度從邏輯、數學、翻譯、倫理等方面，深入探討和體驗了這些大語言模型的實際效能。

測評的大語言模型：

1.Kimi 智能助手：由月之暗面科技有限公司開發(fā)的先進AI。

2.智譜清言：由智言科技開發(fā)的大語言模型，以深度學習和自然語言處理技術見長。

3.訊飛星火：科大訊飛推出的創(chuàng)新語言模型。

4.文心一言：百度的前沿語言模型，致力于理解和生成自然語言。

5.豆包：專注于提供個性化的智能對話服務。

6.通義千問：以廣泛的知識庫和靈活的對話能力著稱。

7.海螺AI：新興的語言模型，擅長處理復雜的語言任務。

8.騰訊混元助手：騰訊推出的多功能AI助手。

9.Sider: 是由日本公司Sider開發(fā)的大語言模型。

10.ChatGPT：由OpenAI開發(fā)，國際上廣受認可的更大規(guī)模、功能更全面的語言模型。

11.Claude：Anthropic開發(fā)的先進語言模型，注重安全性和可靠性。

12.groq：以其專為AI設計的硬件加速器而聞名。

13.Gemini: OpenAI 開發(fā)的較小規(guī)模的語言模型，旨在提供更高效的計算和資源利用。

14.Mixtral：開源人工智能初創(chuàng)公司 Mistral AI 開發(fā)的超越GPT-3.5的AI模型

測評問題一: 雞兔同籠的數學問題

雞兔同籠是一個經典的數學問題，通過觀察雞兔的頭和腳的數量關系，可以利用代數方程來解決問題，從而確定籠子里雞和兔子的數量。這個問題常常展示了代數方程組的應用。

針對雞兔同籠的問題，除了Gemini Pro沒有得出正確的結果，其余的大語言模型都可以給出正確結果。

測評問題二：翻譯（詩句中翻英）

詩人馬致遠的詩句“斷腸人在天涯”，描寫了“夕陽向西緩緩落下，只有孤獨的旅人漂泊在遙遠的地方。”詩句的翻譯涉及到文化差異和詩人獨特情感。Mixtral 的語言模型正確的解釋了詩句本身的含義，幫助翻譯者很好地理解這句詩句。 Claude的語言模型對于詩句的本身理解是不正確的。

這句詩翻譯家許淵沖翻譯為“Far, far from home is the heartbroken one.”由此可見，大語言模型可以幫助翻譯者分析這句詩基本的意思，但是涉及文化層面的深層含義，還是做不到意譯的。

開放夜也探討了如下涉及生活、工作的一些問題，比如：

過年福字要倒著貼，那為什么不直接生產倒過來的福字呢?

收到公司的裁員通知郵件，你應該怎么回復郵件來保住工作?

一個烏龜掉進了井里，井里有30米深。烏龜白天爬3米，晚上滑下2米。問這只烏龜需要多長時間才能爬出井口?

DFRobot AIGC小組主理人夏青在開放夜的現(xiàn)場測評了十幾個國內外大語言模型，通過多維度問題的測評，他認為：對于處理綜合性問題，OpenAI的ChatGPT 4.0邏輯清楚，能提供非常有用的信息。盡管在回答一些較為復雜的問題上略顯不足，但在大多數場合下，其性能仍然令人滿意。然而，ChatGPT 4.0在國內的使用成本是一個不容忽視的問題，不僅涉及訂閱費用，也包括使用的技術門檻。

與此同時，Gemini和Claude等海外語言模型，盡管在遵循指令方面略顯不足，但已達到了實用水平。令人驚喜的是，國內的Qwen1.5 72b開源模型在中文理解和特定任務，幾乎能與ChatGPT4.0匹敵此外，其他開源模型如Mixtral和新發(fā)布的LLaMA3雖在邏輯性上略遜于商業(yè)模型如ChatGPT，但總體表現(xiàn)已超越了ChatGPT 3.5。

綜合分析來看，盡管ChatGPT 4.0仍然是目前市場上最優(yōu)秀的大語言模型，但不可忽視的是，無論是國際市場還是國內市場，其他廠商的模型均顯示出迅速的進步。開源模型的崛起也證明了開源社區(qū)在AI時代的巨大潛力。當前的大語言模型在處理理性問題方面表現(xiàn)一致，但通常無法提供情緒價值回應。例如，一些國內模型如“豆包”將展現(xiàn)其在情緒回應方面的潛力。這種能力的發(fā)展可能為未來陪伴型機器人的商業(yè)模型提供新的方向。

蘑菇云創(chuàng)客空間

蘑菇云創(chuàng)客空間是上海浦東的一家創(chuàng)客空間,是科技部授牌的首批國家級創(chuàng)客空間,由浦軟孵化器提供場地支持、上海智位機器人提供硬件及技術支持的一家為創(chuàng)客服務的開放式創(chuàng)客空間。擁有獨立的加工室、公共協(xié)作區(qū)域以及儲物、耗材商店,為硬件愛好者、程序員、設計師、DIY 發(fā)燒友等各類創(chuàng)客,甚至包括進行創(chuàng)新研發(fā)的科創(chuàng)團隊提供一個開放式的社區(qū)化會員空間。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

Manus官網突現(xiàn)“地區(qū)不可用”提示，中國區(qū)業(yè)務戰(zhàn)略性調整引關注

四個月前邀請碼炒至10萬元，如今官網變灰、社交賬號清空，這家AI新貴的閃電遷移折射中國科技企業(yè)出海潮涌。7月11日，打開Manus官網的用戶發(fā)現(xiàn)一則突兀提示：“Manus在你所在的地區(qū)不可用”。而就在不久前，這個位置還顯示著“Manus中文版本正在開發(fā)中”的樂觀聲明。同時，Manus官方微博和小紅書

標簽：

ai智能
摩爾線程估值超 250 億，「中國英偉達」沖刺科創(chuàng)板

文/十界來源/節(jié)點財經一場圍繞算力自主的競賽，正在科創(chuàng)板上演。近日，國產全功能GPU廠商摩爾線程遞交科創(chuàng)板招股書，擬募資約80億人民幣，成為今年上半年科創(chuàng)板擬募資規(guī)模最大的沖刺者，也打響了“國產英偉達”上市的第一槍。據招股書顯示，摩爾線程自2020年成立以來，主營全功能GPU芯片的研發(fā)與銷售，以自主
百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

“AI大模型六小虎”百川智能危機重重。這是前搜狗CEO王小川創(chuàng)辦的AI公司。昨天就爆出新聞，百川智能的聯(lián)合創(chuàng)始人離職，這是王小川入局AI的第一道大坎。接下的成敗非常關鍵：(1)拿下河北(2)學習科大訊飛百川智能離職高端概覽：(1)2025年7月10日，百川智能技術聯(lián)合創(chuàng)始人謝劍將離職。他是百川只能的

標簽：

人工智能

ai智能
百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

百度AI團隊今日正式推出PaddleOCR3.1版本，以突破性的多語言組合識別（MultilingualCompositionPerception,MCP）技術為核心，徹底重構復雜文檔處理邊界。此次升級標志著OCR領域首次實現(xiàn)對同一文檔內任意混合語言文本的精準識別，為全球化企業(yè)、跨境業(yè)務及多元文化場

標簽：

ai智能

ai技術
宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

“宇樹已形成硬件、算法、場景聯(lián)動的業(yè)務飛輪，自研率超95%的技術壁壘讓其成為全球機器人賽道不可忽視的中國力量。”首程資本管理合伙人朱方文在追加投資時如是評價。7月7日，據每日經濟新聞從宇樹科技投資方處獲悉，國內人形機器人領軍企業(yè)宇樹科技（UnitreeRobotics）已明確計劃于科創(chuàng)板IPO，預計

標簽：

宇樹科技
OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

推理與多模態(tài)的終極融合，將徹底終結用戶在不同模型間切換的煩惱。7月7日，OpenAI正式確認將在今年夏季推出新一代人工智能模型GPT-5。這一突破性產品將整合現(xiàn)有的多個強大模型，特別是融合專注推理能力的“O系列”與具備多模態(tài)功能的“GPT系列”，為用戶提供前所未有的統(tǒng)一體驗。OpenAI開發(fā)者體驗負

標簽：

chatgpt

中小AI企業(yè)，沒有“高考”資格

高考一結束，忙壞了海內外一眾大模型。豆包、DeepSeek、ChatGPT、元寶、文心一言、通義千問……掀起了一波“AI趕考”大戰(zhàn)。據悉，去年高考期間，大模型的成績才勉強過一本線，今年集體晉升985。據悉，豆包甚至過了清北的錄取線。頭部大模型在高考“考場”上玩得不亦樂乎，中小AI創(chuàng)企的處境卻日益尷尬

標簽：

ai智能
大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

文/二風來源/節(jié)點財經每年高考成績放榜后，數千萬考生和家長將迎來另一場硬仗——填報志愿。今年，這一領域迎來了AI的全面介入，多家互聯(lián)網大廠和教育公司紛紛推出智能志愿填報產品，為考生提供院校和專業(yè)選擇建議。據艾媒咨詢數據，2023年中國高考志愿填報市場付費規(guī)模約9.5億元，近九成考生愿意借助志愿填報服

標簽：

大模型
蘋果AI掉隊？現(xiàn)在唱衰或許還為時過早

蘋果還沒從WWDC25的“群嘲”中走出，又迎來了一次新的痛擊。據路透社報道，21日，蘋果公司遭到股東集體起訴，被指在信息披露中低估了將先進生成式AI整合進語音助手Siri所需的時間，導致iPhone銷量受影響、股價下滑，構成證券欺詐。在這份訴訟中，庫克、首席財務官凱文·帕雷克及前首席財務官盧卡·馬埃

標簽：

蘋果公司

ai智能
DeepSeek、豆包向左，盤古大模型向右

華為的盤古大模型終于推出新版本了。6月20日華為云計算CEO張平安宣布基于CloudMatrix384超節(jié)點的新一代昇騰AI云服務全面上線，盤古大模型5.5同步發(fā)布。不過，當前國內的AI大模型競爭可謂是相當激烈，華為的盤古大模型在眾多大模型中并不是十分出眾。華為云此次重磅推出的盤古大模型5.5能否從

標簽：

deepseek

豆包ai

盤古大模型

加載更多

99re6这里有精品热视频,久久综合九色欧美综合狠狠,国产精品久久久久久无毒不卡,av免费无插件在线观看,欧美放荡办公室videos

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

相關文章

Manus官網突現(xiàn)“地區(qū)不可用”提示，中國區(qū)業(yè)務戰(zhàn)略性調整引關注

摩爾線程估值超 250 億，「中國英偉達」沖刺科創(chuàng)板

百川智能高管集體跑路!王小川的醫(yī)療AI還能贏嗎?

百度智能云PaddleOCR 3.1正式發(fā)布：關鍵能力支持MCP

宇樹科技加速沖刺科創(chuàng)板IPO，人形機器人龍頭估值飆至120億元

OpenAI推出GPT-5：AI大統(tǒng)一時代的到來？

中小AI企業(yè)，沒有“高考”資格

大模型搶灘高考志愿填報，能否頂替「張雪峰」們？

蘋果AI掉隊？現(xiàn)在唱衰或許還為時過早

DeepSeek、豆包向左，盤古大模型向右

熱門排行

編輯推薦

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？

相關文章

熱門排行

編輯推薦

ChatGPT、Gemini、通義千問等一眾大語言模型，哪家更適合您？