清华发布大模型性能报告：GPT-4第一更懂中文的还是百度

【资料图】

快科技8月10日消息，AI大模型成为今年的热点，OpenAI的ChatGPT一马当先，微软、谷歌、Meta紧随其后，国内科技巨头也迅速跟进，现在国内据说已经有上百款大模型问世了。

这么多大模型中，实力到底如何？日前清华大学新闻与传播学院发布了《大语言模型综合性能评估报告》，将国内外的大模型做了一番对比。

该报告还探讨了这些模型在不同知识领域，如创意写作、代码编程、舆情分析、历史知识等方面的回答情况，以及其在解决实际问题中的有效性和局限性。

从生成质量、使用与性能、安全与合规三个维度，对目前市场上的7个大型语言模型进行了全面的综合评估。

在这7款大模型中，GPT-4获得了毫无悬念的第一，第二名是百度的文心一言，其次是GPT-3.5，后面就是Claude、讯飞星火、阿里云的通义千问及昆仑的天工。

虽然GPT-4各方面领先，但是对国内用户来说，更懂中文的大模型才是关键，这方面百度的文心一言更好，在部分中文语义理解方面，文心一言以92%的得分率排名榜首，超越讯飞星火、GPT-4。

这跟百度的大模型包含大量中文文本有关系，因此能够更好地处理本土文化相关的内容。

关键词：

本田中国销量暴跌：落伍了！	微信正式备案小程序：9月1日上线需完成备案才能上架
蒲且(关于蒲且简述)	小仓山房诗文集（关于小仓山房诗文集介绍）
清华发布大模型性能报告：GPT-4第一更懂中文的还是百度	中远海运特运接入经营第二艘68000吨冰级多用途纸浆船
驱逐舰05冠军版连续3个月销量破万 7月销11994台	上海警方：某出入境服务公司何某等5人涉非法买卖外汇被查，案值逾亿元
天津法院发布打击治理电信网络诈骗犯罪典型案例	加入“油电同价”大军，奇瑞能否打破“混动四小龙”格局？
同曦新赛季更改队名：南京头排蘇酒队	背靠汽车之家6200万日活，平安车管家10%首付堪比“高息”贷款
合肥室内设计就业培训 CAD制图效果图提升培训班	烟台市蓬莱区：“三强三抓”打造最优公共资源交易环境
别克GL8的霸主结束了？	债务重组后富力仍陷流动性困局，子公司被判偿还12亿，另有商票逾期
中汽协：7月新能源汽车产销分别同比增长30.6%和31.6%	恒银科技连收5个涨停板
1至7月全国铁路完成固定资产投资3713亿元同比增长7%	市场监管总局：做好汛期食品安全工作
中汽协：7月新能源汽车销量同比增长31.6%	广州提出18条促进夜间消费措施推动国际消费中心城市建设再加速
【BT金融分析师】名创优品股价反弹90%，分析师称竞争优势也将得到改善	冠心病名医名方组成:制附片，生黄芪，川桂枝，生山楂，全瓜蒌，
广东省文化和旅游厅幼儿园招聘毕业生拟聘人员公示	江苏广源电线电缆有限公司被国网北京列入黑名单2年
32岁金晨出席活动大变样，嘴巴歪斜鼻子太尖，动脸后遗症真明显	23岁港女压力大脱发严重，中医治疗6周康复，附脱发原因/生发方法
212期财迷排列三预测奖号：十位号码统计	网红消费洪灾作秀，为流量没下限惹众怒
北京发布地质灾害黄色预警	魏征直谏的故事魏征直言进谏的故事
酷暑难耐[五律]	遭百万粉丝网红举报，杭州新东方全面停课！家长着急“希望尽快复课”，网友吵翻
唐山反腐最新通报医生亲眼见同学登上反腐通报基本情况讲解	专访金杜律师、国家药监局法律顾问黄建雯：医药反腐新常态，行业当前最大合规风险在哪？
韶关靶向发力精准施策系统施治深入开展专项整治	雷军“社恐”，网友“群嘲”
时隔4年，腾讯起诉多闪用户数据归属案将再次开庭	7000万英镑！瓜迪奥拉钦点巴西中场，西汉姆联再遭打击，帕奎塔或离队
工银瑞信养老基金Y份额规模明显增长	奥运会选拔针对性强，王曼昱获得球迷认可，需提高应变能力
香甜软糯，崇明这里的无花果熟啦！	首次应用机器学习技术协助开展神经梅毒诊断
第四届晋阳湖·数字经济发展峰会本月下旬举办聚焦算力发展等议题	她离婚后前夫追悔莫及，48岁却美似少女，人称台湾第一玉女歌后
赤峰到沈阳高铁时刻表_阜新到沈阳火车时刻表	大运盛会落幕，青春永不散场！看“青岛力量”闪耀成都大运会
上半年，茶咖酒焦灼搞加盟	快手首次正式公布大模型进展数字人产品“快手智播”亮相
时隔4年，腾讯起诉多闪用户数据归属案将再次开庭	宝山样板绿色先锋\|5G赋能华能上海石洞口第二电厂生产及管理流程数字化转型
2023上海书展活动表来了！有你感兴趣的吗？	金地威新产业研究院院长葛培健：产业地产面临结构性分化，四大新机遇影响未来开发运营模式
极氪：极氪001没有改款计划百万超跑即将发布	宝能汽车业务欠薪升级至7亿元，入局造车六年仅推出一款新车
立秋别忙贴秋膘	再过98天，四大生肖金银满屋，一帆风顺，万象更新
宏信建发2023年中期业绩发布中国大陆业务网点合计415个	理想汽车营收创新高二季度营收同比增长228.1%
长沙湘雅路过江隧道最新进展（持续更新）	高新区：“零距离”议事激活基层“微治理”
GT赛车电影的新预告片带我们进一步了解其真实故事	切尔西8000万镑报价凯塞多同时希望从利物浦手中截胡拉维亚
别克昂科拉PLUS八月上市！换双联屏预计14.59万起售	打破市场担忧！美国10年期新债发行获旺盛需求
陈椒华续追性骚包庇案　批蔡政府性平打假球	OpenAI 在中国申请注册“ GPT-5 ”商标，此前已在美国申请
10股主力资金净流入超1亿元	罗马诺：曼联有意帕瓦尔将其视为替代马奎尔的人选之一
环境减灾二号F星成功发射！全天候、全天时生态环境遥感监测又添新成员	中泰绿色科技创新合作蓬勃开展
剑河县着力打造健康医药十亿级产业集群助力黔货出山	学有所为！这群大学生以数字技术赋能秦岭保护助力乡村振兴
河北省人民医院整形科医生简介看看哪一位是你中意的	来安县施官镇贾龙民族村:党建引领发展共享乡村振兴
厦门最大雨水调蓄池拟年底建成	富力地产：阶段性资金紧张导致合计3072.74万元商票逾期
上海推进社区就业服务站点建设	男篮针对性训练，一人缺席，“周王李”五大内线同组在场
创新培训提升技能助力创业紫金县关工委积极助力“百千万工程”	宣汉创新“五单管理”志愿服务模式
CSGO加入好友房间失败怎么回事？CSGO加入好友房间失败解决办法	男篮悬了：小组最弱对手连招4员猛将全打过NBA1人系发展联盟MVP
中央气象台8月10日10时继续发布台风蓝色预警	一加Ace 2 Pro卖爆了：iPhone用户“弃暗投明”
王鹏点金：原油打开上涨空间！	回应期盼，上海世博文化公园打造“一流公园”
《天津市互联网发展报告（2022）》发布加快推进网络强市数字天津建设	俄罗斯莫斯科州工厂爆炸事故受伤人数增至60人另有一人死亡
学习交通法规体验城管生活……多彩活动点亮学生暑期生活	石守信：赵匡胤“义社十兄弟”，晚年家财万贯
兴城疗养院（关于兴城疗养院的基本详情介绍）	TCL科技：预计Q4行业供给将按需调整保障面板价格趋于平稳
食品豫企出海趋势正盛，澄明食品将亮相香港美食商贸博览	终于坏了三星Galaxy Z Flip5手工折叠破40万
曼晚谈马奎尔替代者：选择年轻球员曼联在考虑塔普索巴托迪博	发改委：完善政府诚信履约机制优化民营经济发展环境
导演申奥：电影中的网络诈骗，只是现实的冰山一角	翁源县纪委监委开展专题培训

清华发布大模型性能报告：GPT-4第一更懂中文的还是百度

相关阅读

精彩推送

每日推荐

5元钱的拌面在复工潮中创造商机

要闻

资讯新闻

清华发布大模型性能报告：GPT-4第一 更懂中文的还是百度

相关阅读

精彩推送

每日推荐

5元钱的拌面在复工潮中创造商机

要闻

资讯新闻

清华发布大模型性能报告：GPT-4第一更懂中文的还是百度