天天通讯!谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快
杨净 金磊 发自 凹非寺量子位 | 公众号 QbitAI
谷歌吃了大亏之后,这次一声不吭,放了大招:
对标ChatGPT的Bard测试版,刚刚正式对外发布。
【资料图】
而且这次用户在申请候补名单之后,无需经历漫长的等待时间。
没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)
实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。
甚至有时候还略胜当前GPT-4一筹!
谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。
话不多说,我们现在就来开始体验。
Bard VS GPT-4
首先在聊天界面上,Bard率先开始介绍自己:
我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。
(严谨而又体贴)
而在人类这边的发送端,可以选择键入和语音输入两种方式。
首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?
(不错不错,秒秒钟响应。目前暂不支持英文,但可以借助谷歌翻译插件)
从答案结构上看,采用的是总分总结构。
先总结发言:闪电可以袭击同一个地方两次。
随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。
最后再给人类提出切实的建议:
如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。
这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。
而从功能上看,确实是十分完备的。
回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下。
右下方还有一个more的功能,你可以进行复制和(反手一个)举报**操作。
既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。
1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)
(很快啊,这次也是几秒钟响应)
从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。
而GPT-4这边,几乎是不加思考地给出了答案。
从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。
2、小学加减法:356+132等于多少?
结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!
那直接再上点难度,两个数直接相乘:356*132等于多少?
结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!
再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!
不过提醒它错了之后,它就又回答正确了。
3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。
而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。
不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。
最后的最后,再考验一下它了解事实性的能力。(狗头)
你知道量子位吗?
回答错咯~Bard。
咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?
可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。
那竞争对手呢?(我在搞事)
不过到这里,就有点问题了。
关于Bard
谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。
我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。
谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。
不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。
由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。
因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。
例如在下面的案例中,Bard就搞错了一个植物的学名:
除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。
最后,奉上申请候补名单的地址,感兴趣的小伙伴可以抓紧尝鲜了:
https://bard.google.com/
关键词:
-
天天通讯!谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快
2023-03-22 -
有印象吗?《丧尸乐园》居然有艾梅柏·希尔德! 全球今头条
2023-03-22 -
前沿热点:快讯2023-03-22 09:42:13
2023-03-22 -
高安市气象台发布暴雨黄色预警信号【III级/较重】【2023-03-22】
2023-03-22 -
焦点观察:学校机房怎么摆脱管理员_学校机房怎么脱离控制
2023-03-22 -
焦点精选!接替朱利安-沃德?外媒:摩纳哥体育总监米切尔和利物浦进行会谈
2023-03-22 -
农发种业2022年净利2.3亿同比增长533.61% 董事长陈章瑞薪酬75.34万 世界微动态
2023-03-21 -
家庭矛盾杀害丈夫,女子投案自首
2023-03-21 -
全球实时:大宗交易:佳禾智能成交6934.68万元,折价10.34%(03-21)
2023-03-21 -
当前快看:上帝和耶稣是什么关系?
2023-03-21 -
常州地铁2号线详细站点_常州地铁1号线站点 实时焦点
2023-03-21 -
2023年03月20日江苏省水产报价分析
2023-03-21 -
天天观点:冀东水泥:公司暂无跨国经营的计划
2023-03-21 -
今热点:体现爱国思想的诗句_位卑未敢忘忧国
2023-03-21 -
盛京保
2023-03-21 -
首付12万多,月花费10098元,搭载1.5T+8AT的揽胜极光PHEV怎么样-滚动
2023-03-20 -
今日热文:继承不动产登记事项公示 编号:20230316-0042061
2023-03-20 -
大宗交易:中集车辆成交253.09万元,成交价10.23元(03-20)
2023-03-20 -
XM的优势在哪里?如何在这个平台开户?
2023-03-20 -
隋朝连续剧_隋朝秘史在线观看
2023-03-20 -
今日精选:慕安然叶非墨 筱筱_慕安然叶非墨全文免费阅读
2023-03-20 -
祝高考加油的句子(高考加油祝福句子)
2023-03-20 -
52手机论坛_52kd论坛 播报
2023-03-20 -
一立方等于多少个平方_一立方是多少平方 全球观察
2023-03-19 -
快播:美人鱼简笔画简单又漂亮_美人鱼简笔画
2023-03-19 -
请领导知晓的敬语是什么_请领导知晓的敬语
2023-03-19 -
北京市地方金融监督管理局局长李文红:北京将完善国家金融管理中心功能
2023-03-19 -
象牙色粉底液适合偏黄的肤色吗_象牙色
2023-03-19 -
民字组词造句子(民字组词有哪些)
2023-03-19 -
心怡和周亦然(心怡)
2023-03-18
-
知识分享 笔记本电脑保养方法是什么
2023-01-16 -
守住网络直播的伦理底线
2021-12-16 -
石窟寺文化需要基于保护的“新开发”
2021-12-16 -
电影工作者不能远离生活
2021-12-16 -
提升隧道安全管控能力 智慧高速让司乘安心
2021-12-16 -
人民财评:提升消费体验,服务同样重要
2021-12-16 -
卫冕?突破?旗手?——武大靖留给北京冬奥会三大悬念
2021-12-16 -
新能源车险专属条款出台“三电”系统、起火燃烧等都可保
2021-12-16 -
美术作品中的党史 | 第97集《窗外》
2021-12-16 -
基金销售业务违规!浦发银行厦门分行等被厦门证监局责令改正
2021-12-16