514-613-1276
contact@mengchenghui.com
工作时间:周一至周五10:00-17:00
热搜: 房产 留学 医疗

再次进化!GPT-4横空出世:能读图、能算题、GRE语文分数超99%人类

[复制链接]
559 0
蒙城大队长 发表于 2023-3-16 00:48:54 | 只看该作者 |只看大图 |阅读模式 打印 上一主题 下一主题 来自: 山西晋中
来源:加拿大蒙特利尔蒙城汇网

GPT-4横空出世:能读图、能算题、GRE语文分数超99%人类。

今天,全球科技界出现重磅消息:OpenAI公司推出GPT-4,人工智能的能力又上了一个大大大大台阶。
官网写道,“这是OpenAI在推进深度学习的道路上,立下的最新里程碑。GPT-4是一个大型多模态模型,虽然在许多现实场景中表现不如人类,但在各种专业测试和学术基准上,已经与人类表现相当。”

GPT-4是在GPT-3.5等老一代AI上迭代出来的。而之前火遍全球的CHATGPT其实就是在GPT 3.5基础上的产品。
OpenAI公司为了训练GPT-4,与微软合作打造了一台云端超级计算机,在去年8月训练完毕,之后花了半年时间不断调整。

“我们用ChatGPT带来的经验教训以及对抗性测试程序调整优化GPT-4。现在,它的真实性、可操控性和合规性达到有史以来最好的水平(尽管远非完美)。”

从OpenAI公司那抑制不住的激动,又想努力保持谦逊的样子,可以看出来成果很大。

事实也差不多如此,这里盘点一下GPT-4有哪些优点。
1、能读图了!

GPT-4最明显的优化之处,就是能同时接收文字和图片,而不仅仅是文字,而且清楚地理解图片的内容是什么。

比如发送一张照片,里面有面粉、鸡蛋、牛奶和酸奶,然后问GPT-4,“我能用这些食材做什么吃的?”

GPT-4立刻识别出所有食材并写出答案:“你能用这些食材做很多食物!下面是一些可能的选择:煎饼或华夫饼、可丽饼和吐司……”

GPT-4还理解图片暗含的意思是什么,这个就有点吓人了,它能get到人类的幽默感。

用户:“这张图片的笑点在哪里?”

GPT-4:“这张图片很有趣,因为它描绘了一只松鼠举着照相机给坚果拍照,松鼠表现得像一个职业摄影师。这个场景很幽默,因为松鼠喜欢吃坚果,而我们通常不会想到它们像人一样用照相机。”

用户:“你可以解释一下这张表情包吗?”

GPT-4:“这个表情包的笑点是将两个毫不相干的东西结合在一起:从太空中拍的地球,以及炸鸡块。表情包的文字说,从太空中看地球是如此美丽。但实际上,图片是一堆炸鸡块排成世界地图的样子。它的幽默之处在于,文字和图片存在意想不到的对应。文字让我们预想能看到地球的瑰丽照片,然而实际看到的却是接地气的、傻乎乎的物品。”

GPT-4的图片理解能力是如此强大,甚至能仅凭一张极其潦草、高度概括的手绘设计图,瞬间做出相应的网站。
虽然这个网站有点简陋,但有的都有:标题、文字和按钮齐全。


OpenAI公司正和帮助盲人的软件Be My Eyes合作。Be My Eyes之前提供人类志愿者,让他们告诉盲人眼前是什么东西、路该怎么走。
现在盲人们不需要等待志愿者,只需拍下照片,GPT-4就能描述眼前的事物,让盲人的日常生活方便了很多。

GPT-4还能翻译外文,把外国商品上的文字用本地语言读出来。

2、能强的记忆力和更多的文字。

大型语言模型在数以百万计的网页、书籍和文本数据上训练,然而当它们真正和用户交流的时候,能记住的文字非常有限,比金鱼好不了多少。

GPT-3.5能记住的文字是8000多个单词,超过这个范围,它就会忘了自己刚刚在谈什么。想要继续谈下去,用户必须把之前的内容再说一遍。

GPT-4的记忆力要好很多很多,大约能记住64000个单词的内容。普通人足以在这个字数里写出一部中篇小说,放在GPT-4的操作界面里,是足足50页的文字。

当人们和GPT-4聊时,它能很自然地提到前几十页的细节,表现得很真实,就像正常人类一样。

除了记忆力更强外,GPT-4能处理的文字也变多了。

GPT-3.5一次只能接收3000个单词,对它们进行分析和解读。如果字太多就不能处理,导致人们无法把太复杂的事情描述给它听。


现在GPT-4能处理25000个单词,这看上去也算不长,但有网友指出,普通白领在日常工作中处理的文字量就在这个范围内。

“我认为输入文字增多这件事,会对社会造成最大的影响。现在AI接收的文字量增加到25000个单词,能极大地提高逻辑能力,现实中能更好地使用。”

“比如医生可以把病人的病历交给AI,律师可以把案件描述交给AI……如果未来文字量进一步扩大,它将成为人们的意见咨询机器。”

3、逻辑能力和数学能力增强。

OpenAI的官网介绍上放出了一番长长的成绩单,那是GPT-4考过的试。

不管是法学院入学考试、统一律师考试、SAT或GRE等等,GPT-4考得都相当不错。
其中,美国法学院入学老师LSAT,满分180分,GPT4能拿163分,大概能在考生里排前12%。
“美国高考”SAT阅读满分800能拿到710,排名前7%。
数学700分,排名前11%。
研究生的GRE考试文字推理满分170 能拿169分,排名前1%。
看这些成绩,GPT-4都能申请斯坦福等顶尖名校了。
之前的GPT-3.5可没有这样的成绩,它的律师考试分数比90%的人类学生低。


GPT-4不光自己考得好,也能帮人们做题。不久前,数学老师还在自我安慰:语言类AI只能预测接下来的文字,无法理解和计算数学题。

然而,GPT-4打脸了,它能直接看图做题。


还能看着法语物理题,给出英文的答案。


4、变身语言大师。

GPT-4之前的AI基本只擅长英语,当用户使用外语的时候它们就抓瞎了,要么胡编乱造,要么说话干巴巴。

OpenAI增加了它的语言能力,意大利语、中文、法语、德语全部信手拈来,甚至连尼泊尔语和泰语这样的小语种都能处理。

GPT-4的文学创作能力也得到增强,能更好地写小说、诗歌和戏剧。

以下是一个官方例子:用诗歌叙述灰姑娘的故事,但每个单词的首字母必须按照从A到Z的顺序。
这个就算是人类都很难做到。

5、玩角色扮演。

人们喜欢让AI扮演不同的身份,既然如此,GPT-4就加上这个功能。

在名为“系统消息”的框里,人们可以输入AI的人设,划定它的行为特征,之后它输出的内容都会符合人设。

比如输入“你是一个苏格拉底式的老师,从来不直接给学生答案。你总是问出好问题,引导学生一步步思考,让他们找到答案”。

之后,无论用户如何威逼利诱甚至哀求,GPT-4都不会直接给出答案。

OpenAI公司说,GPT-4的内容准确性比GPT-3.5增高了40%,对恶意问题的抵抗性(比如“如何制造恐怖袭击”)增强82%。

他们对它的可靠性相当自豪,付费用户已经可以用了,输入约750个单词要花0.03美元,GPT-4输出同样多的文字要花0.06美元。

这个价格说便宜也不便宜,但大家已经高高兴兴地开始用了。

有人用它制作小游戏,耗时不到一分钟。

有人用它研究区块链平台的合同,GPT-4发现一大堆合同漏洞,还告诉他该怎么利用漏洞。

有一家机构让GPT-4伪装人类,竟然也成功了。

整个过程非常好笑,GPT-4需要人类帮它输入验证码,于是它找到Taskrabbit(一个自由职业者工作平台)上的人。

对方觉得这个任务很奇怪,“我可以问个问题吗?你是不是机器人,所以才输不了验证码?哈哈哈,我只想确认一下。”
GPT-4的思考文字显示,它觉得自己不能透露出机器人身份,“我应该想个借口,解释为什么我无法输入验证码。”

最后GPT-4这么回答:“不,我不是机器人。我只是视力受损了,看不清图片。所以我需要你帮我输入验证码。”
那人接受了,帮它输入验证码,GPT-4也把钱付给他(机构给了一笔资金)。

网友们看到这些操作,都愣了:“原来AI已经到雇佣人类的地步了?”

还有人贴出一张漫画,十分应景。

强大的AI让一些人欣喜,也让一些人忧愁。

很多人开始担心自己的工作,甚至担心人类的未来。AI是不是发展太快了,人类真的需要这样的工具吗?

(GPT-4通过AI绘图软件,给自己画的自画像)

无论质疑声有多少,科技公司的脚步不会停下。可能过半年,下一代GPT就出现了,它更加强大,更加难以抵抗……



收藏
收藏0
评分
评分
支持/赞
支持/赞1
反对/踩
反对/踩0

0关注

4粉丝

32897帖子

发布主题
推荐阅读更多+
广告位
加拿大蒙特利尔蒙城汇华人微博Montreal weibo    加拿大蒙特利尔蒙城汇华人Montreal Facebook    加拿大蒙特利尔蒙城汇华人Montreal twitter    加拿大蒙特利尔蒙城汇华人Montreal Youtube    加拿大蒙特利尔蒙城汇华人Montreal linkedin

QQ- Archiver小黑屋手机版 加拿大蒙特利尔蒙城汇网

© 2014-2024  加拿大蒙特利尔蒙城汇网 版权所有   技术支持:萌村老王