再次进化！GPT-4横空出世：能读图、能算题、GRE语文分数超99%人类

蒙城大队长 · 发表于 2023-3-16 00:48:54

来源：加拿大蒙特利尔蒙城汇网

GPT-4横空出世：能读图、能算题、GRE语文分数超99%人类。

今天，全球科技界出现重磅消息：OpenAI公司推出GPT-4，人工智能的能力又上了一个大大大大台阶。

官网写道，“这是OpenAI在推进深度学习的道路上，立下的最新里程碑。GPT-4是一个大型多模态模型，虽然在许多现实场景中表现不如人类，但在各种专业测试和学术基准上，已经与人类表现相当。”

GPT-4是在GPT-3.5等老一代AI上迭代出来的。而之前火遍全球的CHATGPT其实就是在GPT 3.5基础上的产品。

OpenAI公司为了训练GPT-4，与微软合作打造了一台云端超级计算机，在去年8月训练完毕，之后花了半年时间不断调整。

“我们用ChatGPT带来的经验教训以及对抗性测试程序调整优化GPT-4。现在，它的真实性、可操控性和合规性达到有史以来最好的水平（尽管远非完美）。”

从OpenAI公司那抑制不住的激动，又想努力保持谦逊的样子，可以看出来成果很大。

事实也差不多如此，这里盘点一下GPT-4有哪些优点。

1、能读图了！

GPT-4最明显的优化之处，就是能同时接收文字和图片，而不仅仅是文字，而且清楚地理解图片的内容是什么。

比如发送一张照片，里面有面粉、鸡蛋、牛奶和酸奶，然后问GPT-4，“我能用这些食材做什么吃的？”

GPT-4立刻识别出所有食材并写出答案：“你能用这些食材做很多食物！下面是一些可能的选择：煎饼或华夫饼、可丽饼和吐司……”

GPT-4还理解图片暗含的意思是什么，这个就有点吓人了，它能get到人类的幽默感。

用户：“这张图片的笑点在哪里？”

GPT-4：“这张图片很有趣，因为它描绘了一只松鼠举着照相机给坚果拍照，松鼠表现得像一个职业摄影师。这个场景很幽默，因为松鼠喜欢吃坚果，而我们通常不会想到它们像人一样用照相机。”

用户：“你可以解释一下这张表情包吗？”

GPT-4：“这个表情包的笑点是将两个毫不相干的东西结合在一起：从太空中拍的地球，以及炸鸡块。表情包的文字说，从太空中看地球是如此美丽。但实际上，图片是一堆炸鸡块排成世界地图的样子。它的幽默之处在于，文字和图片存在意想不到的对应。文字让我们预想能看到地球的瑰丽照片，然而实际看到的却是接地气的、傻乎乎的物品。”

GPT-4的图片理解能力是如此强大，甚至能仅凭一张极其潦草、高度概括的手绘设计图，瞬间做出相应的网站。

虽然这个网站有点简陋，但有的都有：标题、文字和按钮齐全。

OpenAI公司正和帮助盲人的软件Be My Eyes合作。Be My Eyes之前提供人类志愿者，让他们告诉盲人眼前是什么东西、路该怎么走。

现在盲人们不需要等待志愿者，只需拍下照片，GPT-4就能描述眼前的事物，让盲人的日常生活方便了很多。

GPT-4还能翻译外文，把外国商品上的文字用本地语言读出来。

2、能强的记忆力和更多的文字。

大型语言模型在数以百万计的网页、书籍和文本数据上训练，然而当它们真正和用户交流的时候，能记住的文字非常有限，比金鱼好不了多少。

GPT-3.5能记住的文字是8000多个单词，超过这个范围，它就会忘了自己刚刚在谈什么。想要继续谈下去，用户必须把之前的内容再说一遍。

GPT-4的记忆力要好很多很多，大约能记住64000个单词的内容。普通人足以在这个字数里写出一部中篇小说，放在GPT-4的操作界面里，是足足50页的文字。

当人们和GPT-4聊时，它能很自然地提到前几十页的细节，表现得很真实，就像正常人类一样。

除了记忆力更强外，GPT-4能处理的文字也变多了。

GPT-3.5一次只能接收3000个单词，对它们进行分析和解读。如果字太多就不能处理，导致人们无法把太复杂的事情描述给它听。

现在GPT-4能处理25000个单词，这看上去也算不长，但有网友指出，普通白领在日常工作中处理的文字量就在这个范围内。

“我认为输入文字增多这件事，会对社会造成最大的影响。现在AI接收的文字量增加到25000个单词，能极大地提高逻辑能力，现实中能更好地使用。”

“比如医生可以把病人的病历交给AI，律师可以把案件描述交给AI……如果未来文字量进一步扩大，它将成为人们的意见咨询机器。”

3、逻辑能力和数学能力增强。

OpenAI的官网介绍上放出了一番长长的成绩单，那是GPT-4考过的试。

不管是法学院入学考试、统一律师考试、SAT或GRE等等，GPT-4考得都相当不错。

其中，美国法学院入学老师LSAT，满分180分，GPT4能拿163分，大概能在考生里排前12%。

“美国高考”SAT阅读满分800能拿到710，排名前7%。

数学700分，排名前11%。

研究生的GRE考试文字推理满分170 能拿169分，排名前1%。

看这些成绩，GPT-4都能申请斯坦福等顶尖名校了。

之前的GPT-3.5可没有这样的成绩，它的律师考试分数比90％的人类学生低。

GPT-4不光自己考得好，也能帮人们做题。不久前，数学老师还在自我安慰：语言类AI只能预测接下来的文字，无法理解和计算数学题。

然而，GPT-4打脸了，它能直接看图做题。

还能看着法语物理题，给出英文的答案。

4、变身语言大师。

GPT-4之前的AI基本只擅长英语，当用户使用外语的时候它们就抓瞎了，要么胡编乱造，要么说话干巴巴。

OpenAI增加了它的语言能力，意大利语、中文、法语、德语全部信手拈来，甚至连尼泊尔语和泰语这样的小语种都能处理。

GPT-4的文学创作能力也得到增强，能更好地写小说、诗歌和戏剧。

以下是一个官方例子：用诗歌叙述灰姑娘的故事，但每个单词的首字母必须按照从A到Z的顺序。

这个就算是人类都很难做到。

5、玩角色扮演。

人们喜欢让AI扮演不同的身份，既然如此，GPT-4就加上这个功能。

在名为“系统消息”的框里，人们可以输入AI的人设，划定它的行为特征，之后它输出的内容都会符合人设。

比如输入“你是一个苏格拉底式的老师，从来不直接给学生答案。你总是问出好问题，引导学生一步步思考，让他们找到答案”。

之后，无论用户如何威逼利诱甚至哀求，GPT-4都不会直接给出答案。

OpenAI公司说，GPT-4的内容准确性比GPT-3.5增高了40％，对恶意问题的抵抗性（比如“如何制造恐怖袭击”）增强82％。

他们对它的可靠性相当自豪，付费用户已经可以用了，输入约750个单词要花0.03美元，GPT-4输出同样多的文字要花0.06美元。

这个价格说便宜也不便宜，但大家已经高高兴兴地开始用了。

有人用它制作小游戏，耗时不到一分钟。

有人用它研究区块链平台的合同，GPT-4发现一大堆合同漏洞，还告诉他该怎么利用漏洞。

有一家机构让GPT-4伪装人类，竟然也成功了。

整个过程非常好笑，GPT-4需要人类帮它输入验证码，于是它找到Taskrabbit（一个自由职业者工作平台）上的人。

对方觉得这个任务很奇怪，“我可以问个问题吗？你是不是机器人，所以才输不了验证码？哈哈哈，我只想确认一下。”

GPT-4的思考文字显示，它觉得自己不能透露出机器人身份，“我应该想个借口，解释为什么我无法输入验证码。”

最后GPT-4这么回答：“不，我不是机器人。我只是视力受损了，看不清图片。所以我需要你帮我输入验证码。”

那人接受了，帮它输入验证码，GPT-4也把钱付给他（机构给了一笔资金）。

网友们看到这些操作，都愣了：“原来AI已经到雇佣人类的地步了？”

还有人贴出一张漫画，十分应景。

强大的AI让一些人欣喜，也让一些人忧愁。

很多人开始担心自己的工作，甚至担心人类的未来。AI是不是发展太快了，人类真的需要这样的工具吗？

（GPT-4通过AI绘图软件，给自己画的自画像）

无论质疑声有多少，科技公司的脚步不会停下。可能过半年，下一代GPT就出现了，它更加强大，更加难以抵抗……

再次进化！GPT-4横空出世：能读图、能算题、GRE语文分数超99%人类

浏览过的版块