GPT-4玩《我的世界》15倍速攀科技 精选

来源:2023-05-28 17:36:32    时间:量子位

克雷西 发自 凹非寺

量子位 | 公众号 QbitAI

把GPT-4放进一个虚拟世界会怎么样?比如 《我的世界》 。


(相关资料图)

英伟达开发最新方法Voyager,在游戏中点亮科技树的速度是此前方法的 15.3倍 ,同时获得的独特物品是此前的3.3倍,探索范围是2.3倍。

更关键的是,Voyager目前完全借助游戏画面推理,一切操作与反馈通过文本和游戏的Javascript API进行。

被其他AI玩家视为噩梦的挖钻石也不在话下。

结合人类反馈,盖个房子也不是问题。

更不用说撸树、游泳、摸鱼……这些基础操作。

(视频请到微信公众号文章中查看)

这项成果来自英伟达科学家Jim Fan(范麟熙)团队。

Voyager的出现甚至引发了一些网友的恐惧。

当GPT-4不再只是一款大语言模型,而拥有了与其他工具交互进行复杂动作的能力,学会推理和创造,真正的“人工智能”即将降临……

深度广度双双提升

团队将Voyager的表现与ReAct、Reflexion和AutoGPT进行了对比。

在地图探索距离上,Voyager达到了其他AI玩家的2.3倍。

而在科技树方面,只有Voyager成功解锁了钻石工具。

对于其他工具,Voyager解锁的效率也最高。

下表中,括号前的数字表示提示迭代的次数,越少说明效率越高;括号中的数字则表示在3次试验中AI玩家的成功率。

除了能点亮训练过的科技树,Voyager在零点测试中表现同样出色。

研究人员让这些AI玩家制造没有训练过的钻石镐、金剑、岩浆桶和指南针。

结果只有Voyager取得了100%的成功率,效率也比其他玩家更高。

如果有人工的帮助,给予评价或指导,Voyager还能构造建筑。

之所以需要人工,是因为在研发Voyager时GPT-4还不具备视觉能力。

如何实现

Voyager主要由三部分组成,即自动任务生成系统、技能库和迭代提示机制。

顾名思义,自动任务生成器负责根据宏观目标生成具体任务及操作游戏的代码并进行优化。Voyager使用的是一个流行的Javascript Minecraft 操作库 (Mineflayer)。

GPT-4根据Voyager发送的提示生成代码调用这个操作库,并根据JS运行情况和游戏反馈对代码中的错误进行修正。

Voyager发送给GPT的提示中主要包含四部分内容:

一是鼓励GPT尝试多种方式,同时又加以限制的总方针。 二是目前的状态,包括生命和饥饿值、持有物、位置和周围环境等。 三是之前成功和失败的操作,反映目前的工作进展。 四是额外信息,让GPT-3.5根据前述状态提问并调用知识库自答,将过程传给GPT-4。

说完了任务生成器,再看看Voyager的技能库。

通过让GPT-3.5(成本考虑)对生成的代码进行注释,并纳入技能库同时建立索引。

操作时则先用GPT-3.5生成操作说明,调用数据库中最匹配的五个。

然后,GPT-4将决定是调用数据库中的已有技能还是重新生成代码。

这一过程给GPT的提示则由五部分组成:

一是代码生成的指导,如“你生成的代码将被反复使用”。 二是控制API及相关技能。 三是上一步中生成的代码,以及对应的运行状况和反馈。 四是当前的状态,具体内容和代码生成器部分相同。 五是利用思维链方式,让GPT生成代码前进行推理。

最后再来看看Voyager的迭代提示机制,这一机制用于Voyager的自我提升。

这一机制会收集环境反馈、运行错误等信息。

同时结合对任务成功与否的自我检测,对自身进行优化。

下图就展示了自我检测的几个实例。

消融测试结果显示,缺少这一环节会导致Voyager运行质量的显著下降。

论文地址: https://arxiv.org/abs/2305.16291 项目主页: https://voyager.minedojo.org GitHub页面: https://github.com/MineDojo/Voyager 参考链接: [1]https://twitter.com/DrJimFan/status/1662115266933972993 [2]https://m.weibo.cn/status/4905873598054632

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

关键词:

文章推荐

  • 锐龙7000系列首发阵容曝光:核心数不变 功耗翻倍

    不出意外的话,AMD将于本月底正式宣布Zen4架构的锐龙7000系列处理器,9月15日上市开卖,抢先Intel 13代酷睿一步。今天,锐龙7000系列的首

    快科技 2022-08-05
  • 赏传统年俗逛非遗庙会 铜官窑古镇重温传统民俗年

    中新网长沙2月6日电 (潘杏琼)在多地倡导就地过年的环境下,位于长沙市城北的铜官窑古镇景区,从1月24日至2月15日举行中国年·湖湘味·铜官

    中新网 2022-02-07
  • 哈尔滨铁路迎节后返程高峰 推出复工专列服务

    中新网哈尔滨2月6日电 (周晓舟 记者 史轶夫)中国铁路哈尔滨局有限公司6日发布消息,哈尔滨铁路迎来春节后返程客流高峰,6日至7日预

    中新网 2022-02-07
  • 冬奥动车组设5G超高清演播室 “瑞雪迎春”号智能化人性化结合

    中新网北京2月6日电 (记者 刘文曦)在时速350公里的高铁列车上首设5G超高清演播室,为北京冬奥会量身定制的新型奥运版智能复兴号动车组瑞

    中新网 2022-02-07
  • 中欧班列“签证官”:日行10公里 用锤子“听诊”

    (新春走基层)中欧班列“签证官”:日行10公里 用锤子“听诊”  中新网郑州2月6日电 题:中欧班列“签证官”:日行10公里,用锤子“

    中新网 2022-02-07
  • 广告

    X 关闭

  • 科技
  • 数码
  • more+

    X 关闭

  • 众测
  • more+

    京张高铁每日开行17对冬奥列车

      京张高铁每日开行17对冬奥列车  预计冬奥服务保障期运送运动员、技术官员、持票观众等20万人次  2月6日,2022北京新闻中心举行“北

    北京冬奥会开幕式上 小学生朱德恩深情演绎《我和我的祖国》

      北京冬奥会开幕式上 小学生朱德恩深情演绎《我和我的祖国》  9岁小号手苦练悬臂吹响颂歌  2月4日晚,在北京冬奥会开幕式上,9岁的

    2022北京冬奥会开幕式这19首乐曲串烧不简单

      多名指挥家列曲目单 再由作曲家重新编曲 本报专访冬奥开幕式音乐总监赵麟  开幕式这19首乐曲串烧不简单  “二十四节气”倒计时、

    “一墩难求” 冰墩墩引爆购买潮

    设计师:没想到冰墩墩成爆款一墩难求冰墩墩引爆购买潮 北京冬奥组委:会源源不断供货北京冬奥会吉祥物冰墩墩近日引爆购买潮,导致一墩难求