早上醒来就看到OpenAI发的GPT4公布和直播预告,不过我只有等到中午才有时间好好看一下回放
最大的进化应该是现在支持读取图片了吧,而且不是传统的那种把图片转换成文字后GPT再总结,而是真正的在训练的时候就加入了图片,所以说GPT4可以真正理解图片了

印象非常深刻的就是直播时Join Greg Brockman把他纸上画的网站图给GPT4然后生成了对应的网页,虽然网站本身很简陋,但这种读图的能力真的让人感到惊讶.(至少很多图形验证码得紧张了哈哈哈)

还有一个进化就是token数量,相较于GPT3.5最大4096,而GPT最高支持32768token(价格贵不少),之前不管是用ChatGPT处理一些文章或者玩角色扮演游戏时都很容易因为token而受限,比如要分段输入让他总结段落后再总结全文、角色扮演时遗忘之前的信息,现在八倍的token应该能解决不少问题了,特别是修改代码之类的问题,直播时Join Greg Brockman给GPT4非常长的交税资料啥的也能精确找到里面一个小的部分.总之之前很大的一个痛点缓解了,如果未来token足够长,让GPT生成一个网站项目感觉也不是不可能哈哈哈
对了微软也确认之前的new bing就是运行在GPT4上的,也难怪我感觉它对语气的辨别能力更强了

另外还有个牛逼的点,就是对中文的支持也增强了,GPT4的中文能力已经比之前ChatGPT用的GPT3.5强了
通用大模型的潜力真的是...恐怖
连以前的考试能力都从人类的倒数百分之十变成了前百分之十

现在技术进步真的可怕,让人感觉变化太快了,我上个月开始的GPT原理理解的文章都还没写完,又出现了更新的大变化.不管是自然语言处理这方面,AI绘画、视频处理等都有了不少让人震惊的新东西,如果说以前觉得AI时代快到了,那现在就已经是未来的一部分了

AI到底会给人们、给世界带来什么变化呢?也许人类存在的意义也会因为AI而改变吧...让人激动又有点害怕
以前总是幻想可以AI按照每个人的想法来可以生成不同的虚拟世界游戏来让人们体验想像中的各种东西,虽然看起来还有点远,不过AI带来的创造力的解放也让人感觉不远了

比如有一个想法就能让AI生成大纲然后具体剧情、漫画、动画直到变成可以互动的内容,那一定会诞生非常多的内容带来新的信息爆炸,就像文字出现让知识可以传承、纸笔出现让知识可以传播、互联网的普及也诞生了比以前多得多的内容比如网络小说、绘画等内容. AI也很可能在人类的使用下带来比以前多几个数量级的内容(其实也不用想象,当时NovelAI的图像生成刚出来没多久生成的图像就比它拿来训练的D站全部图像还要多了)

我们这样的普通人其实很难跟上这种巨大变化的时代,但我能感觉到似乎一个和过去很不同的时代正在慢慢开启,能做的也只有尽量尝试理解和使用这些新动向了,避免变成像以前电脑出现时却不会用电脑的中年人一样
还有这种需要大量资源训练和推进的通用大模型的碾压优势其实也让人担心像以前各种作品中天网、big bother之类的等大公司、大机构垄断的世界出现, 希望未来的人们能在AI的冲击下找到新的定位吧...

只是一点乱七八糟的想法,去年以来这么多新东西的出现...真的让人惊叹、焦虑、害怕和激动...但变化总比不变好,不是吗?比起一成不变地度过一生,我想,能感受这些巨大的改变更让人觉得有意思吧.

参考

  1. GPT-4 research
  2. GPT-4 Developer Livestream