No.3 后训练 让 LLM 能和你连续对话

如之前所说,后训练成本相比预训练低得多, 并不需要再用到全部互联网数据。

基座模型虽然能模仿互联网内容续写内容, 或者像 Copilit 那样补全代码, 但还不够有用 , 如何让模型变得有用呢?尤其是,如何让它像 ChatGPT 一样能够与人进行多轮对话、回答问题?这就需要 SFT(监督微调)

ChatGPT 终于能原生画图了,我们能用它做点什么?(GPT-4o 原生图片输出能力介绍)

4o 的生图工终于在公布差不多1 年后,终于开放使用了,看看我们能利用这个模型实际做一些什么 (因为这篇主要是为了向同事介绍这个模型,因此不少图用了公司 logo,所以这里的分享会对 logo打码)

不过从简单的说就是和 SD 这样的扩散生图的模型不同, 4o 的生图采用了自回归的方式也是和生成对话一样有顺序的生成的,因此能获得比较精确的效果

No.1 ChatGPT 的训练数据来源

LLM 究竟是什么呢? 一方面,它确实有一些非常神奇、令人惊叹的能力;另一方面,它在某些方面也并不擅长。所以, 在这个对话框背后究竟是什么?我们输入任何东西,按下回车,会出现一段文字——产生这些文字的原理是什么?我们到底在和什么“对话”? 相信如果我们能大概了解它的能力,也对我们更好地使用它有很大的帮助(而不是说我们真的要去训练模型)

聊聊 Emoji

"收到!👌" "好的呢~😊" "谢谢 🙏"

每天聊天的时候,无论是工作还是生活, 你是不是也像我一样, 总是习惯性地加上这些可爱的小表情来让话语显得不那么严肃? 有时候甚至觉得光发文字好像缺了点什么...不过你有没有想过,它们是从哪来的呢?

今天想和介绍一下 Emoji ,这个我们每天都在用的小表情的历史和发展

它不仅可爱,能丰富我们使用纯文字聊天时的表达,可以说是数字时代诞生的第一门通用语言, 那它是怎么出现和风靡全球的呢

使用 MidJourney 制作 "2025 年台历" 素材经验分享!

今年图片和视频领域的发展比 LLM 有趣不少, 感觉很多文档都是在介绍这方面, 而这就是又一篇 😂  最近对图片生成的兴趣比较大

而公司有制作年度台历的活动,于是参加了一下~ 最后在同事们投票下获得了第一名 挺让人高兴 于是想分享一下制作过程中素材的生成 另外涉及公司信息的部分就打码了 (比如我其实在每张图里都 p 入了不同风格的 logo 融合进画面作为彩蛋)

GPT-4o 模型介绍: 图片输出

之前和别人介绍 ChatGPT 的 DALLE 3 画图时, 似乎很多人对生成的图片里的文字很在意, 比如错误的拼写, 没办法放入一段长文字之类的问题, 但也许很快就不会再是问题了

本篇将介绍 GPT-4o 的图片生成能力! 为什么会有个 o 在后面呢~ 其实“o”代表“omni”,源自拉丁语“omnis”,意为“全能”或“全部”。代表了 4o 的多模态能力,能够处理文本、音频和视觉等多种输入和输出形式,也就是说他可以真正接受你对他语音说的话, 能看懂你给他发的图片等, 不仅如此 他还能输出音频和图片, 是非常巨大的进步,目前还没有其他模型能做到这一点