Guangning Yu's Blog

关于ChatGPT

2022-12-09 13:00:17
  • ChatGPT 来自 OpenAI 研究实验室,由 GPT-3.5 系列模型提供支持,包括 3.5 之前的模型版本,都使用 Azure AI 超级计算基础结构上的文本和代码数据进行训练。
  • GPT-3.5 系列模型最重要的变化,是建立在人类真实反馈基础上的调校。这是一种新使用的 AI 训练方法,标记者会在模型中书写期待的回复,按照期待的回复为标记的答案排序,通过排序来奖励模型。在持续迭代的过程中,输入奖励模型,得到优化参数。

  • 训练步骤
    title