OpenAI 系列
📅 发表于 2025/12/06
🔄 更新于 2025/12/06
👁️ -- 次访问
📝 0 字
⏳ 0 分钟
openai
#gpt5
#gpt5-codex
#gpt-oss
#o1
#o1mini
#o3
#o3-mini
#GPT4
#ChatGPT
#InstructGPT
#CodeX
核心技术
真实软件工程 RL学习,沙盒执行,关键结果
GPT5
核心
核心思想
推理思维链、内部深思为核心。旨在解决复杂问题,比如编程等。o1, o1-mini
o3, o3-mini
扩展上下文长度、优化了repo-level的代码编辑能力等。关键结果
图像和音频, 保留强大代码能力。扩展长上下文和代码编辑能力,可在Repo-Level做编辑。核心技术
指令微调和RLHF稳定的多轮对话能力,最核心。安全拒识行为等内容。关键结果
问题背景
经常答非所问、不安全、和人类需求不对齐。核心技术
人类反馈RLHF,和人类偏好进行对齐。OpenAI 护城河。Reward Model (偏好打分)、PPO训练等。关键结果
幻觉更少、行为更安全。小参数对齐模型 超越 大参数GPT3模型核心技术
GPT3+GitHub代码预训练。关键结果
HumanEval代码生成和补全Benchmark上表现不错,早期的代码对齐LLM。自然语言 -> 可执行代码的翻译问题。核心技术
大规模web和文本数据上做ScaleUp。关键结果
上下文学习能力(zero-shot/few-shot),无需梯度更新也能适应理解、代码、推理等任务。核心
生成式预训练可行,开源了权重。