OpenAI上新,發現ChatGPT代碼輸出錯誤的大模型來了!

美東時間6月27日週四,OpenAI公佈,研究人員訓練了一個基於 GPT-4 的模型名爲 CriticGPT,用於捕捉ChatGPT 代碼輸出中的錯誤。據介紹,CriticGPT 旨在使用“從人類反饋中強化學習(RLHF)”的技術來訓練、改進 GPT-4 的回答,以協助人類 AI 訓練員完成工作。