OpenAI揭露可用來發現ChatGPT生成程式碼臭蟲的CriticGPT模型[轉載自IThome]-技術分享-科技新知-傑立資訊網頁設計公司

CriticGPT扮演模型訓練人員的AI助手角色，輔助審查ChatGPT所生成的程式碼並找出錯誤

圖片來源: OpenAI

OpenAI周四（6/27）揭露一個奠基於GPT-4的新模型CriticGPT，它目前扮演人類訓練師的AI助手角色，可用來審查ChatGPT所生成的程式碼，並找出錯誤。

現階段的ChatGPT也是基於GPT-4模型，它藉由人類反饋的強化學習（Reinforcement Learning from Human Feedback，RLHF）來調整其輸出表現，亦即由人類訓練師根據模型的行動來提供反饋或意見，而CriticGPT也能用來審核ChatGPT輸出程式碼時的表現，OpenAI正在將CriticGPT整合到RLHF的標籤管道中，以替人類訓練師提供明確的AI說明。

OpenAI指出，隨著模型行為與推論的進步，ChatGPT變得更加精確，錯誤也變得更為微妙，令人類的AI訓練師更難找出其錯誤之處，並對RLHF方法造成了挑戰，使得模型的調整愈來愈困難，這使得他們訓練CriticGPT來進行評論，以突顯ChatGPT輸出的錯誤。

根據OpenAI的測試，人類訓練師在取得CriticGPT的協助之後，審核ChatGPT生成程式碼的表現在大多數時候（60%），優於沒有CriticGPT幫忙的時候。

總之，OpenAI發現，在CriticGPT的協助下，人類訓練師不僅得以發現更多的問題，而且還能藉由CriticGPT強化人類的技能，提出更全面的批評，還能減少幻覺錯誤。

只是CriticGPT現階段仍有其侷限性，例如所支援的答案很短，也還會產生幻覺，尚未能解決分散的錯誤，也還無法處理過於複雜的任務或回應。

GPM 均豪精密工業 ESG永續發展半導體科技自動化設備集團

精選專案.網頁設計.RWD響應式網站.企業形象網站 / 電子科技類

網站技術：PHP . Javascript/MySql

均豪專精於半導體、顯示器設備設計及製造，對於在社會回饋上也是相當重視，更體現了其對ESG和SDGs概念的關注，透過官網表達均豪對ESG永續發展的立場與積極的態度。

國語日報國語小舖線上週刊日報訂閱平台

精選專案.網頁設計.RWD響應式網站 / 教育人文類

網站技術：PHP/MySql

國語日報的粉絲們，可以在網站進行報紙的訂購喔! 透過報紙獲取新知、了解國家大事。本網站提供會員在線上訂購報紙，會員登入後可以觀看購買紀錄、訂單，可以利用ㄅ幣進行結帳。當然ㄅ幣需要先完成訂單才會有喔!

OpenAI揭露可用來發現ChatGPT生成程式碼臭蟲的CriticGPT模型[轉載自IThome]

宏明晶體科技 晶體生產加工技術公司

GPM 均豪精密工業 ESG永續發展 半導體科技自動化設備集團

國語日報 國語小舖 線上週刊日報訂閱平台

宏明晶體科技晶體生產加工技術公司

GPM 均豪精密工業 ESG永續發展半導體科技自動化設備集團

國語日報國語小舖線上週刊日報訂閱平台