RLHF（人間による評価を利用した強化学習）とは？ファインチューニングとの違いも解説

IT総合

2023.11.17

近年、ChatGPTのような「大規模言語モデル（LLM）」が大きな注目を浴びています。全世界で多様な規模や特性を持つLLMが次々と開発されており、中にはChatGPTよりも小さな規模ながら、それに匹敵

タイトルとURLをコピーしました