RLHF(人間による評価を利用した強化学習)とは?ファインチューニングとの違いも解説 IT総合 2023.11.17 近年、ChatGPTのような「大規模言語モデル(LLM)」が大きな注目を浴びています。全世界で多様な規模や特性を持つLLMが次々と開発されており、中にはChatGPTよりも小さな規模ながら、それに匹敵リンク元
コメント