RLHF(人間による評価を利用した強化学習)とは?ファインチューニングとの違いも解説

2017-08-24_00h03_35 IT総合
近年、ChatGPTのような「大規模言語モデル(LLM)」が大きな注目を浴びています。全世界で多様な規模や特性を持つLLMが次々と開発されており、中にはChatGPTよりも小さな規模ながら、それに匹敵

リンク元

コメント

タイトルとURLをコピーしました