大規模言語モデルで「無限の入力」を受け付けることを可能にする手法「StreamingLLM」が開発される

2017-08-24_00h03_35 IT総合
計算コストやパフォーマンスを維持したまま無限の入力を処理することが可能な大規模言語モデルの手法「StreamingLLM」の論文が2023年9月29日に公開されました。入力が長くなるにつれて最初の方の

リンク元

コメント

タイトルとURLをコピーしました