特殊な訓練を受けたAIモデルがまるで潜伏工作員のように機密情報を漏えいする可能性があることが判明

2017-08-24_00h03_35 IT総合
自然な文章を生成する言語モデルは、通常であればセーフティがかかっていて、人間が不快だと感じることを言わなかったり、不適切な情報を出したりしないように訓練されています。ところが、最初の訓練で悪意を仕込ま

リンク元

コメント

タイトルとURLをコピーしました