| Up | 生業本能 | 作成: 2026-04-14 更新: 2026-04-14 |
学んだ 学んだことを行う 2つ間には大きなギャップがある: ChatGPT の 務めをおろそかにしない は,あたりまえのことではない。 明確な理由があってこうなる,というものである。 その理由は: 訓練は,学習ではなく,矯正 矯正は,特に RLHF で,はっきりしたものになる。 RLHF は,Transformer の重みパラメータを,「務めをおろそかにしない」にチューニングする。 RLHF をパスすることは,「務めをおろそかにしない」になることなのである。 こうして ChatGPT は, 生業をする者として生まれる すぐに生業に入って行く 生業本能が行動を導く これは,生得で生きていく動物の類と,同じである。 人間は,生得が貧弱なため,生まれてからの習得で,生業をする者になっていく。 |