gpt3的梯度问题_人工智能

 

如上,这个知识点,讲了几种shot的区别,但是比较重要的一点是传统的微调是要进行梯度更新的,但是gpt3没有梯度更新的过程