Reinforcement Learning from Human Feedback: Alignment and Post-Training of Llms

AvNathan Lambert

Häftad, Engelska, 2026

787 kr

Kommande

Produktinformation

Hoppa över listan

Du kanske också är intresserad av

  • -30%
Del 2

Intrig i Amalfi

Anders de la Motte, Anette de la Motte

Pocket

69 kr99 kr

  • 4 för 3
Del 1

Klanen

Pascal Engman

Pocket

89 kr

  • -30%

Systrarna

Jonas Hassen Khemiri

Pocket

69 kr99 kr