Lycée DES GRAVES GRADIGNAN

Portail Documentaire

Lien vers la notice

Titre :	Eduquer les modèles de langage (11/2024)
Auteurs :	Arnaud Devillard
Type de document :	Article : texte imprimé
Dans :	Sciences et avenir (1949) (933, 11/2024)
Article en page(s) :	p.38-39
Langues:	Français
Catégories :	[Motbis] 3110 informatique > logiciel > assistant personnel virtuel
Mots-clés:	apprentissage automatique
Résumé :	Le point sur les méthodes permettant d'éviter les contenus choquants ou illégaux issus des agents conversationnels : la technique RLHF (reinforcement learning from human feedback ou apprentissage par renforcement fondé sur les préférences humaines) et ses limites ; des approches en cours de développement comme la DPO (direct preference optimization) et le "red teaming" (équipe rouge).
Types de nature :	Documentaire
Natures :	Article de périodique