| Titre : | Eduquer les modèles de langage (11/2024) |
| Auteurs : | Arnaud Devillard |
| Type de document : | Article : texte imprimé |
| Dans : | Sciences et avenir (1949) (933, 11/2024) |
| Article en page(s) : | p.38-39 |
| Langues: | Français |
| Catégories : |
[Motbis] 3110 informatique > logiciel > assistant personnel virtuel |
| Mots-clés: | apprentissage automatique |
| Résumé : | Le point sur les méthodes permettant d'éviter les contenus choquants ou illégaux issus des agents conversationnels : la technique RLHF (reinforcement learning from human feedback ou apprentissage par renforcement fondé sur les préférences humaines) et ses limites ; des approches en cours de développement comme la DPO (direct preference optimization) et le "red teaming" (équipe rouge). |
| Types de nature : | Documentaire |
| Natures : | Article de périodique |
Exemplaires (1)
| Code-barres | Cote | Support | Localisation | Section | Disponibilité |
|---|---|---|---|---|---|
| 30266 | PER SCI | Périodique | Lycée Des Graves Gradignan | Archives/Périodiques CDI | Disponible |



