Eduquer les modèles de langage Catalogue en ligne

Titre :	Eduquer les modèles de langage
Auteurs :	Arnaud Devillard
Type de document :	Article : texte imprimé
Dans :	Sciences et avenir (1949) (933, 11/2024)
Article en page(s) :	p.38-39
ISBN/ISSN/EAN :	0036-8636
Langues de la publication :	Français
Descripteurs	apprentissage automatique assistant personnel virtuel
Résumé :	Le point sur les méthodes permettant d'éviter les contenus choquants ou illégaux issus des agents conversationnels : la technique RLHF (reinforcement learning from human feedback ou apprentissage par renforcement fondé sur les préférences humaines) et ses limites ; des approches en cours de développement comme la DPO (direct preference optimization) et le "red teaming" (équipe rouge).
Nature du document :	documentaire
Genre :	article de périodique

Réserver

Code-barres	Cote	Support	Localisation	Section	Disponibilité
1897	archives	Périodique	CDI	Périodiques	Disponible