Devillard Arnaud.
« Eduquer les modèles de langage »
in Sciences et avenir (1949), 933 (11/2024), p.38-39.
|
Titre :
|
Eduquer les modèles de langage
|
|
Auteurs :
|
Arnaud Devillard
|
|
Type de document :
|
Article : texte imprimé
|
|
Dans :
|
Sciences et avenir (1949) (933, 11/2024)
|
|
Article en page(s) :
|
p.38-39
|
|
ISBN/ISSN/EAN :
|
0036-8636
|
|
Langues de la publication :
|
Français
|
|
Descripteurs
|
apprentissage automatique
assistant personnel virtuel
|
|
Résumé :
|
Le point sur les méthodes permettant d'éviter les contenus choquants ou illégaux issus des agents conversationnels : la technique RLHF (reinforcement learning from human feedback ou apprentissage par renforcement fondé sur les préférences humaines) et ses limites ; des approches en cours de développement comme la DPO (direct preference optimization) et le "red teaming" (équipe rouge).
|
|
Nature du document :
|
documentaire
|
|
Genre :
|
article de périodique
|