Résumé :
|
Dans Weixin (WeeChat) [presse chinoise en ligne], reportage sur le travail des formateurs d'intelligence artificielle (IA), dans un centre d'étiquetage de données, en Chine : le témoignage d'un employé au sujet de son travail de formation de modèles d'intelligence artificielle, l'étiquetage de textes, de contenus vocaux et d'images ; son salaire relatif au nombre d'objets périmétrés par jour ; les compétences et le niveau d'études requis pour les formateurs d'IA ; le travail d'étiquetage vocal ; les trois pierres angulaires de l'IA ; le fonctionnement de l'apprentissage profond ou deep learning ; la constitution de la base de données ImageNet ; les raisons de l'exigence en matière d'étiquetage de photos de route ; le travail effectué par des étudiants pour la société Mengdong Keji ; le contexte de la naissance de l'industrie de l'étiquetage de données à partir de 2005, en Chine ; le volume de données produit dans le monde ; les zones d'installation des bases d'étiquetage ; les trois types d'entreprises d'étiquetage de données ; l'impact du développement de l'apprentissage autosupervisé. Carte de l'implantation des bases d'étiquetage de données en Chine. Encadré : l'enquête au sujet de l'emploi de travailleurs kenyans, par OpenAI, pour "éduquer" ChatGPT, en matière de racisme et de violence.
|