advertisement
Billboard is a part of Penske Media Corporation. © 2023 Billboard Media, LLC. All Rights Reserved.
advertisement
Popular
Latest News
advertisement
BILLBOARD CANADA FYI
A weekly briefing on what matters in the music industry
By signing up you agree to Billboard Canada’s privacy policy.
advertisement
advertisement
Les catalogues de Drake, The Weeknd, Nemahsis, Tre Mission — et bien d’autres — utilisés pour entraîner l’IA
Selon The Atlantic, « quatre ensembles de données géants de chansons » — dont le plus vaste regroupe près de 12 millions de titres — circulent au sein de la communauté travaillant sur la musique générée par IA. Ces datasets incluent des œuvres de nombreux artistes canadiens, parmi lesquels Luna Li, Lunice, Valley et bien d’autres.
8m
Une nouvelle fuite de données permet désormais aux artistes de vérifier si leur musique a été utilisée pour entraîner des modèles d’intelligence artificielle.
Plus tôt cette semaine, The Atlantic a révélé une base de données regroupant « quatre ensembles de données géants de chansons partagés au sein de la communauté de développement de l’IA » — dont deux contenant chacun près de 12 millions de titres.
Que des modèles d’IA soient entraînés à partir de morceaux collectés sans autorisation, sans licence et sans compensation n’a rien de nouveau. Mais cette fois, les artistes peuvent enfin savoir si leurs œuvres figurent dans ces datasets.
advertisement
La base de données inclut des chansons d’artistes canadiens tels que Backxwash, Tre Mission, Lunice, Luna Li, Leith Ross, Valley et Nemahsis, entre autres. L’outil mis en ligne permet d’identifier précisément quelles pistes apparaissent dans les deux plus grands ensembles.
Plusieurs artistes ont réagi après avoir découvert leur musique dans la base.
Tre Mission, rappeur et producteur dont 20 titres y figurent, a déclaré : « Je suis sûr à 100 % de n'avoir jamais consenti à cela 🤔 Tous ceux qui me connaissent savent que je DÉTESTE l'utilisation de l'IA dans la musique, donc c'est très décevant. »
En réponse à l'artiste Sophia Hjklightninezeroone — qui a lancé la discussion sur X au sujet de la base de données de la publication et qui compte 138 entrées —, le DJ et producteur montréalais Lunice a découvert qu'au moins 93 de ses propres œuvres y figuraient. « C'est dingue… Merci de l'avoir signalé », a-t-il déclaré.
Certains artistes ont réagi de manière très directe à la découverte de leurs œuvres dans ces ensembles de données. « Je n’aime pas ça », a simplement écrit sur X le rappeur Backxwash, lauréat du prix Polaris. Dans la foulée de la viralité de son message, Hjklightninezeroone a invité toute personne ayant des contacts dans le milieu juridique de l’industrie musicale à la joindre.
advertisement
La base de données répertorie également des chansons de plusieurs des plus grands artistes du pays. Drake y compte près de 800 entrées, The Weeknd 460 et Justin Bieber 458. Nelly Furtado, intronisée au Hall of Fame, en totalise 307, tandis qu’Alanis Morissette, Tate McRae et Sarah McLachlan en affichent respectivement 259, 210 et 183.
Selon les informations disponibles, les quatre ensembles de données ont été téléchargés des milliers de fois, mais on ignore encore quelles entreprises les ont utilisés. « Les entreprises affirment souvent n’utiliser que du contenu disponible gratuitement en ligne, mais ces datasets montrent l’ampleur de la musique téléchargeable à laquelle les développeurs peuvent accéder, même lorsqu’elle n’est pas censée être libre d’accès », explique l’auteur Alex Reisner.
Suno fait partie des plateformes musicales basées sur l’IA les plus influentes. D’après The Atlantic, un document judiciaire de 2024 révèle que la société a entraîné ses modèles sur « la quasi‑totalité des fichiers musicaux de qualité raisonnable » disponibles en téléchargement sur Internet. Certains morceaux générés sur la plateforme ont même réussi à se hisser dans les classements.
advertisement
En décembre dernier, « I Run. » de HAVEN. est entré au Billboard Canadian Hot 100 à la 59e place avant d’atteindre la 45e. Avant même son arrivée dans les palmarès, le titre avait suscité une vive controverse : un extrait publié sur TikTok utilisait une voix féminine rappelant celle de la chanteuse britannique Jorja Smith. Après les réactions de cette dernière, le duo a remplacé la voix générée par IA par celle de la jeune artiste montante Kaitlin Aragon, qui avait partagé une reprise du morceau.
Outre Suno, The Atlantic rapporte que Google a entraîné un modèle sur 44 millions de chansons en 2022, tandis que deux ans plus tôt, OpenAI avait collecté 1,2 million de titres en ligne pour entraîner Jukebox, sa plateforme capable de générer des chansons complètes — voix et instruments compris — à partir de zéro.
advertisement
keep reading
Show less
advertisement
Popular
advertisement
Published by ARTSHOUSE MEDIA GROUP (AMG) under license from Billboard Media, LLC, a subsidiary of Penske Media Corporation.
advertisement















