Des milliers de livres anciens acquis, numérisés… puis réduits en cendres : le sombre phénomène du « pillage littéraire »

Au cœur d’une tempête silencieuse, des milliers de livres anciens se retrouvent achetés en masse, numérisés pour nourrir les intelligences artificielles, puis irrémédiablement détruits. Ce phénomène, qualifié de pillage littéraire, soulève des inquiétudes majeures quant à la perte irréversible d’un patrimoine culturel inestimable et à l’avenir des archives physiques face à l’essor du numérique. Depuis 2024, des librairies du monde entier observent des commandes nocturnes massives et automatisées, orchestrées par des intermédiaires spécialisés, dont la canadienne Zoom Books, qui rachètent des collections entières d’ouvrages rares pour les reconvertir en flux de données. Derrière cette acquisition spectaculaire, les livres sont systématiquement démontés puis réduits en cendres — ou recyclés en pâte à papier — après avoir été intégralement scannés. Cette pratique, légale selon certains cadres juridiques comme le « fair use » aux États-Unis, suscite une controverse puisqu’elle accentue la fragilisation d’un accès direct et physique à la connaissance historique, au profit d’une exploitation numérique qui n’est pas toujours transparente.

Les dessous de l’acquisition massive de livres anciens pour l’intelligence artificielle

Le cœur de cette activité repose sur la nécessité pour les modèles de langage d’être entraînés avec des corpus textuels toujours plus vastes et variés. Face à l’épuisement progressif des sources gratuites en ligne, notamment à cause du renforcement des droits d’auteur, les entreprises se tournent vers des ouvrages imprimés peu accessibles sur le web.

  • Achats automatisés : des librairies européennes et américaines signalent des commandes répétées entre 3h et 5h du matin, souvent regroupant des milliers d’ouvrages.
  • Ciblage de livres invendus : essais, manuels techniques, chroniques historiques ou journaux intimes souvent abandonnés dans les rayons depuis des décennies.
  • Extraction des données : chaque livre est soigneusement numérisé page à page, transformant ces trésors imprimés en flux numériques exploitables par les algorithmes.
  • Destruction systématique : une fois numérisés, les livres sont physiquement détruits pour assurer l’absence de copies non autorisées et revendiquer un usage strictement légal.

Cette méthode interroge non seulement la pérennité des archives matérielles, mais aussi la responsabilité éthique des acteurs du numérique, qui se trouvent au croisement d’une exploitation technologique massive et d’une perte culturelle définitive.

Zoom Books : entre recyclage et polémique internationale

Aux commandes de nombreux de ces flux, Zoom Books se présente comme un acteur éco-responsable, spécialisé dans la revente et le recyclage de livres d’occasion en Amérique du Nord. Pourtant, leur modèle soulève de nombreuses questions :

  • Achats ciblés : des livres aux langues rares ou délaissées (allemand, espagnol, bulgare) sont achetés en grandes quantités sans réelle logique commerciale traditionnelle.
  • Pratiques de stockage : des photos montrent des piles désordonnées de livres achetés, à l’opposé des standards rigoureux du monde du patrimoine.
  • Silence sur la numérisation et la destruction : l’entreprise refuse de confirmer ou d’infirmer ces activités.

Face à ces suspicions, plusieurs libraires et associations alertent sur un pillage littéraire organisé, qui met en péril des collections parfois uniques et achetées à prix fort. Le débat dépasse désormais la sphère commerciale pour toucher aux enjeux culturels mondiaux.

La numérisation massive et ses conséquences sur le patrimoine culturel

L’ère du numérique bouleverse profondément nos modes de conservation et d’accès aux savoirs. Cependant, cette transition massive impose des risques dont le cas des livres anciens utilisés comme matière première pour l’IA illustre les limites.

  • Fragmentation du patrimoine : la transformation des livres en données brutes dissocie souvent le contenu de son contexte matériel et historique.
  • Destruction irréversible : une fois le livre démonté et devenu cendres, la perte est définitive, affectant non seulement les chercheurs mais aussi le grand public.
  • Monopolisation des archives numériques : le contenu numérisé entre dans des bases privées où l’accès peut être restreint, éloignant les savoirs des interfaces ouvertes.

Dans ce cadre, les experts appellent à une réflexion approfondie sur les pratiques d’indexation de données littéraires, pour mieux concilier innovation technologique et protection du patrimoine culturel.

Vers une régulation et un respect accru des archives physiques ?

Les libraires et spécialistes insistent sur la nécessité d’un encadrement juridique et éthique renforcé afin d’éviter un nouveau cycle de destruction et d’extraction non contrôlée :

  • Limitation des acquisitions massives : instaurer des quotas et une transparence dans les achats dédiés à la numérisation pour protéger les collections rares.
  • Valorisation des livres anciens : encourager leur préservation et moderniser leur consultation par des moyens numériques respectueux et non destructifs.
  • Partage équitable des données : ouvrir des bases accessibles qui respectent le droit d’auteur tout en favorisant la recherche et l’éducation.

Seule une coopération internationale, alliant acteurs du numérique, bibliothèques et institutions culturelles, peut demain garantir un équilibre entre innovation et sauvegarde des archives tangibles.

Share the Post:

Related Posts