Pour grandir, l'IA générative se tourne vers les livres

Berliner Boersenzeitung - Pour grandir, l'IA générative se tourne vers les livres

Berlin 11°C

EUR -

AED 3.826681

AFN 70.961758

ALL 98.138602

AMD 405.652886

ANG 1.877182

AOA 951.190259

ARS 1045.720247

AUD 1.602814

AWG 1.877897

AZN 1.775245

BAM 1.955573

BBD 2.102956

BDT 124.465544

BGN 1.955294

BHD 0.392554

BIF 3076.642669

BMD 1.041829

BND 1.403837

BOB 7.197164

BRL 6.043693

BSD 1.041579

BTN 87.914489

BWP 14.229347

BYN 3.408604

BYR 20419.848375

BZD 2.099456

CAD 1.456529

CDF 2991.091432

CHF 0.930957

CLF 0.036923

CLP 1018.83097

CNY 7.54601

CNH 7.562783

COP 4573.368835

CRC 530.538382

CUC 1.041829

CUP 27.608468

CVE 110.252195

CZK 25.343745

DJF 185.478458

DKK 7.457729

DOP 62.772709

DZD 139.835759

EGP 51.726992

ERN 15.627435

ETB 127.508391

FJD 2.371151

FKP 0.822333

GBP 0.831435

GEL 2.855018

GGP 0.822333

GHS 16.456089

GIP 0.822333

GMD 73.970229

GNF 8977.957272

GTQ 8.040066

GYD 217.904692

HKD 8.110066

HNL 26.320943

HRK 7.431636

HTG 136.72412

HUF 411.522823

IDR 16610.452733

ILS 3.856892

IMP 0.822333

INR 87.968134

IQD 1364.44153

IRR 43834.955489

ISK 145.523076

JEP 0.822333

JMD 165.930728

JOD 0.738765

JPY 161.244275

KES 134.884334

KGS 90.122166

KHR 4193.512952

KMF 492.268155

KPW 937.645704

KRW 1463.259646

KWD 0.320727

KYD 0.867999

KZT 520.059599

LAK 22878.342838

LBP 93271.167197

LKR 303.144792

LRD 187.998165

LSL 18.795317

LTL 3.076251

LVL 0.630192

LYD 5.086409

MAD 10.478083

MDL 18.997794

MGA 4861.435378

MKD 61.522855

MMK 3383.819949

MNT 3540.134882

MOP 8.35093

MRU 41.443187

MUR 48.810083

MVR 16.10707

MWK 1806.090235

MXN 21.283008

MYR 4.654932

MZN 66.583684

NAD 18.795317

NGN 1767.675143

NIO 38.325549

NOK 11.53576

NPR 140.663663

NZD 1.785942

OMR 0.400943

PAB 1.041579

PEN 3.949541

PGK 4.193513

PHP 61.404399

PKR 289.239507

PLN 4.337676

PYG 8131.055634

QAR 3.798559

RON 4.978071

RSD 116.991412

RUB 108.671879

RWF 1421.834864

SAR 3.911473

SBD 8.734231

SCR 14.272055

SDG 626.663972

SEK 11.497837

SGD 1.402931

SHP 0.822333

SLE 23.68116

SLL 21846.638123

SOS 595.230868

SRD 36.978718

STD 21563.75683

SVC 9.113941

SYP 2617.626467

SZL 18.788818

THB 35.922648

TJS 11.092512

TMT 3.646401

TND 3.309016

TOP 2.440072

TRY 35.9978

TTD 7.074178

TWD 33.946439

TZS 2770.578216

UAH 43.089995

UGX 3848.553017

USD 1.041829

UYU 44.294855

UZS 13362.448044

VES 48.506662

VND 26482.251319

VUV 123.688032

WST 2.90836

XAF 655.880824

XAG 0.033274

XAU 0.000384

XCD 2.815595

XDR 0.792308

XOF 655.880824

XPF 119.331742

YER 260.379151

ZAR 18.915093

ZMK 9377.71492

ZMW 28.772658

ZWL 335.468513

AEX

13.6800

879.8

+1.58%
BEL20

69.4500

4228.29

+1.67%
PX1

41.8400

7255.01

+0.58%
ISEQ

17.2700

9613.97

+0.18%
OSEBX

3.8100

1468.66

+0.26%
PSI20

48.3400

6409

+0.76%
ENTEC

-5.8300

1416.23

-0.41%
BIOTK

86.5000

2989.04

+2.98%
N150

24.5300

3295.3

+0.75%

Pour grandir, l'IA générative se tourne vers les livres / Photo: Kirill KUDRYAVTSEV - AFP/Archives

Pour grandir, l'IA générative se tourne vers les livres

CULTURE 22.11.2024

Préserver les droits d'auteurs en négociant avec les plateformes: confronté aux besoins toujours plus grands de l'intelligence artificielle générative, le monde de l'édition commence lui aussi à passer des contrats avec ses acteurs pour monnayer ses contenus.

Taille du texte:

Le grand éditeur américain HarperCollins vient de proposer à certains de ses auteurs un contrat avec une société d'intelligence artificielle (IA) - dont l'identité est confidentielle - permettant à cette dernière d'utiliser leurs œuvres publiées pour entraîner son modèle d'intelligence artificielle générative.

Dans un courrier consulté par l'AFP, l'entreprise d'IA propose 2.500 dollars par livre sélectionné afin d'entraîner son modèle de langage (LLM) pour une période de trois ans.

Car pour pouvoir produire toutes sortes de contenus sur simple requête en langage courant, les modèles d'IA générative ont besoin d'être nourris d'une quantité de données sans cesse croissante.

Contacté, l'éditeur a confirmé l'opération. "HarperCollins a conclu un accord avec une société de technologie d'intelligence artificielle pour autoriser l'utilisation limitée de certains titres (...) pour entraîner des modèles d'IA, afin d'améliorer la qualité et les performances des modèles", écrit-il.

La maison d'édition explique également que l'accord "encadre clairement la production de modèles respectueux des droits d'auteur".

L'offre a toutefois été diversement appréciée dans le secteur de l'édition, et des écrivains comme l'Américain Daniel Kibblesmith l'ont sèchement déclinée: "je le ferais probablement pour un milliard de dollars. Je le ferais pour une somme d'argent qui ne me demanderait plus de travailler, puisque c'est le but final de cette technologie", s'est indigné l'auteur sur le réseau social Bluesky.

- Nouveaux matériaux -

Si HarperCollins est l'un des plus gros éditeurs à ce jour à passer ce type d'accord, il n'est pas le premier. L'éditeur américain de livres scientifiques Wiley a donné accès "au contenu de livres académiques et professionnels publiés pour une utilisation spécifique dans la formation des modèles, pour 23 millions de dollars, à une grande entreprise technologique", indiquait-il en mars cette année, lors de la présentation de ses résultats financiers.

Ce type de collaboration met en lumière les problèmes liés au développement des intelligences artificielles génératives, qui sont entraînées sur d'immenses quantités de données collectées sur le web avec, à la clef, de potentielles violations des droit d'auteurs.

Pour Giada Pistilli, responsable de l'éthique chez Hugging Face, une plateforme d'IA en accès libre franco-américaine, cette annonce est un pas en avant, puisque le contenu des livres est monétisé. Mais elle regrette une marge de négociation limitée pour les auteurs.

"Ce que l'on va voir, c'est un mécanisme d'accords bilatéraux entre entreprises de nouvelles technologies et éditeurs ou détenteurs de droits d'auteur, alors qu'il faudrait, à mon sens, une conversation plus large pour inclure un peu plus les parties prenantes", dit-elle.

"On part de tellement loin", commente de son côté Julien Chouraqui, le directeur juridique du syndicat français de l'édition (SNE). "C'est un progrès: le fait qu'il y ait un accord signifie qu'il y a eu un dialogue et une volonté d'aboutir à un équilibre entre l'utilisation de données sources, qui sont sous droit et qui vont générer de la valeur", dit-il.

Face à ces questions, les éditeurs de presse sont eux aussi en train de s'organiser. Fin 2023, le quotidien américain The New York Times a lancé des poursuites à l'encontre d'OpenAI, créateur du logiciel ChatGPT, ainsi que de Microsoft, son principal investisseur, pour violation des droits d'auteur. D'autres médias ont, eux, noué des accords avec OpenAI.

Les entreprises de la tech n'ont peut-être plus le choix pour améliorer leurs produits que de mettre la main au portefeuille, d'autant qu'elles commencent à manquer de nouveaux matériaux pour alimenter les modèles.

La presse américaine a récemment rapporté que les nouveaux modèles en développement semblent avoir atteint leurs limites, notamment chez Google, Anthropic et OpenAI.

"Sur le net, vous récoltez du licite et de l'illicite, et beaucoup de contenus piratés. Cela pose un problème juridique. Sans oublier le problème de qualité des données", observe Julien Chouraqui, du SNE: "si on a à cœur le développement d'un marché sur des bases vertueuses, il faut donc associer l'ensemble des acteurs."

(Y.Berger--BBZ)

Berliner Boersenzeitung - Pour grandir, l'IA générative se tourne vers les livres

Pour grandir, l'IA générative se tourne vers les livres

En vedette

Suisse: les Bâlois approuvent le financement de la tenue de l'Eurovision 2025

Près de Nantes, un septuagénaire devient youtubeur pour sauver ses animaux sauvages

La télé et ses stars, inépuisable source de recrutement pour Donald Trump

Combien vaut Chrome, qui peut l'acheter et que serait Google sans lui?