Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 4.0853
AFN 77.304935
ALL 99.425443
AMD 430.640141
ANG 2.0056
AOA 1030.326739
ARS 1068.290213
AUD 1.649014
AWG 2.002068
AZN 1.894175
BAM 1.956874
BBD 2.246933
BDT 132.982961
BGN 1.955109
BHD 0.419049
BIF 3218.88113
BMD 1.11226
BND 1.441091
BOB 7.717234
BRL 6.126886
BSD 1.11271
BTN 93.21276
BWP 14.749092
BYN 3.64147
BYR 21800.300671
BZD 2.242929
CAD 1.511489
CDF 3192.187171
CHF 0.939754
CLF 0.037189
CLP 1026.173446
CNY 7.889821
CNH 7.894912
COP 4701.557395
CRC 577.164769
CUC 1.11226
CUP 29.474896
CVE 110.725097
CZK 25.154429
DJF 197.670788
DKK 7.461765
DOP 66.891993
DZD 147.145288
EGP 53.86567
ERN 16.683904
ETB 126.732832
FJD 2.46466
FKP 0.847052
GBP 0.842148
GEL 3.003338
GGP 0.847052
GHS 17.483306
GIP 0.847052
GMD 77.857931
GNF 9621.051255
GTQ 8.607723
GYD 232.817735
HKD 8.668745
HNL 27.598894
HRK 7.56227
HTG 146.637268
HUF 394.090518
IDR 17094.661281
ILS 4.165854
IMP 0.847052
INR 93.266636
IQD 1457.826046
IRR 46831.717491
ISK 152.302078
JEP 0.847052
JMD 174.945984
JOD 0.788263
JPY 156.4327
KES 143.481939
KGS 94.173739
KHR 4532.460805
KMF 492.453354
KPW 1001.033584
KRW 1468.249939
KWD 0.339172
KYD 0.927409
KZT 535.105474
LAK 24586.51271
LBP 99658.517708
LKR 336.084392
LRD 216.835034
LSL 19.658686
LTL 3.284215
LVL 0.672795
LYD 5.310914
MAD 10.841048
MDL 19.335608
MGA 5034.309439
MKD 61.539439
MMK 3612.577867
MNT 3779.46024
MOP 8.934882
MRU 44.256281
MUR 51.108874
MVR 17.073163
MWK 1929.658702
MXN 21.471795
MYR 4.784385
MZN 71.045627
NAD 19.658509
NGN 1823.103063
NIO 40.952468
NOK 11.797983
NPR 149.140417
NZD 1.796762
OMR 0.428162
PAB 1.112811
PEN 4.199901
PGK 4.412421
PHP 61.981842
PKR 309.903495
PLN 4.276184
PYG 8651.746755
QAR 4.04918
RON 4.973474
RSD 117.034281
RUB 101.661095
RWF 1490.428719
SAR 4.17439
SBD 9.309084
SCR 14.918942
SDG 669.022464
SEK 11.33961
SGD 1.441344
SHP 0.847052
SLE 25.412146
SLL 23323.535348
SOS 635.954632
SRD 33.090301
STD 23021.541289
SVC 9.737342
SYP 2794.587146
SZL 19.649014
THB 37.00464
TJS 11.840396
TMT 3.904033
TND 3.369592
TOP 2.613588
TRY 37.81024
TTD 7.555466
TWD 35.441098
TZS 3035.862046
UAH 46.17264
UGX 4134.231064
USD 1.11226
UYU 45.715081
UZS 14187.784086
VEF 4029221.145275
VES 40.854166
VND 27300.42755
VUV 132.04977
WST 3.111507
XAF 656.317086
XAG 0.036092
XAU 0.000431
XCD 3.005939
XDR 0.824752
XOF 656.320038
XPF 119.331742
YER 278.391045
ZAR 19.604591
ZMK 10011.678031
ZMW 29.406134
ZWL 358.147343
  • AEX

    -3.8700

    895.75

    -0.43%

  • BEL20

    -0.4200

    4244.62

    -0.01%

  • PX1

    -15.6800

    7449.44

    -0.21%

  • ISEQ

    -8.7000

    9661.63

    -0.09%

  • OSEBX

    3.5200

    1410.9

    +0.25%

  • PSI20

    -47.8700

    6790.66

    -0.7%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -8.6100

    2600.57

    -0.33%

  • N150

    -4.9700

    3307.1

    -0.15%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

(G.Gruner--BBZ)