Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 3.833036
AFN 72.965693
ALL 98.471179
AMD 410.488288
ANG 1.873203
AOA 958.000963
ARS 1062.038807
AUD 1.66843
AWG 1.878434
AZN 1.766427
BAM 1.956221
BBD 2.098651
BDT 124.206714
BGN 1.955593
BHD 0.392184
BIF 3072.96093
BMD 1.043574
BND 1.411604
BOB 7.182545
BRL 6.351196
BSD 1.039424
BTN 88.365005
BWP 14.36609
BYN 3.401532
BYR 20454.059244
BZD 2.089349
CAD 1.499345
CDF 2995.05897
CHF 0.932946
CLF 0.037363
CLP 1030.951736
CNY 7.614337
CNH 7.609349
COP 4549.678541
CRC 524.41279
CUC 1.043574
CUP 27.654723
CVE 110.288721
CZK 25.122494
DJF 185.089809
DKK 7.459825
DOP 63.293613
DZD 140.679257
EGP 53.089735
ERN 15.653617
ETB 129.567767
FJD 2.418014
FKP 0.826492
GBP 0.830541
GEL 2.93199
GGP 0.826492
GHS 15.279286
GIP 0.826492
GMD 75.137432
GNF 8979.931397
GTQ 8.008723
GYD 217.45677
HKD 8.1152
HNL 26.384675
HRK 7.485461
HTG 135.979246
HUF 414.003677
IDR 16875.955523
ILS 3.804173
IMP 0.826492
INR 88.654261
IQD 1361.59285
IRR 43921.44146
ISK 145.182373
JEP 0.826492
JMD 162.624977
JOD 0.739996
JPY 163.239012
KES 134.188861
KGS 90.791231
KHR 4176.898364
KMF 486.43613
KPW 939.216423
KRW 1509.44706
KWD 0.321369
KYD 0.866186
KZT 545.867405
LAK 22749.89303
LBP 93077.018935
LKR 305.165635
LRD 188.650575
LSL 19.135816
LTL 3.081404
LVL 0.631248
LYD 5.107098
MAD 10.46095
MDL 19.145118
MGA 4904.05476
MKD 61.548238
MMK 3389.48911
MNT 3546.065849
MOP 8.32099
MRU 41.336891
MUR 49.25533
MVR 16.074375
MWK 1802.287635
MXN 20.948886
MYR 4.704445
MZN 66.688299
NAD 19.135816
NGN 1617.06
NIO 38.248226
NOK 11.818742
NPR 141.384409
NZD 1.847868
OMR 0.401566
PAB 1.039424
PEN 3.870432
PGK 4.214907
PHP 61.435071
PKR 289.313125
PLN 4.262104
PYG 8104.743162
QAR 3.789115
RON 4.979519
RSD 117.055686
RUB 107.251485
RWF 1448.911631
SAR 3.919987
SBD 8.748864
SCR 14.552642
SDG 627.709679
SEK 11.516721
SGD 1.41425
SHP 0.826492
SLE 23.790453
SLL 21883.237615
SOS 594.027763
SRD 36.661863
STD 21599.884172
SVC 9.094956
SYP 2622.01237
SZL 19.131115
THB 35.711018
TJS 11.370846
TMT 3.662946
TND 3.312012
TOP 2.444153
TRY 36.698543
TTD 7.054517
TWD 34.052871
TZS 2468.53093
UAH 43.591676
UGX 3812.820058
USD 1.043574
UYU 46.359971
UZS 13400.882252
VES 53.718256
VND 26564.187656
VUV 123.895249
WST 2.883175
XAF 656.098113
XAG 0.035368
XAU 0.000398
XCD 2.820312
XDR 0.792871
XOF 656.098113
XPF 119.331742
YER 261.284971
ZAR 19.072706
ZMK 9393.420989
ZMW 28.765187
ZWL 336.030548
  • AEX

    -3.4300

    875.44

    -0.39%

  • BEL20

    9.6700

    4214.22

    +0.23%

  • PX1

    -19.6900

    7274.48

    -0.27%

  • ISEQ

    -17.4700

    9685.54

    -0.18%

  • OSEBX

    -5.4800

    1400.54

    -0.39%

  • PSI20

    -14.4700

    6276.75

    -0.23%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    14.8900

    3053.27

    +0.49%

  • N150

    3.2200

    3227.17

    +0.1%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

(G.Gruner--BBZ)