OpenAI donne la vision et la voix à ChatGPT

Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

Berlin 4°C

EUR -

AED 3.833036

AFN 72.965693

ALL 98.471179

AMD 410.488288

ANG 1.873203

AOA 958.000963

ARS 1062.038807

AUD 1.66843

AWG 1.878434

AZN 1.766427

BAM 1.956221

BBD 2.098651

BDT 124.206714

BGN 1.955593

BHD 0.392184

BIF 3072.96093

BMD 1.043574

BND 1.411604

BOB 7.182545

BRL 6.351196

BSD 1.039424

BTN 88.365005

BWP 14.36609

BYN 3.401532

BYR 20454.059244

BZD 2.089349

CAD 1.499345

CDF 2995.05897

CHF 0.932946

CLF 0.037363

CLP 1030.951736

CNY 7.614337

CNH 7.609349

COP 4549.678541

CRC 524.41279

CUC 1.043574

CUP 27.654723

CVE 110.288721

CZK 25.122494

DJF 185.089809

DKK 7.459825

DOP 63.293613

DZD 140.679257

EGP 53.089735

ERN 15.653617

ETB 129.567767

FJD 2.418014

FKP 0.826492

GBP 0.830541

GEL 2.93199

GGP 0.826492

GHS 15.279286

GIP 0.826492

GMD 75.137432

GNF 8979.931397

GTQ 8.008723

GYD 217.45677

HKD 8.1152

HNL 26.384675

HRK 7.485461

HTG 135.979246

HUF 414.003677

IDR 16875.955523

ILS 3.804173

IMP 0.826492

INR 88.654261

IQD 1361.59285

IRR 43921.44146

ISK 145.182373

JEP 0.826492

JMD 162.624977

JOD 0.739996

JPY 163.239012

KES 134.188861

KGS 90.791231

KHR 4176.898364

KMF 486.43613

KPW 939.216423

KRW 1509.44706

KWD 0.321369

KYD 0.866186

KZT 545.867405

LAK 22749.89303

LBP 93077.018935

LKR 305.165635

LRD 188.650575

LSL 19.135816

LTL 3.081404

LVL 0.631248

LYD 5.107098

MAD 10.46095

MDL 19.145118

MGA 4904.05476

MKD 61.548238

MMK 3389.48911

MNT 3546.065849

MOP 8.32099

MRU 41.336891

MUR 49.25533

MVR 16.074375

MWK 1802.287635

MXN 20.948886

MYR 4.704445

MZN 66.688299

NAD 19.135816

NGN 1617.06

NIO 38.248226

NOK 11.818742

NPR 141.384409

NZD 1.847868

OMR 0.401566

PAB 1.039424

PEN 3.870432

PGK 4.214907

PHP 61.435071

PKR 289.313125

PLN 4.262104

PYG 8104.743162

QAR 3.789115

RON 4.979519

RSD 117.055686

RUB 107.251485

RWF 1448.911631

SAR 3.919987

SBD 8.748864

SCR 14.552642

SDG 627.709679

SEK 11.516721

SGD 1.41425

SHP 0.826492

SLE 23.790453

SLL 21883.237615

SOS 594.027763

SRD 36.661863

STD 21599.884172

SVC 9.094956

SYP 2622.01237

SZL 19.131115

THB 35.711018

TJS 11.370846

TMT 3.662946

TND 3.312012

TOP 2.444153

TRY 36.698543

TTD 7.054517

TWD 34.052871

TZS 2468.53093

UAH 43.591676

UGX 3812.820058

USD 1.043574

UYU 46.359971

UZS 13400.882252

VES 53.718256

VND 26564.187656

VUV 123.895249

WST 2.883175

XAF 656.098113

XAG 0.035368

XAU 0.000398

XCD 2.820312

XDR 0.792871

XOF 656.098113

XPF 119.331742

YER 261.284971

ZAR 19.072706

ZMK 9393.420989

ZMW 28.765187

ZWL 336.030548

AEX

-3.4300

875.44

-0.39%
BEL20

9.6700

4214.22

+0.23%
PX1

-19.6900

7274.48

-0.27%
ISEQ

-17.4700

9685.54

-0.18%
OSEBX

-5.4800

1400.54

-0.39%
PSI20

-14.4700

6276.75

-0.23%
ENTEC

-5.8300

1416.23

-0.41%
BIOTK

14.8900

3053.27

+0.49%
N150

3.2200

3227.17

+0.1%

OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

TECHNOLOGIE 13.05.2024

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

(G.Gruner--BBZ)

Berliner Boersenzeitung - OpenAI donne la vision et la voix à ChatGPT

OpenAI donne la vision et la voix à ChatGPT

En vedette

Des milliers de personnes célèbrent le solstice d'hiver à Stonehenge

Des scientifiques observent un "temps négatif" grâce à des expériences quantiques

Alep prête à revivre, malgré les ravages infligés à son patrimoine

L'IA plus douée que l'homme pour prédire l'arôme d'un whisky