The Japan Times - OpenAI donne la vision et la voix à ChatGPT

EUR -
AED 3.832604
AFN 79.302548
ALL 98.345388
AMD 416.213474
ANG 1.88158
AOA 953.195728
ARS 1092.497295
AUD 1.657158
AWG 1.880827
AZN 1.775131
BAM 1.962787
BBD 2.108004
BDT 127.320206
BGN 1.958457
BHD 0.393306
BIF 3041.670362
BMD 1.043455
BND 1.416529
BOB 7.214615
BRL 6.144903
BSD 1.044017
BTN 90.200246
BWP 14.490447
BYN 3.416731
BYR 20451.711527
BZD 2.097146
CAD 1.49658
CDF 2968.62876
CHF 0.945725
CLF 0.037418
CLP 1032.487813
CNY 7.605432
CNH 7.598484
COP 4414.867142
CRC 526.870595
CUC 1.043455
CUP 27.651549
CVE 110.953472
CZK 25.103391
DJF 185.443007
DKK 7.460466
DOP 64.078047
DZD 140.965539
EGP 52.472728
ERN 15.65182
ETB 136.327656
FJD 2.409307
FKP 0.859376
GBP 0.843584
GEL 2.984038
GGP 0.859376
GHS 15.859523
GIP 0.859376
GMD 75.128582
GNF 9031.100182
GTQ 8.06853
GYD 218.425495
HKD 8.128053
HNL 26.61286
HRK 7.700224
HTG 136.444431
HUF 409.900238
IDR 16917.008833
ILS 3.735912
IMP 0.859376
INR 90.188761
IQD 1366.925617
IRR 43916.331343
ISK 145.895667
JEP 0.859376
JMD 164.132735
JOD 0.740329
JPY 162.666226
KES 135.125685
KGS 91.248336
KHR 4206.165454
KMF 493.127499
KPW 939.109319
KRW 1497.003017
KWD 0.32153
KYD 0.870089
KZT 543.599991
LAK 22747.311736
LBP 93493.538884
LKR 311.742325
LRD 203.421866
LSL 19.293371
LTL 3.08105
LVL 0.631176
LYD 5.128612
MAD 10.43089
MDL 19.47113
MGA 4925.106292
MKD 61.790503
MMK 3389.100065
MNT 3545.65908
MOP 8.376741
MRU 41.613195
MUR 48.478964
MVR 16.080055
MWK 1811.961908
MXN 21.182897
MYR 4.637137
MZN 66.686871
NAD 19.293269
NGN 1626.224488
NIO 38.427018
NOK 11.737749
NPR 144.320394
NZD 1.836244
OMR 0.40165
PAB 1.044007
PEN 3.872784
PGK 4.176167
PHP 61.176701
PKR 290.758449
PLN 4.210601
PYG 8255.190464
QAR 3.799207
RON 4.975396
RSD 117.113183
RUB 104.214055
RWF 1452.4889
SAR 3.913743
SBD 8.842995
SCR 14.91121
SDG 627.116517
SEK 11.467327
SGD 1.412655
SHP 0.859376
SLE 23.677596
SLL 21880.722614
SOS 596.341121
SRD 36.630502
STD 21597.404937
SVC 9.135303
SYP 13566.9976
SZL 19.293581
THB 35.414801
TJS 11.427071
TMT 3.662526
TND 3.333055
TOP 2.443872
TRY 37.195339
TTD 7.097198
TWD 34.113451
TZS 2625.331861
UAH 43.849382
UGX 3847.660691
USD 1.043455
UYU 45.691786
UZS 13570.127942
VES 58.11215
VND 26222.01585
VUV 123.881034
WST 2.922536
XAF 658.2942
XAG 0.034276
XAU 0.000379
XCD 2.819988
XDR 0.804456
XOF 655.813064
XPF 119.331742
YER 259.87242
ZAR 19.270865
ZMK 9392.339483
ZMW 29.050139
ZWL 335.991978
  • AEX

    -5.2100

    909.11

    -0.57%

  • BEL20

    0.4200

    4242.74

    +0.01%

  • PX1

    54.8600

    7892.61

    +0.7%

  • ISEQ

    152.6600

    10065.59

    +1.54%

  • OSEBX

    13.7000

    1503.03

    +0.92%

  • PSI20

    14.9600

    6520.19

    +0.23%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -13.6700

    3093.21

    -0.44%

  • N150

    8.0800

    3374.91

    +0.24%

OpenAI donne la vision et la voix à ChatGPT
OpenAI donne la vision et la voix à ChatGPT / Photo: Kirill KUDRYAVTSEV - AFP

OpenAI donne la vision et la voix à ChatGPT

OpenAI a présenté lundi une nouvelle version de ChatGPT qui peut désormais tenir des conversations orales et fluides avec ses utilisateurs, un pas de plus vers des assistants d'intelligence artificielle (IA) ultra perfectionnés, le graal actuel de la Silicon Valley.

Taille du texte:

Grâce à un nouveau modèle, GPT-4o ("o" pour "omni"), ChatGPT va pouvoir comprendre aussi bien du texte, que du son et des images, et répondre à l'écrit, par la voix ou en générant des images.

Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, d'abord le texte et l'image pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

Elle permet de reproduire de façon bluffante des discussions entre humains.

Dans une démonstration vidéo diffusée en direct, ChatGPT a ainsi lu les émotions des utilisateurs sur leurs visages via la caméra d'un smartphone, les a guidés dans des exercices de respiration, leur a raconté une histoire et les a aidés à résoudre un problème mathématique. Surtout, les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour.

- "Prophétique" -

Fin 2022, avec le lancement de ChatGPT, qui génère des contenus sur simple requête en langage courant, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.

Depuis, toute la Silicon Valley s'est lancée dans une course aux outils et assistants d'IA toujours plus performants. Google doit présenter ses dernières innovations mardi, tandis que Microsoft, principal investisseur d'OpenAI, a prévu un événement pour la presse et les développeurs la semaine prochaine.

Vendredi, Sam Altman, le patron d'OpenAI, avait démenti les rumeurs au sujet des annonces que préparait son entreprise. "Pas GPT-5, pas un moteur de recherche", avait-il déclaré sur X (ex-Twitter). "Mais (…) nous avons travaillé sur des nouvelles choses et nous pensons que les gens vont adorer", avait-il ajouté. "Pour moi, c'est comme de la magie."

Dans le passé, il avait confié adorer le film de science-fiction "Her", où un homme tombe amoureux d'une IA, en conversant à l'oral avec elle.

"C'était incroyablement prophétique", avait-il déclaré en septembre dernier lors d'une conférence. "Et cela nous a inspirés à plus d'un titre, (...) notamment l'idée que nous ayons tous un agent personnalisé qui essaie de nous aider."

ChatGPT est encore loin des agents d'IA omniscients, proactifs et personnalisés que promettent les entreprises. Mais cette mise à jour a impressionné, ou inquiété, les experts du secteur.

- "Anthropomorphisation" -

"J’ai été frappé à quel point les démonstrations anthropomorphisent les modèles", a réagi Jeff Boudier, de Hugging Face, pour l'AFP. "Cela crée de la confusion et des fausses attentes".

"Les gens risquent de projeter des qualités sur les modèles, et de s'attacher émotionnellement. Ils ne vont pas comprendre pourquoi les modèles peuvent créer de fausses informations, ni savoir dans quelles situations ils peuvent leur faire confiance ou pas", a expliqué le responsable produit de cette plateforme collaborative et ouverte d'IA générative.

Sam Altman promeut régulièrement sa vision d'une IA qui sera un jour "générale", c'est-à-dire dotée de capacités cognitives humaines, capable de réaliser des percées scientifiques au service de l'humanité.

La société OpenAI, initialement créée comme un laboratoire de recherche à but non lucratif, a été valorisée à quelque 80 milliards de dollars, selon le New York Times, lors d'une vente de titres en février dernier. Et d'après le Financial Times, ses revenus annualisés sont de l'ordre de 2 milliards de dollars depuis décembre 2023.

"Une part très importante de notre mission consiste à mettre gratuitement à la disposition du public tous nos outils d'IA avancés (pour que) les gens comprennent de façon intuitive ce que la technologie peut faire", a souligné Mira Murati, directrice technologique de la start-up californienne, pendant la présentation de lundi.

"C'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation", a-t-elle ajouté. "C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines".

T.Ueda--JT