The Japan Times - L'avenir incertain de la lecture humaine dans le livre audio

EUR -
AED 4.133016
AFN 79.014964
ALL 98.31862
AMD 437.773181
ANG 2.028041
AOA 1029.611125
ARS 1251.855289
AUD 1.757365
AWG 2.028278
AZN 1.917126
BAM 1.956188
BBD 2.27115
BDT 136.667097
BGN 1.957015
BHD 0.424126
BIF 3346.233724
BMD 1.125258
BND 1.460277
BOB 7.772472
BRL 6.358049
BSD 1.124823
BTN 95.99718
BWP 15.25155
BYN 3.680997
BYR 22055.058879
BZD 2.259428
CAD 1.566056
CDF 3235.116973
CHF 0.935354
CLF 0.027388
CLP 1050.991307
CNY 8.130384
CNH 8.147347
COP 4784.788761
CRC 570.908121
CUC 1.125258
CUP 29.81934
CVE 110.286867
CZK 24.935346
DJF 200.293482
DKK 7.46036
DOP 66.183122
DZD 149.756373
EGP 56.958762
ERN 16.878872
ETB 150.919382
FJD 2.555122
FKP 0.847092
GBP 0.847505
GEL 3.100118
GGP 0.847092
GHS 14.790472
GIP 0.847092
GMD 80.45191
GNF 9740.931344
GTQ 8.651715
GYD 236.009453
HKD 8.752319
HNL 29.224002
HRK 7.533489
HTG 146.89782
HUF 404.826792
IDR 18607.661882
ILS 3.992618
IMP 0.847092
INR 96.074256
IQD 1473.603486
IRR 47387.433667
ISK 146.914045
JEP 0.847092
JMD 178.79545
JOD 0.79826
JPY 163.330066
KES 145.386217
KGS 98.404068
KHR 4502.852769
KMF 487.764367
KPW 1012.925798
KRW 1575.676432
KWD 0.345139
KYD 0.937357
KZT 580.499938
LAK 24314.604801
LBP 100782.086532
LKR 336.073647
LRD 224.962604
LSL 20.458156
LTL 3.322595
LVL 0.680658
LYD 6.164222
MAD 10.405863
MDL 19.278223
MGA 5060.958465
MKD 61.534193
MMK 2362.75524
MNT 4023.127953
MOP 9.011706
MRU 44.812885
MUR 51.435748
MVR 17.340245
MWK 1950.369369
MXN 21.946483
MYR 4.835229
MZN 71.903861
NAD 20.459702
NGN 1811.046958
NIO 41.391333
NOK 11.667205
NPR 153.595088
NZD 1.909774
OMR 0.433205
PAB 1.124813
PEN 4.086719
PGK 4.66876
PHP 62.416374
PKR 316.774807
PLN 4.23953
PYG 8992.783008
QAR 4.104414
RON 5.118577
RSD 117.233244
RUB 93.958644
RWF 1616.870287
SAR 4.220687
SBD 9.39686
SCR 15.963385
SDG 675.715336
SEK 10.919375
SGD 1.46018
SHP 0.884276
SLE 25.576714
SLL 23596.081583
SOS 642.82174
SRD 40.798425
STD 23290.570909
SVC 9.841951
SYP 14633.498546
SZL 20.448873
THB 37.125708
TJS 11.641705
TMT 3.949656
TND 3.385971
TOP 2.635468
TRY 43.601462
TTD 7.641447
TWD 34.013207
TZS 3035.387599
UAH 46.726103
UGX 4116.816245
USD 1.125258
UYU 47.019323
UZS 14487.872525
VES 102.509005
VND 29232.517709
VUV 135.84037
WST 3.117633
XAF 656.081251
XAG 0.034527
XAU 0.000337
XCD 3.041067
XDR 0.808666
XOF 656.087083
XPF 119.331742
YER 275.127045
ZAR 20.483867
ZMK 10128.668579
ZMW 29.610608
ZWL 362.332651
  • AEX

    3.7900

    905.68

    +0.42%

  • BEL20

    27.0300

    4385.97

    +0.62%

  • PX1

    71.5600

    7766.17

    +0.93%

  • ISEQ

    66.1100

    10904.12

    +0.61%

  • OSEBX

    -1.8200

    1512.33

    -0.12%

  • PSI20

    -14.7500

    7009.8

    -0.21%

  • ENTEC

    -5.8300

    1416.23

    -0.41%

  • BIOTK

    -257.6700

    2521.98

    -9.27%

  • N150

    33.4200

    3514.92

    +0.96%

L'avenir incertain de la lecture humaine dans le livre audio
L'avenir incertain de la lecture humaine dans le livre audio / Photo: Thomas SAMSON - AFP/Archives

L'avenir incertain de la lecture humaine dans le livre audio

Faire lire intégralement un livre en vue de sa version audio coûte cher, trop cher pour certains promoteurs de ce format. Alors ils investissent dans le clonage de voix et les voix de synthèse.

Taille du texte:

Nicolas Sarkozy, par exemple, a enregistré en 2021 plus de 13 heures de ses mémoires de président, "Le Temps des tempêtes". Barack Obama a fait plus fort avec "Une terre promise" en 2020: 29 heures.

D'autres livres sont lus par des comédiens. Denis Podalydès a prêté sa voix à "Martin Eden", roman de Jack London. La narratrice du prix Goncourt 2024, "Houris" de Kamel Daoud, est incarnée par Lola Naymark, moins connue.

Mais des productions de ce genre, assez ou très onéreuses, ont un avenir incertain parmi les livres audio, qui font désormais de plus en plus souvent appel à l'intelligence artificielle (IA). Le Festival du livre de Paris, du 11 au 13 avril, a été l'occasion de deux annonces en ce sens.

Librinova, numéro un français de l'auto-édition, a ainsi dit adopter "la technologie de clonage vocal, qui permet d'obtenir une qualité largement supérieure à celle des voix synthétiques, souvent trop robotiques".

Un auteur enregistre la lecture d'une petite partie seulement de son livre et l'IA va extrapoler l'autre partie.

- "Il faut de tout" -

Spotify, le numéro un mondial du streaming, a lui indiqué qu'il investissait un million d'euros pour "des livres narrés par la voix de synthèse", autrement dit une machine qui imite, de plus en plus fidèlement, la voix humaine.

Et d'expliquer: "Les coûts importants de production et l'adoption encore naissante de l'usage du livre audio ont eu pour conséquences de limiter l'offre et le catalogue existant en français".

Spotify indique clairement à ses utilisateurs quelle voix leur fait la lecture. À eux de savoir s'ils acceptent qu'elle soit artificielle.

La plateforme suédoise n'abandonne pas les livres intégralement lus par un humain. "Ils viennent aider les éditeurs en finançant une partie de la production. Pour qu'un marché se développe et soit mature, il faut de tout", souligne auprès de l'AFP le directeur général de Hugo Publishing, Arthur de Saint-Vincent.

Cet éditeur, qui s'est imposé comme le numéro un de la romance en France, a pour sa part annoncé une offensive dans le livre audio, sans IA de son côté. Avec sa maison mère Glénat, il proposera 200 nouveaux titres dans les trois ans à venir.

"Nous en sommes à un stade de développement où nous pouvons investir dans une production de qualité. Donc on veut choisir les voix, travailler avec des comédiens et, avec le partenaire que nous avons choisi, le studio Blynd à Lyon, être intransigeants à chaque fois", avance le patron de Hugo.

- Monotonie -

Tout le monde n'a toutefois pas la trésorerie pour suivre.

En 2021, le numéro un du livre audio dans le monde, Audible, filiale d'Amazon, écrivait sur son site internet français: "Au départ, les livres audio utilisaient la synthèse vocale, c'est-à-dire une voix générée par ordinateur. Aujourd'hui, la voix humaine est privilégiée, car elle permet une plus grande proximité avec le lecteur, plus de chaleur et une meilleure intonation".

Quatre ans plus tard, la recherche "virtual voice" ("voix artificielle") sur son catalogue anglophone donne "plus de 50.000 résultats". L'immense majorité des titres sont signés d'auteurs mal ou pas connus.

La qualité de cette lecture laisse des appréciations contrastées, tantôt enthousiastes sur les progrès rapides de cette technologie, tantôt sceptiques sur ses limitations.

"Je ne pense pas que la narration par IA soit bonne avec les émotions des personnages, hélas", a par exemple commenté sur X Alisanya, autrice anglophone de romans "fantasy" autoédités sur Amazon.

Les voix de synthèse ne bafouillent jamais et commettent de moins en moins d'erreurs dans la prononciation des noms propres. À l'intérieur d'une phrase, elles ont des modulations. Mais sur la longueur elles peuvent devenir monotones: elles ne savent pas (encore) accélérer ou ralentir, monter ou baisser l'intensité, s'agacer, s'étrangler, s'essouffler ni sangloter.

K.Okada--JT