The Japan Times - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 3.806008
AFN 78.239108
ALL 99.502096
AMD 411.744396
ANG 1.866877
AOA 947.11077
ARS 1089.291062
AUD 1.666254
AWG 1.867798
AZN 1.759212
BAM 1.952533
BBD 2.091471
BDT 126.314414
BGN 1.951633
BHD 0.390631
BIF 3066.170393
BMD 1.036226
BND 1.405701
BOB 7.157921
BRL 6.040782
BSD 1.035852
BTN 89.678807
BWP 14.427654
BYN 3.389814
BYR 20310.037946
BZD 2.080689
CAD 1.504103
CDF 2956.354193
CHF 0.943002
CLF 0.036946
CLP 1019.366955
CNY 7.447255
CNH 7.560417
COP 4329.09495
CRC 522.51828
CUC 1.036226
CUP 27.46
CVE 110.078187
CZK 25.184465
DJF 184.458736
DKK 7.461514
DOP 63.992942
DZD 140.129897
EGP 52.043125
ERN 15.543396
ETB 132.687597
FJD 2.405444
FKP 0.853423
GBP 0.836105
GEL 2.96384
GGP 0.853423
GHS 15.848257
GIP 0.853423
GMD 75.127404
GNF 8953.718287
GTQ 8.012595
GYD 216.714307
HKD 8.074572
HNL 26.387854
HRK 7.646883
HTG 135.493324
HUF 407.857669
IDR 16907.070363
ILS 3.703525
IMP 0.853423
INR 89.757413
IQD 1356.929899
IRR 43625.132136
ISK 146.698579
JEP 0.853423
JMD 163.361184
JOD 0.734892
JPY 160.23739
KES 133.883609
KGS 90.618144
KHR 4167.966789
KMF 489.979466
KPW 932.603898
KRW 1506.730209
KWD 0.319624
KYD 0.863243
KZT 536.743915
LAK 22535.971807
LBP 92759.473571
LKR 308.693565
LRD 206.132163
LSL 19.334953
LTL 3.059707
LVL 0.626803
LYD 5.085321
MAD 10.397705
MDL 19.339366
MGA 4816.871798
MKD 61.464499
MMK 3365.62301
MNT 3521.097506
MOP 8.314869
MRU 41.496578
MUR 48.339748
MVR 15.968092
MWK 1796.169065
MXN 21.444571
MYR 4.616413
MZN 66.225093
NAD 19.334953
NGN 1557.44845
NIO 38.116233
NOK 11.747569
NPR 143.485108
NZD 1.836737
OMR 0.398954
PAB 1.035852
PEN 3.853453
PGK 4.217801
PHP 60.491273
PKR 288.925736
PLN 4.213505
PYG 8170.331293
QAR 3.775883
RON 4.976687
RSD 117.12885
RUB 102.136691
RWF 1470.318919
SAR 3.886592
SBD 8.759936
SCR 15.558223
SDG 622.771963
SEK 11.491394
SGD 1.406216
SHP 0.853423
SLE 23.703691
SLL 21729.149953
SOS 592.001031
SRD 36.37103
STD 21447.794881
SVC 9.063531
SYP 13473.015973
SZL 19.322674
THB 34.810016
TJS 11.326887
TMT 3.637155
TND 3.308465
TOP 2.426943
TRY 37.157838
TTD 7.026144
TWD 34.089262
TZS 2642.377626
UAH 43.199087
UGX 3813.619934
USD 1.036226
UYU 44.825009
UZS 13440.514442
VES 59.985936
VND 25988.558759
VUV 123.022882
WST 2.902291
XAF 654.851974
XAG 0.032777
XAU 0.000368
XCD 2.800454
XDR 0.791849
XOF 654.839356
XPF 119.331742
YER 257.89083
ZAR 19.327933
ZMK 9327.280883
ZMW 28.978101
ZWL 333.664486
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

M.Ito--JT