Berliner Boersenzeitung - La diversidad del español, enloquecedora para la inteligencia artificial

EUR -
AED 4.09901
AFN 76.989056
ALL 99.290141
AMD 432.192289
ANG 2.011913
AOA 1035.386702
ARS 1074.098225
AUD 1.639961
AWG 2.008793
AZN 1.901624
BAM 1.956573
BBD 2.253991
BDT 133.402737
BGN 1.953965
BHD 0.420623
BIF 3236.121309
BMD 1.115996
BND 1.44247
BOB 7.713911
BRL 6.15305
BSD 1.116341
BTN 93.301912
BWP 14.756966
BYN 3.653344
BYR 21873.525049
BZD 2.250149
CAD 1.514028
CDF 3204.025425
CHF 0.949606
CLF 0.03764
CLP 1038.602283
CNY 7.869898
CNH 7.861953
COP 4633.616123
CRC 579.218597
CUC 1.115996
CUP 29.573899
CVE 110.307124
CZK 25.054454
DJF 198.335279
DKK 7.459212
DOP 67.006489
DZD 147.641875
EGP 54.135082
ERN 16.739943
ETB 129.539788
FJD 2.455531
FKP 0.849897
GBP 0.83852
GEL 3.047105
GGP 0.849897
GHS 17.549623
GIP 0.849897
GMD 76.450036
GNF 9644.683106
GTQ 8.629489
GYD 233.528133
HKD 8.695151
HNL 27.691947
HRK 7.58767
HTG 147.295589
HUF 393.020806
IDR 16929.717789
ILS 4.225859
IMP 0.849897
INR 93.170894
IQD 1462.378108
IRR 46975.073296
ISK 152.114535
JEP 0.849897
JMD 175.389335
JOD 0.790799
JPY 160.589064
KES 144.008576
KGS 94.009848
KHR 4533.7923
KMF 492.545341
KPW 1004.395926
KRW 1488.07353
KWD 0.340469
KYD 0.930276
KZT 535.211989
LAK 24650.303003
LBP 99966.527279
LKR 340.594644
LRD 223.26426
LSL 19.597823
LTL 3.295247
LVL 0.675055
LYD 5.301286
MAD 10.824867
MDL 19.479875
MGA 5048.905452
MKD 61.626661
MMK 3624.712047
MNT 3792.154956
MOP 8.960782
MRU 44.363935
MUR 51.202327
MVR 17.142123
MWK 1935.530467
MXN 21.676597
MYR 4.692807
MZN 71.256777
NAD 19.597647
NGN 1829.620351
NIO 41.08569
NOK 11.718262
NPR 149.286016
NZD 1.789531
OMR 0.429634
PAB 1.116321
PEN 4.184198
PGK 4.369884
PHP 62.08849
PKR 310.175419
PLN 4.270192
PYG 8709.44302
QAR 4.069909
RON 4.973218
RSD 117.079418
RUB 103.062741
RWF 1504.908406
SAR 4.187915
SBD 9.27051
SCR 14.830813
SDG 671.275802
SEK 11.359865
SGD 1.44083
SHP 0.849897
SLE 25.497503
SLL 23401.876073
SOS 637.957914
SRD 33.708707
STD 23098.867655
SVC 9.76773
SYP 2803.973801
SZL 19.604926
THB 36.761326
TJS 11.866478
TMT 3.905987
TND 3.382537
TOP 2.613779
TRY 38.072924
TTD 7.592866
TWD 35.712252
TZS 3042.431049
UAH 46.142795
UGX 4135.783196
USD 1.115996
UYU 46.127615
UZS 14205.615769
VEF 4042754.77568
VES 41.018985
VND 27459.08591
VUV 132.493308
WST 3.121958
XAF 656.204651
XAG 0.035869
XAU 0.000426
XCD 3.016036
XDR 0.827327
XOF 656.207592
XPF 119.331742
YER 279.361784
ZAR 19.504527
ZMK 10045.308782
ZMW 29.554154
ZWL 359.350313
La diversidad del español, enloquecedora para la inteligencia artificial
La diversidad del español, enloquecedora para la inteligencia artificial / Foto: Josep Lago - AFP/Archivos

La diversidad del español, enloquecedora para la inteligencia artificial

La inteligencia artificial necesitará mucho alimento para que todo hablante del español se pueda dirigir a ella con naturalidad, teniendo en cuenta sus 21 variedades nacionales, acentos, subacentos y jergas como la gaditana o el lunfardo.

Tamaño del texto:

Uno de los temas centrales del IX Congreso Internacional de la Lengua Española (CILE) que se celebra en la ciudad andaluza de Cádiz del lunes al jueves es la inteligencia artificial, y el acto inaugural dejó un momento que da una idea del trecho que tienen que recorrer las máquinas.

Fue cuando el alcalde de la ciudad anfitriona, José María González Santos, más conocido como Kichi, le deseó a los participantes que lo pasen bien, en pura habla gaditana.

"Señoras y señores, estén al 'liquindoi', aprovechen 'la collá' y la 'conviá', disfruten del 'tangai', para que cuando les toque 'guannajarse' puedan decir con orgullo que este congreso ha sido un 'bastinazo'", lanzó Kichi.

Pues bien, esto es lo que transcribió uno de los programas más populares del mundo: "señoras y señores, China lindo y aproveche la ***** y la cumbia y disfruten del tangai para que cuando les toque guardarse puedan decir con orgullo que este congreso ha sido un partidazo".

Esto, explicó a la AFP Virginia Bertolotti, lingüista uruguaya, "es una muestra de que si alimentamos las inteligencias artificiales con algo que es relativamente plano, como es internet, hay cosas que hacen muy bien, pero hay cosas que no pueden hacer".

"Si yo le digo 'hazme un diálogo entre gauchos del siglo XIX', hace cualquier cosa", sostuvo esta catedrática de la Universidad de la República, miembro de la Academia de Letras de Uruguay.

- Correctores incorrectos -

La inteligencia artificial es la "disciplina científica que se ocupa de crear programas informáticos que ejecutan operaciones comparables a las que realiza la mente humana", según la definición de la Real Academia de la Lengua (RAE), que la eligió palabra del año en 2022.

Es un campo con mucho en juego, indicó el ministro español de Asuntos Exteriores, José Manuel Albares, cuando advirtió que hay que "posicionar el español en el núcleo central de la Inteligencia Artificial (IA), en el metaverso".

Muchos de los inventos de esta nueva disciplina son ya de uso común, como los correctores, los traductores, o los redactores o "chatbots".

El problema de estas herramientas, advirtió el director de la Real Academia de la Lengua, Santiago Muñoz Machado, es que estos instrumentos "no usan el canon panhispánico de la lengua, sino el canon de Silicón Valley".

"Hemos advertido en la Academia que lo que nos corrige ese corrector, normalmente no es correcto, y no son juegos de palabras, es exactamente así", ahondó.

El remedio, explicó Bertolotti, sería "sofisticar" la gran cantidad de datos que la inteligencia artificial barre de internet, mediante "muchos materiales que son pequeños corpus de especialidades, que hemos ido trabajando en investigación lingüística".

"El habla de la calle, el habla cotidiana, en el caso del español, que es una lengua de mucho espesor cultural, con una gran distribución geográfica, no necesariamente está capturado por el tipo de datos que se suelen utilizar para entrenar a las inteligencias artificiales", argumentó la lingüista.

- El problema de la lista de la compra -

Asunción Gómez-Pérez, miembro de la RAE y asesora en inteligencia artificial del gobierno de España, cree que podría acabar dándose el caso de que unas variantes del español acaben siendo más dominantes que otras en la inteligencia artificial.

"Los modelos del lenguaje que estamos utilizando ahora se nutren de grandes cantidades de textos que han sido escritos por personas las cuales pertenecen a ciertos países y utilizan cierto vocabulario", explicó a la AFP.

"Cuantos más textos haya de una variante, más posibilidades tiene esa variedad de ser la aceptada", concluyó Gómez-Pérez.

Si acaba siendo el caso, esas avanzadillas domésticas de la inteligencia artificial que son Siri y Alexa sufrirán para entender que cuando se les pide que incluyan en la lista del supermercado ejotes, agujas, chauchas, frijoles verdes, navajitas o judías verdes, se les está pidiendo exactamente lo mismo.

(T.Renner--BBZ)