viernes,19 agosto 2022
Espacio euroiberoamericano de diálogo sobre la innovación social, profesional y académica
InicioSociedad, Política y SostenibilidadCultura & TendenciasNuevo banco léxico español: 300 millones de palabras, la mayoría de América
IV Congreso Internacional de la Lengua

Nuevo banco léxico español: 300 millones de palabras, la mayoría de América

EFE
El "Corpus del Español del siglo XXI", nuevo banco de datos de la Lengua española en el mundo, contará con 300 millones de palabras tomadas en un 70 por ciento de textos procedentes de América, según el convenio suscrito ayer entre la Real Academia Española (RAE) y el Banco de Santander.

Fue uno de los proyectos presentados durante el IV Congreso Internacional de la Lengua, en Medellín (Colombia), por el director de la RAE, Víctor García de la Concha, que hoy firmó con el presidente de esa entidad, Emilio Botín, el acuerdo para materializarlo.

Se trata de ampliar el actual banco de datos que la Real Academia inició en 1996 con el CREA -que recogió 150 millones de registros desde 1975- y el CORDE -300 millones hasta 1974-, en un fondo que permitiera disponer de datos lingüísticos fiables.

El cambio radical que supuso para el sistema de trabajo de la RAE y la Asociación de 21 Academias de la Lengua permitió la XXII edición del Diccionario (DRAE) y los diccionarios Panhispánico de dudas, del Estudiante y el Esencial, beneficiándose también la Nueva Gramática y el Diccionario Académico de americanismos.

Pero aquel diseño, pese a lo ambicioso de su momento, resultaba ya insuficiente para fundamentar en sus cifras y en su distribución geográfica la cantidad de decisiones normativas del amplio mundo hispánico.

De ahí que el pasado marzo, en la cita de Medellín, se decidiera afrontar conjuntamente la construcción de un nuevo corpus del español con 25 millones de formas para cada uno de los años comprendidos entre 2000 y 2011.

Y para adaptar la distribución geográfica de los textos se ha modificado el porcentaje del 50/50% anterior al 30% para España y el 70% para América.

El trabajo lo llevara a cabo un equipo central en la Real Academia Española y equipos colaboradores vinculados a diversas universidades españolas y americanas que codificarán textos de cada zona lingüística

De interés

Artículos Relacionados

Centro de preferencias de privacidad