Fue uno de los proyectos presentados durante el IV Congreso Internacional de la Lengua, en Medellín (Colombia), por el director de la RAE, Víctor García de la Concha, que hoy firmó con el presidente de esa entidad, Emilio Botín, el acuerdo para materializarlo.
Se trata de ampliar el actual banco de datos que la Real Academia inició en 1996 con el CREA -que recogió 150 millones de registros desde 1975- y el CORDE -300 millones hasta 1974-, en un fondo que permitiera disponer de datos lingüísticos fiables.
El cambio radical que supuso para el sistema de trabajo de la RAE y la Asociación de 21 Academias de la Lengua permitió la XXII edición del Diccionario (DRAE) y los diccionarios Panhispánico de dudas, del Estudiante y el Esencial, beneficiándose también la Nueva Gramática y el Diccionario Académico de americanismos.
Pero aquel diseño, pese a lo ambicioso de su momento, resultaba ya insuficiente para fundamentar en sus cifras y en su distribución geográfica la cantidad de decisiones normativas del amplio mundo hispánico.
De ahí que el pasado marzo, en la cita de Medellín, se decidiera afrontar conjuntamente la construcción de un nuevo corpus del español con 25 millones de formas para cada uno de los años comprendidos entre 2000 y 2011.
Y para adaptar la distribución geográfica de los textos se ha modificado el porcentaje del 50/50% anterior al 30% para España y el 70% para América.
El trabajo lo llevara a cabo un equipo central en la Real Academia Española y equipos colaboradores vinculados a diversas universidades españolas y americanas que codificarán textos de cada zona lingüística