| - La Secretaría Ejecutiva ha establecido las reuniones con la Dirección de la Biblioteca del Congreso Nacional, con el fin de disponer de las facilidades de los textos resguardados en dicha institución.
- La Secretaría Ejecutiva ha fijado, junto a los académicos y los especialistas, aquellos criterios generales de «selección» de los textos que fueron almacenados en las bases de datos del Corpus.
- La Secretaría Ejecutiva ha coordinado los trabajos de un grupo de Ingenieros y Lingüistas, con el propósito de establecer normas de aplicación de los estándares SGML tipificados en la T.E.I.
- La Secretaría Ejecutiva ha vigilado y corregido el ingreso y la normalización de los textos.
- La Secretaría Ejecutiva ha hecho las rendiciones contables a la Sociedad Estatal, los pagos de honorarios, y de los impuestos de segunda categoría (PPM).
- La Secretaría Ejecutiva ha encargado los estudios jurídicos acerca del copyright , los derechos de autor, y las autorizaciones para la reproducción electrónica de los textos seleccionados.
Digitación de textos
El CORPUS CHILENO contrató a la Corporación Click, Santiago de Chile, con dirección en la calle Huérfanos 779, of. 703, Santiago, para el ingreso de los textos seleccionados.
En Mayo del año 1992 estaba completamente definida la frecuencia del ingreso de los textos. Los dos millones de palabras exigidas corresponden a 5.000 páginas de textos aproximadamente (columnas de 85 y líneas de 54 sin márgenes).
Los textos seleccionados fueron transferidos a la Corporación Click, quienes entregaban casi 600 páginas mensuales.
Normalización según estándares de la T.E.I.
Participaron en el estudio:
Ernesto Evans Espiñeira
Julio Retamal Ávila
Pablo Délano Icaza.
Criterios de selección de textos.
| Porcentaje |
Tipo de texto |
| 15% |
de textos científicos. |
| 10% |
de textos económicos comerciales. |
| 15% |
de textos escolares. |
| 5% |
de textos humanísticos. |
| 10% |
de textos hitórico-jurídicos. |
| 10% |
de textos literarios. |
| 15% |
de textos periodísticos. |
| 5% |
de textos publicitarios. |
| 15% |
de textos técnicos. |
Según esta frecuencia, se solicitaron informes de los académicos y especialistas correspondientes de cada área, con el fin de obtener una muestra de los textos más simbólicos de este siglo.
El Corpus Chileno de Referencia tuvo por meta entregar dos millones de palabras según una frecuencia pre-definida:
| Frecuencia de Textos |
Número de Palabras |
Páginas |
| textos científicos. |
300.000
|
850
|
| textos económicos comerciales. |
200.000
|
550
|
| textos escolares. |
300.000
|
850
|
| textos humanísticos. |
100.000
|
275
|
| textos hitórico-jurídicos. |
200.000
|
550
|
| textos literarios. |
200.000
|
550
|
| textos periodísticos. |
300.000
|
850
|
| textos publicitarios. |
100.000
|
275
|
| textos técnicos. |
300.000
|
850
|
Se estimó que cada página contenía entre 390 y 400 palabras. Se calculó como número óptimo el ingreso de 25 a 30 páginas diarias. Cada página ingresada debía ser sometida a un proceso de normalización según las normas de la T.E.I.
|