Estás en: Inicio > Intercampus > Investigación y reflexión > Lenguas y Lingüística > Recursos > Corpus > Chile > Acced... > Acciones
  IntercampusInvestigación y reflexiónLenguas y LingüísticaRecursos CorpusChileAcceder a documentaciónAntecedentes Acciones Diagrama de flujoArchivos estandarizadosDTD y encabezado de un libro del corpus chileno



 
Portada de EducaRed
Información
Actividades
Recursos educativos
Formación
Educación en valores
Comunidad virtual
Herramientas y servicios
Acciones
 

- La Secretaría Ejecutiva ha establecido las reuniones con la Dirección de la Biblioteca del Congreso Nacional, con el fin de disponer de las facilidades de los textos resguardados en dicha institución.

- La Secretaría Ejecutiva ha fijado, junto a los académicos y los especialistas, aquellos criterios generales de «selección» de los textos que fueron almacenados en las bases de datos del Corpus.

- La Secretaría Ejecutiva ha coordinado los trabajos de un grupo de Ingenieros y Lingüistas, con el propósito de establecer normas de aplicación de los estándares SGML tipificados en la T.E.I.

- La Secretaría Ejecutiva ha vigilado y corregido el ingreso y la normalización de los textos.

- La Secretaría Ejecutiva ha hecho las rendiciones contables a la Sociedad Estatal, los pagos de honorarios, y de los impuestos de segunda categoría (PPM).

- La Secretaría Ejecutiva ha encargado los estudios jurídicos acerca del copyright , los derechos de autor, y las autorizaciones para la reproducción electrónica de los textos seleccionados.

Digitación de textos

El CORPUS CHILENO contrató a la Corporación Click, Santiago de Chile, con dirección en la calle Huérfanos 779, of. 703, Santiago, para el ingreso de los textos seleccionados.

En Mayo del año 1992 estaba completamente definida la frecuencia del ingreso de los textos. Los dos millones de palabras exigidas corresponden a 5.000 páginas de textos aproximadamente (columnas de 85 y líneas de 54 sin márgenes).

Los textos seleccionados fueron transferidos a la Corporación Click, quienes entregaban casi 600 páginas mensuales.

Normalización según estándares de la T.E.I.

Participaron en el estudio:

Ernesto Evans Espiñeira

Julio Retamal Ávila

Pablo Délano Icaza.

Criterios de selección de textos.

 Porcentaje  Tipo de texto
15%  de textos científicos.
10%  de textos económicos comerciales.
15%  de textos escolares.
5%  de textos humanísticos.
10%  de textos hitórico-jurídicos.
10%  de textos literarios.
15%  de textos periodísticos.
5%  de textos publicitarios.
15%  de textos técnicos.

Según esta frecuencia, se solicitaron informes de los académicos y especialistas correspondientes de cada área, con el fin de obtener una muestra de los textos más simbólicos de este siglo.

El Corpus Chileno de Referencia tuvo por meta entregar dos millones de palabras según una frecuencia pre-definida:

 Frecuencia de Textos Número de Palabras   Páginas
textos científicos.

 300.000

 850

textos económicos comerciales.

 200.000

550 

textos escolares.

 300.000

 850

textos humanísticos.

 100.000

 275

textos hitórico-jurídicos.

 200.000

 550

textos literarios.

 200.000

 550

textos periodísticos.

 300.000

 850

textos publicitarios.

 100.000

 275

textos técnicos.

 300.000

 850

Se estimó que cada página contenía entre 390 y 400 palabras. Se calculó como número óptimo el ingreso de 25 a 30 páginas diarias. Cada página ingresada debía ser sometida a un proceso de normalización según las normas de la T.E.I.

 

 
 

Información | Actividades | Recursos educativos | Formación | Educación en valores | Comunidad virtual | Herramientas y servicios
Profesores innovadores | Enseñar a aprender | Escuela de Nuevas Tecnologías
JaqueMate | Futuro | EducaRed Innova EducaRed - Virtualeduca | EducaRed Integra
© 2001 Fundación Telefónica | Política de Privacidad