CONCEPTOS BASICOS: UNIDAD 3

3 Archivo secuencial indexado

INTRODUCCIÓN

En los computadores más modernos, los archivos siempre ubican un nombre y se ubican en un directorio. Cada nombre debe ser único en cada directorio, ya que este solamente acepta una sola ruta y no puede haber dos archivos con el mismo nombre. La identificación del archivo es la ruta y su nombre.

Todas la computadoras estructuran los archivos en jerarquías llamadas carpetas, directorios o catálogos. Cuando la en la computadora se usa una carpeta, esta tiene su nombre de identificación y su ruta de especificación.

los archivos secuénciales indexados tienen una limitación este se basa en el registro del archivo, de acuerdo al campo que se le haya asignado. Cuando se requiere de la busca de un registro y este no es especificado de acuerdo al nombre de la clave que se le haya determinado, por lo tanto la búsqueda terminara sin arrojar ningún resultado verídico ya que es imposible buscar dicha ruta con otra especificación.

Por lo general los archivos son utilizados en aplicaciones en donde pocas veces se tiene la oportunidad de hacer una búsqueda o revisión completa de la información. Dichos datos se dice que son flexibles cuando la estructura que utiliza tiene varios índices, en donde cada uno de ellos es aplicado a cada campo de cada registro.

3.1 Estructura Archivos Organizacion Secuencial Indexado

Este tipo de organización se utiliza cuando existe la necesidad tanto de acceder a los registros secuencialmente, por algún valor de llave, como de acceder los individualmente. Un archivo secuencial indexado puede tener acceso porque manejan un archivo secuencial y un archivo relativo o de acceso directo.

El tipo de sus registros contiene un campo clave identificador.
Los registros están situados en un soporte direccionable por el orden de los valores indicados por la clave.

un archivo índice y un archivo de datos. Es necesario que los registros contengan un campo clave para identificarlos y que estén almacenados en un soporte direccionable según el orden que indique dicha clave. El archivo índice agilizar la búsqueda dentro del fichero. El fichero de datos se organiza, lógicamente, en bloques o páginas de varios registros.

. Cada registro del fichero índice almacena:

• El valor del campo clave del último registro de un bloque. Los bloques están constituidos por un número fijo de registros consecutivos.

• La dirección del primer registro de dicho bloque. Puede haber un área de desbordamiento. Ocupa más espacio en disco pero es más rápido. Puede almacenarse el fichero índice en memoria. Habría que calcularlo al iniciar una sesión de trabajo.

En este tipo de organización de archivos se dispone de una tabla en que aparecen ordenados secuencialmente los números de la clave del archivo y asociados a cada uno de ellos de da la dirección del registro correspondiente.

AREAS DEL ARCHIVO SECUENCIAL INDEXADO

Área de Datos: Contiene los registros secuencial, esta ordenados alfabéticamente o alfanuméricamente y no deja espacios.

Área de índice: Los niveles de índice están contenidos en una tabla, si existieran varios índices enlazados se denomina nivel de indexación

Área de Desbordamiento o Excedentes: Esta área es utilizada para realizar actualizaciones si ello es necesario

FICHEROS CON ORGANIZACIÓN SECUENCIAL INDEXADA.

Un archivo con organización secuencial indexada está formado por:

AREA DE DATOS: Es el área en la que se escriben los registros cuando el archivo es creado el en directorio del fichero.

Los fichero con organización secuencial indexada se graban en un soporte de almacenamiento directo, en secuencia ascendente, de acuerdo con los valores de la clave y en páginas o bloques de longitud fija.

El AREA DE INDICES: es creada por el sistema al mismo tiempo que se van almacenando los datos. Contiene una tabla que asocia las claves con las direcciones de los registros en el área de datos.

Cada entrada del área de índices está formada por el valor más alto de la clave de cada grupo de registros y un puntero con la dirección del primer registro del grupo.

Un AREA DE EXCEDENTES: donde se graban los registros que no tienen sitio en el área de datos. Los nuevos registros se insertan y quedan enlazados entre sí mediante punteros conservando el orden lógico que marca la clave o índice principal.

Del tratamiento de los índices y punteros se encarga el sistema operativo por lo que no va a crear problemas al usuario cuando maneja este tipo de ficheros. El usuario sabe lo que sucede cuando solicita una consulta de un registro, pero no sabe como se realiza internamente esa consulta.

3.2 Representacion de Indices

3.2 Representación de indices El campo clave-secundaria sobre el cual se crea un indice se llama clave inversa o clave indexada. Se dice entonces que el campo es inverso para la recuperacion por clave secundaria. La figura muestra un archivo de estudiantes y sus indices asociados: un indice valor clave y un nombre clave. Las dos claves inversa son CLASS y AGE. Cada entrada del indice valor clave consiste en un valor de clave secundaria y en un conjunto de señaladadores a los registros de datos. Un señalador puede contener en una direccion relativa, una direccion fisica o una clave principal de los registros objetos.

DIRECCION RELATIVA El campo señalador en el indice valor clave de la fig. contiene direcciones relativas. Para ejemplificar, la primera entrada del indice indica que los registros uno, cuatro y cinco contienen el valor clave 541 en el campo CLASS. SEÑALADOR SIMBOLICO Un señalador simbolico es un identificador de regsitros, pero no una direccion de registro. Por ejemplo, un valor de clave primaria puede usarse como señalador simbolico porque identifica de manera unica a un registro del archivo. Si se escoge al señalador simbolico como identificador de registro, la primera entrada del indice en el indice valor clave de la fig contendria: Valor de clave secundaria señalador de registro • 541 150,164,172 los valores 150, 164 y 172 son los valores de las claves primarias (S-ID) de los registros 1,4 y 5, respectivamente. Estos valores de clave-primaria pueden traducirse a su direccion de registro correspondiente por medio de distribucion o busqueda de indice (Hashing) dependiendo de la organización basica de archivo subyacente, es decir, directa o secuencial indexada. DIRECCION FISICA El campo señalador puede contener direcciones fisicas, las cuales pueden usarse para accesar registros directamente sin necesidad de traducir la direccion, como fue necesario en los casos 1) y 2). Sin embargo, la mayor desventaja del uso de las direcciones reales, es que los valores del señalador dependen entonces del dispositivo. Por ejemplo, hay que recrear un indice si los datos del archivo emigran de un disco a otro. Cada entrada en el indice nombre clave en la fig. consiste en un nombre clave-inversa y un señalador hacia la primera entrada del indice valor-clave. Los distintos indices en una organización inversa juntos forman un directorio. ¿ como responde un sistema inverso de archivos a las consultas sobre las claves secundarias? Considerese la siguiente consulta en el archivo inverso de la fig. listar los nombres de los estudiantes cuya edad sea 21 años. Puede responder rapidamente buscando en el directorio de la manera siguiente: • empezar la busqueda con el indice nombre-clave para localizar la entrada AGE. • Analizar el indice valor-clave para encontrar el valor 21 en la clave secundaria. • Recuperar los registros objetivo del archivo de datos en las direcciones relativas 3y 7. Se dice que se tiene un indice denso cuando este incluye cada valor clave posible en un conjunto indexado. El indice valor- clave de la fig. es denso porque todos los valores de las claves inversas estan incluidos en el indice. Por ejemplo, los tres numeros posibles de CLASS en el archivo de datos son 541, 542, y 543. Los tres aparecen en el indice valor-clave. Se dice que una clave inversa esta parcialmente indexada si solo algunos de sus valores claves estan incluidos en el indice valor-clave. Los valores clave que estan indexados son aquellos usados en la condiciones de busqueda. Un indice parcialmente indexado se llama indice disperso. Para un indice con una gran cantidad de elementos, la busqueda secuencial sobre el indice no es muy eficiente. Por esto, un indice se organiza generalmente como una estructura de varios niveles como es el caso de la estructura multinivel de indice principal para los archivos secuenciales indexados. El directorio para el archivo de datos de la fig. esta organizado como un indice de nivel dos, en el cual el indice nombre-clave se crea para facilitar la busqueda en el indice valor-clave. El grado de inversion se refiere al nivel de totalidad de inversion expresada por el numero de campos y lo extenso de los valores de los campos invertidos. Una inversion de 0% significa que no se invirtio ningun campo clave en un registro. Por otro lado, un archivo con el 100% de inversion tiene invertido cada valor clave de cada campo de datos. En algunos sistemas operativos macromainframe se dispone de elementos para invertir indices automaticos si se declaran las claves secundarias en un programa, por ejemplo. VSAM de IBM y AAM de Cyber, son capaces de crear indices inversos sobre la organización secuencial indexada y directa. MANEJO DE INDICES Cada vez que se inserta, borra o actualiza un registro, las entradas afectadas de un indice deben ser modificadas por el sistema para que asi, el indice pueda proporcionar las trayectorias de datos correctas.

3.3 Operaciones sobre Archivo Secuencial

ARCHIVOS SECUENCIALES

Existen ademas muchas operaciones asociadas a archivos, las mas elementales son:

1.- Creación de Archivo.- En este proceso se pretende solamente crear un archivo nuevo en disco, con su nombre, tipo y especialidad de almacenamiento de datos apropiado.

tipo.

No confundir creación con apertura, creación es un proceso que solo se ejecuta una sola vez en la vida de un archivo, mientras que apertura, siempre se esta realizando por los programas especializados en algun proceso.

3.-Cierre de archivos: Es la operación mas importante en cualquier programa que maneje archivos, o se cierra el archivo como ultima instrucción del pograma o se vera el anuncio ABORT,RETRY,FAIL.

98, /s, scandisk

4.-Altas en archivo.- En este proceso se carga una clase en memoria con sus datos pertinentes y se graba la clase en el archivo en disco.

5.-Lectura de archivo.- En este proceso, se abre el archivo y se manda el registro de disco, a una clase en memoria para su procesamiento.

6.- Consulta de archivos: En este proceso se pretende desplegar todos los registros del archivo en disco a la pantalla, ya sea consola o mejor aún, a una pagina html

7.-Busqueda en archivos: Una de las operaciones mas comunes, consiste en que el usuario pide toda la información de algun renglon en disco, porporcionando la información de algun campo, generalmente el campo clave de la clase.

8.- Filtros.- En este proceso el usuario esta interesado en algun conjunto de renglones con caracteristicas comunes (condición), por ejemplo todos los alumnos de “sisJAVA TEMA s”, o todos los empleados que ganen mas de $500.00 pesos, o todos los clientes que sean de “tijuana”, etc

9.-Modificaciones de registros o archivos: Problema muy comun, donde los datos originales ya grabados se tienen que cambiar o actualizar, por ejemplo el nombre no era “juan” es “juana”, o la calificación no es 100 es 20, etc.

10.- Bajas de registros: tambien muy comun este proceso,por ejemplo el alumno ya egreso, el cliente huyo, etc.

3.4 Operaciones sobre Archivo Secuencial Indexado

Los archivos secuenciales son utilizados en aplicaciones de proceso de lotes y son óptimos para dichas aplicaciones si se procesan todos los registros. La organización secuencial de archivos es la única que es fácil de usar tanto en disco como en cinta. Para las aplicaciones interactivas que incluyen peticiones o actualizaciones de registros individuales, los archivos secuenciales ofrecen un rendimiento pobre. Normalmente un archivo secuencial se almacena en bloques, en un orden secuencial simple de los registros. La organización física del archivo en una cinta o disco se corresponde exactamente con la ubicación lógica del archivo. En este caso, el procedimiento para ubicar los nuevos registros en un archivo de pila separado, llamado archivo de registro o archivo de transacciones. Periódicamente, se realiza una actualización por lotes que mezcla el archivo de registro con el archivo maestro para producir un nuevo archivo en secuencia correcta de claves. Las operaciones que se realizan son:

Creación: Escritura de todos sus registros. Es la primera operación que sufrirá el archivo de datos. Implica la elección de un entorno descriptivo que permita un ágil, rápido y eficaz tratamiento del archivo. Para utilizar un archivo, éste tiene que existir, es decir, las informaciones de este archivo tienen que haber sido almacenadas sobre un soporte y ser utilizables. La creación exige organización, estructura, localización o reserva de espacio en el soporte de almacenamiento, transferencia del archivo del soporte antiguo al nuevo.

Un archivo puede ser creado por primera vez en un soporte, proceder de otro previamente existente en el mismo o diferente soporte, ser el resultado de un cálculo o ambas cosas a la vez. Consulta: Lectura de todos sus registros. Es la operación que permite al usuario acceder al archivo de datos para conocer el contenido de uno, varios o todos los registros.

Actualización: Inserción supresión o modificación de algunos de sus registros. Es la operación que permite tener actualizado (puesto al día) el archivo, de tal modo que sea posible realizar las siguientes operaciones con sus registros: Consulta del contenido de un registro. Inserción de un registro nuevo en el archivo. Supresión de un registro existente. Modificación de un registro.

Clasificación: Reubicación de los registros de tal forma que queden ordenados según determinados criterios. Una operación muy importante en un archivo es la clasificación u ordenación. Esta clasificación se realizará de acuerdo con el valor de un campo específico, pudiendo ser ascendente (creciente) o descendente (decreciente): alfabética o numérica.

Borrado: Eliminando total del archivo, dejando libre el espacio del soporte que ocupaba. Es la operación inversa a la creación de un archivo (kill, en inglés). Cuando se destruye (anula o borra) un archivo, éste ya no se puede utilizar y, por consiguiente, no se podrá acceder a ninguno de sus registros.

Reorganización de un archivo: Las operaciones sobre archivos modifican la estructura inicial o la óptima de un archivo. Los índices, enlaces (punteros), zonas de sinónimos, zonas de desbordamiento, etc., se modifican con el paso del tiempo, lo que hace a la operación de acceso al registro cada vez más lenta. La reorganización suele consistir en la copia de un nuevo archivo a partir del archivo modificado, a fin de obtener una nueva estructura lo más óptima posible.

Estallido de un archivo: Es la operación de obtener varios archivos a partir de un mismo archivo inicial.

CONCEPTOS BASICOS

UNIDAD 3

No hay comentarios:

Páginas

Seguidores

Archivo del blog

Datos personales