Importancia de la Compresión de Archivos
Uno de los mayores problemas de la informática ha sido y es la gestión y el almacenamiento de la información. Cualquiera que haya trabajado un par de años con algún ordenador sabe que tarde o temprano la información generada es necesario guardarla, moverla o simplemente compartirla. Y aquí es donde entra en juego lo que se llama comunmente espacio. Cada obejto, programa o información ocupa un determinado espacio, según lo complejo que sea. Ese espacio ocupado viene determinado por una secuencia de 0s y 1s, que forman los bits, bytes, kilobytes, megabytes y gigabytes. Cuanto más larga sea la secuencia, evidentemente, más espacio será necesario para almacenarla.
¿Qué significa comprimir un archivo?
Comprimir es lograr que un archivo ocupe menos sin corromperlo.
Los archivos almacenados en tu disco duro ocupan un espacio determinado sobre la superficie del disco. Si se siguen añadiendo más datos, llegará un momento en el que ya no quedará espacio.
Antes de que se inventara la compresión de archivos, solo había dos opciones: borrar los archivos o añadir más espacio comprando un nuevo disco duro. Dos opciones poco prácticas.
La compresión aplica métodos matemáticos -algoritmos- a los datos para conseguir que estos ocupen menos espacio en el disco, quitando la necesidad de borrar o ampliar el espacio.

¿Qué es la compresión y descompresión de archivos?
La mayoría de personas han descargado archivos de gran tamaño, como música o vídeo, a través de Internet. Debido al gran tamaño de estos archivos, la descarga de ellos puede tomar horas. Para resolver este problema, y hacer un mejor uso del espacio en disco, los archivos grandes se comprimen utilizando distintos programas informáticos. Una vez descargados, pueden entonces ser descomprimidos, y vistos, utilizando un programa de descompresión.
La compresión de archivos reduce el tamaño de grandes archivos como los de música, para que estos puedan ser mandados por Internet y almacenados fácilmente.
Cómo funciona la compresión
Un software de compresión funciona usando ecuaciones matemáticas para analizar los datos de archivos y buscar patrones de repetición. Entonces, el programa reemplaza estos patrones que se repiten con pequeñas piezas de datos, o código, que ocupan menos espacio. Una vez que el software de compresión ha identificado un patrón de repetición sustituye ese patrón con un código más pequeño que también muestra las ubicaciones del patrón. Por ejemplo, en una imagen, el software de compresión reemplaza cada instancia de color rojo con un código para este color que también indica todas partes de la imagen en la que se produce dicho color.
Tipos de compresión
Los archivos comprimidos generalmente terminan en .zip, .sit y .tar. Estas se llaman extensiones, e indican los diferentes formatos de compresión -diferentes tipos de software que se utilizan para comprimir los archivos. Para PC, el .zip es el más común. El .sit es más usado con Mac y .tar utilizado con Linux. Cuando veas un archivo con una de estas extensiones, puede ser un solo archivo grande o un conjunto de archivos agrupados.
Compresión sin pérdidas
La compresión sin pérdida es una manera de comprimir archivos sin perder ningún dato. Este método amontona los datos más cerca remplazándolos con un tipo de taquigrafía. Se puede reducir el tamaño de los archivos alrededor de la mitad. El formato .zip utiliza compresión sin pérdida. Con esta forma, el archivo descomprimido proporciona un duplicado exacto del archivo comprimido, con la misma calidad. Sin embargo, no se puede comprimir archivos a un tamaño muy pequeño, ya que hace menos útil a los archivos muy grandes.c
Compresión con pérdida
Para hacer los archivos hasta un 80% más pequeños, se utiliza la compresión con pérdida. Un software de compresión con pérdida elimina algunos datos redundantes de un archivo. Debido a que se eliminan datos, la calidad del archivo descomprimido es menor que el original. Este método comprime gráficos, audios y archivos de vídeo, y el ligero daño a la calidad es poco notable. JPEG utiliza la compresión con pérdida, por lo que los archivos convertidos a JPEG pierden algo de calidad. El MP3 también utiliza la compresión con pérdida para encajar en una gran cantidad de archivos de música en un espacio pequeño, aunque la calidad del sonido es menor que con un archivo WAV que utiliza compresión sin pérdidas.
A la hora de hablar de compresión hay que tener presentes dos conceptos:
- Redundancia: Datos que son repetitivos o previsibles
- entropia La información nueva o esencial que se define como la diferencia entre la cantidad total de datos de un mensaje y su redundancia.
La información que transmiten los datos puede ser de tres tipos:
- Redundante: información repetitiva o predecible.
- Irrelevante: información que no podemos apreciar y cuya eliminación por tanto no afecta al contenido del mensaje. Por ejemplo, si las frecuencias que es capaz de captar el oído humano están entre 16/20 Hz y 16.000/20.000 Hz, serían irrelevantes aquellas frecuencias que estuvieran por debajo o por encima de estos valores.
- Básica: la relevante. La que no es ni redundante ni irrelevante. La que debe ser transmitida para que se pueda reconstruir la señal.
Teniendo en cuenta estos tres tipos de información, se establecen tres tipologías de compresión de la información:
- Sin pérdidas reales: es decir, transmitiendo toda la entropía del mensaje (toda la información básica e irrelevante, pero eliminando la redundante).
- Subjetivamente sin pérdidas: es decir, además de eliminar la información redundante se elimina también la irrelevante.
- Subjetivamente con pérdidas: se elimina cierta cantidad de información básica, por lo que el mensaje se reconstruirá con errores perceptibles pero tolerables (por ejemplo: la videoconferencia ).
Descompresión
Para utilizar un archivo comprimido, primero deberás descomprimirlo. El software utilizado para descomprimir depende de cómo el archivo fue comprimido en primer lugar. Para descomprimir un archivo .zip, necesitas un software como WinZip. Para descomprimir un .sit, necesitas el programa Stuffit Expander. WinZip no descomprime archivos .sit, pero una versión de StuffIt Expander puede descomprimir archivos tanto .zip como .sit. Los archivos que terminan en .mar o .exe se denominan archivos de autoextracción. Estos son archivos comprimidos que no requieren ningún software especial para descomprimirse. Simplemente se descomprimen automáticamente haciendo clic en el archivo al abrirlo.
Caracterización de la compresión
La compresión se puede definir por el factor de compresión, es decir, el número de bits de la imagen comprimida dividido por el número de bits de la imagen original.
El radio de compresión, que se utiliza con frecuencia, es lo contrario al factor de compresión; por lo general, se expresa como porcentaje.
Por último, la ganancia de compresión, que también se expresa como porcentaje, equivale a 1 menos el radio de compresión:
Los tipos y métodos de compresión
La compresión física y lógica
La compresión física actúa directamente sobre los datos; por lo tanto, es cuestión de almacenar los datos repetidos de un patrón de blits a otro.
La compresión lógica, por otro lado, se lleva a cabo por razonamiento lógico al sustituir esta información por información equivalente.
La compresión simétrica y asimétrica
En el caso de la compresión simétrica, se utiliza el mismo método para comprimir y para descomprimir los datos. Por lo tanto, cada operación requiere la misma cantidad de trabajo. En general, se utiliza este tipo de compresión en la transmisión de datos.
La compresión asimétrica requiere más trabajo para una de las dos operaciones. Es frecuente buscar algoritmos para los cuales la compresión es más lenta que la descompresión. Los algoritmos que realizan la compresión de datos con más rapidez que la descompresión pueden ser necesarios cuando se trabaja con archivos de datos a los cuales se accede con muy poca frecuencia (por razones de seguridad, por ejemplo), ya que esto crea archivos compactos.
No hay comentarios:
Publicar un comentario