Autores: MENKMANN Rosa

UN VERNÁCULO DE FORMATOS DE ARCHIVO

UN VERNÁCULO DE FORMATOS DE ARCHIVO [15]

Rosa Menkman, 2011. Traducción del libro The Glitch Moment(um)*.

La única resolución al problema de la no comunicación era incorporarlo dentro del sistema[16].
– FRIEDRICH KITTLER

 

4_RosaMenkman

UNA IMAGEN RAW DE PHOTOSHOP (.RAW). | ÉSTA ES LA IMAGEN ORIGINAL, SIN COMPRIMIR (RAW), QUE VOY A GLITCHEAR A LO LARGO DE ESTE CAPÍTULO, CON EL FIN DE ESBOZAR UNA VERSIÓN CONDENSADA DE MI VERNÁCULO DE FORMATOS DE ARCHIVO. LA IMAGEN ES UN FOTOGRAMA DE VIDEO, POR LO QUE IMPLICA LÍNEAS DE SCANEO (CASI INVISIBLES). ESTAS LÍNEAS SON DEL VIDEO ORIGINAL.

Los archivos de imagen sin procesar contienen datos mínimamente procesados ​​(píxeles) del sensor de imagen de una cámara digital, por ejemplo, o un escáner de imágenes. El encabezado de archivo de una imagen RAW normalmente contiene información relativa al orden-de-bytes del archivo; información del sensor de la cámara y otros metadatos de imagen como ajustes de exposición; la cámara, el escáner o el modelo de lente; la fecha (y, opcionalmente, el lugar) de disparo o escaneado; el formato, tamaño y número de colores; así como otra información necesaria para mostrar la imagen.

 

5_RosaMenkman
UNA IMAGEN DE PHOTOSHOP RAW (H = 0) MANIPULADA (.RAW). | ESTA IMAGEN SE CONSTRUYÓ ABRIENDO LA IMAGEN ORIGINAL RA DE TRES CANALES INTERCALADOS COMO UN DOCUMENTO ENTRELAZADO DE UN SOLO CANAL (UN SOLO COLOR / ESCALA DE GRISES). LA IMAGEN GENERADA ES UN DATABEND REVERSIBLE. ESTA IMAGEN NO ESTÁ COMPRIMIDA.

Es posible guardar un archivo de imagen RAW sin un cabezal (al abrir la imagen en Photoshop, por ejemplo, puedes elegir “header” = 0 en un cuadro emergente). Cuando la imagen RAW se guarda sin un cabezal, el ordenador no conoce las dimensiones ni ninguna otra información crucial que sea necesaria para reconstruir la imagen a partir de sus propios datos. Esto abre posibilidades creativas. Por ejemplo, es posible introducir nuevas dimensiones para la imagen, cambiar la cantidad de canales de color o elegir si la imagen se mostrará como ‘entrelazada’ o ‘no-entrelazada’ [‘interleaved’ o ‘non-interleaved’]. En el caso de un archivo de imagen RAW, el entrelazado y el no entrelazado se refiere al orden en que se almacenan los valores de color RGB (Rojo, Verde y Azul) de cada píxel. En una imagen RAW entrelazada, los datos se almacenan en una secuencia RGBRGBRGB. Cuando la imagen se guarda en orden no entrelazado, los valores RGB no se ordenan secuencialmente sino que tienen sus propias “capas”. Al desviarse de los valores de la imagen grabada originalmente, la imagen puede visualizarse de manera distorsionada y la estructura del archivo se hace visible.

 

 6_RosaMenkman

UNA IMAGEN DE MAPA DE BITS MANIPULADA (.BMP). | ESTA IMAGEN BMP SE MANIPULÓ COPIANDO Y PEGANDO EN EL ARCHIVO ORIGINAL UNA SELECCIÓN DE DATOS DE IMAGEN ALEATORIOS, UNA Y OTRA VEZ . LA IMAGEN GENERADA ES UN DATABEND IRREVERSIBLE. ESTA IMAGEN NO ESTÁ COMPRIMIDA.

El formato BMP es no-comprimido [uncompressed]. En un mapa de bits cada bit que indexa un valor de píxel se empaqueta dentro de una fila lineal y es procesado en orden inverso al orden normal de escaneado ráster de una imagen, comenzando en la esquina inferior derecha avanzando fila por fila de abajo hacia arriba. Es por eso que, cuando al copiar y pegar nada más que algunos trozos de los datos de la imagen, la parte inferior de los datos y la imagen en sí permanecerán intactas mientras que la parte superior de la imagen se desplaza horizontalmente.

En los archivos BMP y en muchos otros formatos de mapa de bits, la paleta de colores se compone de un bloque de bytes (una tabla o paleta) en donde se lista los colores disponibles para ser usados en una imagen de color-indexado específica. Cada píxel de la imagen es descrito mediante un número de bits (dependiendo de la profundidad de color, de 1 a 32 bits) los cuales indexan un único color de la paleta de colores, que se describe justo después del encabezado. La paleta de colores BMP utiliza el modelo de color RGB entrelazado. En este modelo, un color depende de diferentes intensidades (de 0 a 255) de los colores RGB primarios. Un color se define entonces por las intensidades finales de R + G + B. Al copiar y pegar los datos de la imagen, ciertos cambios pueden producirse dentro de los valores RGB; la intensidad de los datos de B puede (por ejemplo) irse a R, creando repentinos bloques descoloridos.

 

7_RosaMenkman
8_RosaMenkman
 FORMATO DE INTERCAMBIO DE GRÁFICOS (.GIF). | IZQUIERDA: IMAGEN GIF QUE PRESENTA TRUNCAMIENTO (IMPLICANDO EL ERROR DE CUANTIFICACIÓN). DERECHA: UNA IMAGEN GIF EN LA QUE SE MINIMIZA EL ERROR DE CUANTIFICACIÓN MEDIANTE EL USO DE EFECTOS DITHER. LA COMPRESIÓN GIF ES SIN-PÉRDIDAS [LOSSLESS].

El Formato de Intercambio de Gráficos es un formato de imagen de mapa de bits que admite 8 bits por píxel. Por lo tanto, esta compresión puede contener no más de 256 colores. El formato soporta la animación y emplea el dither (un efecto de granos o bloques), que puede aplicarse intencionalmente como una forma de ruido para ‘aleatorizar error(es) de cuantificación’. La cuantificación se refiere al procedimiento de constreñir la información de un conjunto relativamente grande o continuo de valores (tales como números reales) a un set discreto relativamente pequeño de valores que describen la diferencia entre el valor analógico real y el valor de color digital cuantificado. Por lo tanto, el ‘error de cuantificación’ es un error causado por el truncamiento (es decir, el descarte de la información de color menos significativa) que suele afectar al color.

El dither ayuda a evitar que las imágenes se muestren o se conviertan en patrones a gran escala como en el ‘bandeado’ [banding] (un proceso progresivo de rendereado de degradados suaves en brillo o tonalidad). Además, debido a que el ojo humano percibe la difusión causada por el dither como una mezcla de los colores, los colores no disponibles (que han sido cortados o no son codificables) son aproximados. Esto crea la ilusión de profundidad de color.

 

9_RosaMenkman
IMÁGENES DE FORMATO DE INTERCAMBIO DE GRÁFICOS (.GIF).
ESTA IMAGEN GIF ENTRELAZADA FUE MANIPULADA MEDIANTE LA INTRODUCCIÓN DE UN ERROR ALEATORIO EN LOS DATOS DE INFORMACIÓN. LA IMAGEN GENERADA ES UN DATABEND IRREVERSIBLE.

El formato gif utiliza una estrategia de entrelazado dimensional de cuatro pasos. Esto significa básicamente que la imagen, que consta de diferentes filas de píxeles, decodifica algunas filas de píxeles antes de otras. La imagen del ejemplo muestra el desplazamiento de las diferentes filas durante el tejido (el poner juntas las dos capas), resultando en ‘efectos peine’ [combing artifacts] con ‘bordes dentados‘[jagged edges].

 

10_RosaMenkman

UNA IMAGEN PROGRESIVA DEL TIPO GRUPO CONJUNTO DE EXPERTOS EN FOTOGRAFÍA (.JPEG). ESTA IMAGEN JPEG DE LÍNEA BASE FUE MANIPULADA POR LA INTRODUCCIÓN DE UN ERROR ALEATORIO EN LOS DATOS DE INFORMACIÓN. LA IMAGEN GENERADA ES UN DATABEND IRREVERSIBLE. LA COMPRESIÓN JPEG ES CON-PÉRDIDAS [LOSSY] .

Una compresión JPEG consta de 6 pasos consecutivos:

  1. Transformación del espacio de color. Inicialmente, las imágenes tienen que ser transformadas del espacio de color RGB a otro espacio de color (llamado Y´CbCr), que consiste en tres componentes que se manejan por separado: los valores Y (luma o brillo) y los Cb y los Cr (croma o valores de color, que son divididos en tono y saturación).

 

  1. Downsampling. Debido a que el ojo humano no percibe pequeñas diferencias dentro del espacio Cb y Cr muy bien, estos elementos son ‘desmuestreados’ [downsampled] (su información es reducida).

 

  1. Blocksplitting. Después de la transformación del espacio de color, la imagen se divide en mosaicos o ‘macrobloques’, que son regiones rectangulares de la imagen que se transforman y codifican por separado.

 

11_RosaMenkman

 UNA FUNCIÓN BASE DCT 8 × 8 DE UN JPEG CON MACROBLOQUES DIFERENCIADOS (.JPEG).

  1. Transformación discreta del coseno. A continuación, se utiliza una transformación discreta de coseno (que funciona de forma similar a la Función de Transformación de Fourier explotada en experimentos de ‘datamoshing’ y ‘macrobloque’ a los que me referiré más adelante) para crear un espectro de frecuencia, para transformar los bloques de 8 × 8 en una combinación de funciones bidimensionales de base DCT o patrones de 64 (tal como son trazadas por las líneas).
  1. Cuantificación [quantization]. Durante el paso de cuantificación, las variaciones más altas de frecuencia de brillo se convierten en una línea base (o valor 0), mientras que las pequeñas diferenciaciones de frecuencia positiva y negativa reciben un valor que comienza a partir de esta línea base, lo que requiere muchos menos bits para representar.
  1. Codificación de entropía. Finalmente, se aplica la codificación de entropía. La codificación de entropía es una forma especial de compresión de datos sin pérdidas que implica organizar los componentes de la imagen en un orden ‘zigzag’. Esto permite que la tabla de coeficientes cuantificados sea reescrita en un orden zigzag a una secuencia de frecuencias. Un algoritmo del tipo ‘run-length encoding’ (RLE) agrupa frecuencias similares y después de ello, a través de la ‘codificación Huffman’ organiza lo que queda.

 

12_RosaMenkman

UNA IMAGEN DE LÍNEA BASE MANIPULADA, DEL TIPO GRUPO CONJUNTO DE EXPERTOS EN FOTOGRAFÍA (.JPEG).
ESTA IMAGEN DE LÍNEA BASE FUE MANIPULADA POR LA INTRODUCCIÓN DE UN ERROR ALEATORIO EN LOS DATOS DE INFORMACIÓN. LA IMAGEN GENERADA ES UN DATABEND IRREVERSIBLE. LA COMPRESIÓN JPEG ES CON-PÉRDIDAS [LOSSY].

Debido a que los valores de color RGB de las imágenes JPEG son descritas en un algoritmo tan complejo, las permutas aleatorias de datos también pueden resultar en decoloraciones y desplazamientos dramáticos. La alta ratio de compresión de un JPEG afecta la calidad de la imagen y el tamaño de los efectos. Cuando se utiliza la cuantificación con la codificación basada en bloques, como he hecho yo en estas imágenes comprimidas en JPEG, pueden aparecer varios tipos de efectos, por ejemplo, ‘efectos de anillo’ [ringing] o ‘imagen fantasma‘ [ghosting], ‘efectos bloque’ [blocking] y ‘efectos dentados’ [jaggies]. La imagen muestra los efectos de ‘bloque’ o ‘escalera’ que aparecen más claramente a lo largo de los bordes curvos como resultado de los bloques JPEG 8 × 8. El bloqueo [blockiness] en las regiones “atareadas” a veces también se conoce como ‘quilteado’ [quilting] o ‘tableado de damas’ [checkerboarding]”. ‘Dentaduras’ [jaggies] es el nombre informal de los efectos en las imágenes ráster. A menudo son el resultado de un aliasing deficiente, que ocurre cuando una reconstrucción de la señal JPEG, después del desmuestreado [downsampling], ha producido solamente resultados de alta frecuencia.

 

13_RosaMenkman

UNA IMAGEN DE TIPO GRUPO CONJUNTO DE EXPERTOS EN FOTOGRAFÍA COMITÉ 2000 (.JPF). | ESTA IMAGEN JPEG 2000 FUE MANIPULADA POR LA INTRODUCCIÓN DE UN ERROR ALEATORIO EN LOS DATOS DE INFORMACIÓN. LA IMAGEN GENERADA ES UN DATABEND IRREVERSIBLE. LA COMPRESIÓN JPEG 2000 ES CON-PÉRDIDA [LOSSY].

El estándar JPEG 2000 es un estándar de compresión desarrollado especialmente para la industria de imágenes médicas debido a los numerosos posibles efectos de borde [edge] y de bloque [blocking] del formato JPEG, lo que podría causar desastrosas lecturas incorrectas en las imágenes médicas. JPEG 2000 ha mejorado la escalabilidad y la capacidad de edición. En el JPEG 2000, después de la etapa de transformación de color, la imagen se divide en los llamados cuadros [tiles], regiones rectangulares de la imagen que se transforman y codifican por separado. Los recuadros pueden ser de cualquier tamaño y también es posible considerar toda la imagen como un solo recuadro. Este proceso de división en bloques [tiling] convierte la imagen en una colección de “sub-bandas” que representan diversas escalas de aproximación. Una sub-banda es un conjunto de coeficientes que representan los aspectos de la imagen asociada a un cierto rango de frecuencia, así como un ámbito espacial de la imagen. Las sub-bandas cuantizadas se dividen aún más en precintos, regiones rectangulares en el dominio wavelet. Una Un ‘wavelet’ es una oscilación del tipo onda con amplitud que comienza en cero, aumenta, y luego disminuye de nuevo a cero. Normalmente se puede visualizar como una ‘oscilación breve’ como se podría ver en el grabado de un sismógrafo o un monitor cardíaco.

Los precintos se dividen aún más en los bloques de código que están situados en una sola sub-banda y tienen tamaños iguales. Los componentes de crominancia (del JPEG 2000) pueden ser (aunque no necesariamente tienen que ser) disminuidos en la resolución; de hecho, dado que la transformación wavelet ya separa las imágenes en escalas, la reducción de la escala o del muestreo se maneja de forma más eficaz al dejar de lado la escala wavelet más fina.

 



* El libro está disponible para descarga gratuita en: http://libertar.io/lab/materiales/texto/the-glitch-momentum/
[15] Esta sección es, de hecho, una adaptación condensada de mi obra de arte del 2010, Vernacular of File Formats.

[16] Friedrich Kittler, Draculas Vermächtnis: Technische Schriften, Leipzig: Reclam Verlag Leipzig, 1993. p. 242.

La percepción del glitch

Traducción por Libertar.io

The Glitch Moment(um)

About the publication: In this book, Rosa Menkman brings in early information theorists not usually encountered in glitch’s theoretical foundations to refine a signal and informational vocabulary appropriate to glitch’s technological moment(um) and orientations. The book makes sense of recent glitch art and culture: technically, culturally, critically, aesthetically and finally as a genre.

The glitch takes on a different form in relation to noise, failure or the accident. It transitions between artifact and filter; between radical breakages and commodification processes. Menkman shows how we need to be clearer about the relationship between the technical and cultural dimensions of glitch culture. Honing in on the specificities of glitch artifacts within this broader perspective makes it possible to think through some of the more interesting implications of glitched media experience. Using a critical media aesthetic orientation, Menkman addresses the ongoing definitional tensions, paradoxes, and debates that any notion of glitch art as a genre must negotiate, rather than elude.

About the author: Rosa Menkman is a Dutch visualist, theorist and curator, working with glitches, compressions, feedback and other forms of noise artifacts, aiming to contribute to the development of a discourse for glitch art and culture.

http://networkcultures.org