El Grito de Sunset Park: PRESERVA TUS ARCHIVOS DE VIDEO

Este blog es parte del proyecto que documenta la experiencia de El Grito de Sunset Park en colaboración con WITNESS Estados Unidos para explorar nuevas formas de contar historias a través del análisis y la curación de videos de derechos humanos.

¿QUÉ ES ESTO?

Una vez que has reunido tu multimedia, debes tomar medidas para proteger tus videos para poder encontrarlos y usarlos más tarde, y para que no se pierdan, alteren o eliminen accidentalmente. Para el proyecto El Grito, esto implicaba limpiar y organizar los archivos de manera sistemática, generar documentación que nos permitiera verificar y validar los archivos, y almacenar y respaldar de manera segura los archivos.

En esta sección, encontrarás nuestra documentación sobre:

  • Cómo limpiar nombres de archivos y organizar sus archivos de forma estandarizada y estructurada para el almacenamiento y acceso a largo plazo.
  • Cómo generar documentación de fijación que te permitirá verificar y validar tus archivos más adelante.
  • Cómo almacenar de forma segura tu colección archivada.

¿POR QUÉ HACER ESTO?

Al seguir estos pasos, tú:

  • Asegúrate de que tus videos no se pierdan, se eliminen accidentalmente o se corrompan.
  • Haz que tus videos sean más fáciles de encontrar, identificar y comprender para todos los miembros de tu equipo.
  • Te permite confirmar la identidad e integridad de tus archivos de video para fines de autenticación.
  • Te permite compartir más fácilmente tus videos con otras personas, si lo deseas.

NOTA

Este flujo de trabajo supone que la información/datos contenidos en los archivos de video son objetos de preservación, y que el disco duro sirve como mecanismo de almacenamiento y entrega. Puede haber otras situaciones en las que el disco duro sea en sí mismo objeto de conservación, como en un caso de análisis forense digital, que requeriría un flujo de trabajo diferente al que se describe aquí.

UN VISTAZO AL FLUJO DE TRABAJO

Limpiar: Limpiar los nombre de archivo que contienen caracteres especiales o reservados.

Organizar: Determinar la estructura de organización para la colección de archivo.

Ingesta: Transforma en paquetes de archivo y transfiere al almacenamiento de archivo.

Respalda: Crea dos respaldos del material primario, de preferencia uno en otro sitio

Revisa y reemplaza: Checa los archivos y reemplaza el almacenamiento de los medios con el tiempo.

EQUIPO/HERRAMIENTAS NECESARIAS

  • Los archivos de video con los que estás trabajando (consulta Recopilación de discos duros para obtener más información sobre cómo configurar esto).
  • Exactly, un software gratuito para hacer paquetes de archivos estandarizados.
  • Almacenamiento digital para el archivo, con capacidad suficiente para almacenar la colección.
  • Almacenamiento digital separado para la copia de seguridad, con capacidad suficiente para almacenar la colección.
  • Almacenamiento digital separado adicional para la segunda copia de seguridad del archivo, en un medio que se pueda llevar fuera del sitio, con capacidad suficiente para almacenar la colección.

Limpiar nombres de archivos

Los nombres de archivo que usan caracteres reservados para el sistema de la computadora pueden causar problemas a los sistemas de archivos, software y plataformas en el futuro. Esto puede causar problemas con sus copias de seguridad, procesos de ingesta y otras actividades críticas para preservar tus videos.

Los caracteres reservados incluyen! @ # $% ^ & * () ~ `:;” ’.? / + = (Básicamente todos los símbolos que no sean _ o -). Los acentos y los signos diacríticos también pueden causar problemas. Estos deben ser reparados antes de “ingerir”.

SIMPLE AUTOMATIZACIÓN

Automator está incluido en Mac OS y te permite automatizar una variedad de tareas, incluyendo renombrar archivos por lotes.

 

 

1 Encuentra nombres de archivos incorrectos

Examina los archivos que han sido seleccionados para el archivo. Los nombres de archivo que deben limpiarse son:

  • Nombres de archivo con caracteres reservados (! @ # $% ^ & * () = +?,. /: “;’ {} | [] ~ `- es decir, cualquier carácter que no sean letras, números, – o _).
  • Los espacios generalmente están bien, pero a veces no, así que es mejor evitar usarlos si es posible.
  • Los nombres de archivo súper largos también causan problemas (el número máximo de caracteres para la ruta de archivo, es decir, el nombre de archivo + nombres de todas las carpetas que se encuentran arriba, es de 256 caracteres).

Si los nombres de archivo no se han cambiado de los nombres asignados por la cámara, no debería haber ningún problema.

2 Cambiar nombres de archivo

Si solo es necesario cambiar algunos nombres de archivo, esto puede hacerse manualmente simplemente haciendo clic derecho en el archivo y renombrándolo. No realices cambios en el nombre del archivo más allá de lo necesario para limpiarlo. Elimina los caracteres y espacios reservados, y si ayuda a hacer que el nombre del archivo sea legible, reemplázalos con guiones bajos (es decir, _).

 

 

Ejemplo de un nombre de archivo incorrecto y una versión limpia del nombre de archivo.

Si es necesario cambiar muchos nombres de archivos, puedes usar la herramienta Mac Automator incorporada. Crea un “Flujo de trabajo” y agrega el paso “Obtener elementos específicos del buscador” y luego el paso “Cambiar nombre de elementos del buscador” para cada carácter que desees reemplazar.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ejemplo de cómo usar Automator para limpiar nombres de archivos

Determinar estructura organizativa

Durante la ingesta, los archivos se transformarán en “paquetes de archivo“, que son las unidades básicas de una colección de archivo.

Tener una buena estructura organizativa (es decir, la composición de los paquetes de archivo y los directorios y subdirectorios en los que están archivados) hará que tu colección sea fácil e intuitiva de navegar.

ESTÁNDAR DE EMBALAJE

BagIt es un formato de empaquetado de archivos jerárquico estandarizado ampliamente utilizado en archivos.

 

3 Decide el maquillaje de tus paquetes de archivo

Un paquete puede contener un solo archivo de video o múltiples archivos de video. La forma en que decidas empaquetar tus archivos depende de la cantidad de material que tengas, la granularidad que desees dividir y la cantidad de conocimiento de fondo que tengas sobre el origen de los archivos.

Dos principios rectores útiles del mundo de los archivos son la procedencia y el orden original. La procedencia se refiere a preservar el contexto original de la creación manteniendo separados los registros de diferentes fuentes/orígenes. El orden original también se trata de preservar el contexto, y se refiere a restaurar o mantener registros en la secuencia original en la que fueron creados.

Si bien sigue los principios de procedencia y el orden original, puede haber cierta flexibilidad sobre lo que constituye un paquete único y, a veces, trabajarás con información de fondo incompleta. Haz lo que tenga sentido para tu proyecto.

Aquí hay algunos ejemplos de la vida real de cómo los archivos se han convertido en paquetes en el proyecto El Grito:

 

 

 

 

 

Paquete 1: archivos de video de un solo incidente policial, filmado en secuencia.

 

 

Paquete 2: Un solo archivo de video filmado en el mismo incidente policial, pero por una cámara/camarógrafx diferente.

 

 

 

Paquete 3: Dos archivos de video (uno maestro, uno para web) hechos a partir de la digitalización de una sola cinta miniDV.

 

 

 

 

Paquete 4: Múltiples videos sobre un solo incidente, de varias fuentes, pero recopilados por un individuo.

4 Decide la estructura de tu directorio

Esto es opcional, pero organizar tus paquetes en directorios y subdirectorios puede hacer que tu colección sea más fácil de navegar en comparación con tenerlos todos en un directorio de nivel superior.

Al diseñar tu estructura de directorio/subdirectorio:

  • Considera la lógica detrás de cómo está organizado el disco duro original/fuente. Puedes reflejar cómo piensa la fuente sobre la colección o cómo usará el contenido.
  • Considera el propósito por el cual se examinará, accederá y utilizará la colección en el futuro.
  • Define cada nivel de la estructura de directorios por cómo clasifica sus paquetes, p. Ej. “Por fecha” o “por caso” o “por oficial”, “por tipo”, etc., etc., y siga esto constantemente a lo largo de su colección.
  • En cualquier nivel de directorio único, todas las carpetas deben ordenar el contenido de la misma manera. En otras palabras, no tengas algunas carpetas que clasifiquen “por fecha” y otras carpetas que clasifiquen “por oficial” en el mismo nivel de directorio, ya que esto creará confusión en cuanto a dónde se archiva un paquete.

5 Documentar y comunicar

Documenta y comunica la estructura organizativa a cualquiera que participe en la siguiente fase de ingesta para que el trabajo se realice de manera consistente.

Ingesta

En los archivos, “ingerir” es el proceso de aceptar un nuevo elemento en una colección y prepararlo para el almacenamiento a largo plazo de acuerdo con las normas y estándares del archivo. Esto implica hacer un “paquete de archivo”.

Las instrucciones a continuación describen los pasos que seguimos para crear paquetes de archivo para el proyecto El Grito basados en un estándar de empaque desarrollado por la Biblioteca del Congreso llamado BagIt, utilizando una herramienta gratuita llamada Exactly.

Usar el estándar y la herramienta es útil porque automatiza gran parte del trabajo y crea paquetes autodescriptivos que pueden compartirse, identificarse y validarse fácilmente (es decir, que se muestran completos e inalterados, ¡importantes para usos probatorios!) más adelante.

HERRAMIENTA DE EMBALAJE

Exactly es una aplicación gratuita y de código abierto para empaquetar archivos con metadatos personalizados y datos de fijación.

 

6  Instalar y abrir Exactly

Descarga e instala Exactly (para obtener más información, consulta la Guía del usuario de AVP). Cuando abras la aplicación, la interfaz se verá así:

 

 

 

 

 

 

 

 

 

 

 

 

7 En el campo Título, ingresa el nombre del paquete

Usa un esquema de nomenclatura consistente para sus paquetes.

Para el proyecto El Grito, el nombre del paquete siguió la plantilla: PackageID-ContentCreationDate. Entonces, un Título para un paquete podría verse así: P0001-2016-06-15.

 

 

 

 

 

 

8 Ingresa la información de origen y destino

Para Origen, navega hasta los archivos que deseas empaquetar. Para Destino, navega a la ubicación de almacenamiento de archivo donde deseas que Exactly cree tu carpeta de paquetes.

9 Ingresa metadatos para el paquete

Los metadatos que se incluyen en un paquete deben ser metadatos mínimos que no necesitarán actualizarse o cambiarse con el tiempo, y que son útiles para identificar el paquete, si se envía a alguien.

Para agregar metadatos en Exactamente, haz clic en “mostrar” junto a Metadatos para revelar los campos de entrada de metadatos:

 

 

 

 

 

 

 

 

 

 

 

Marca “Mostrar todos los campos reservados” para revelar los elementos de metadatos de BagIt preestablecidos. No tienes que usarlos todos, y/o puedes definir el suyo propio, pero esto puede ahorrarte algo de trabajo. Para eliminar los campos preestablecidos adicionales, haz clic en el botón “-” al lado de la etiqueta del campo:

 

 

 

 

 

 

 

 

 

 

 

 

Para el proyecto El Grito, utilizamos los campos predefinidos Organización de origen, Nombre de contacto y Correo electrónico de contacto. Ingresa los valores de metadatos y presione Guardar:

10 ¡Crea el paquete!

Cuando estés listx, presiona el botón Transferir en la parte superior derecha de la ventana. Verás actualizaciones en la ventana de registro a medida que se realiza la transferencia.

Cuando finalices el proceso, verifica el paquete recién creado en su destino de almacenamiento. Debería verse más o menos así:

 

 

 

 

 

 

 

 

 

 

 

Además de los archivos de video, puedes ver que el paquete incluye varios archivos de texto. Estos son solo archivos de texto (legibles por humanos y máquinas) que forman parte de la especificación BagIt, que ayudan a identificar y validar el paquete (más información sobre la validación a continuación).

Los archivos de texto incluyen:

  • bag-info (en formatos CSV, TXT y XML): incluye los metadatos que ingresó en el paso anterior.
  • manifest-md5 y tagmanifest-md5: como listas de empaque en una caja; enumeran los archivos que deberían estar en el paquete junto con sus sumas de verificación MD5 (suma de verificación: una cadena de letras y números que pueden usarse para verificar si los archivos han sido cambiados).
  • FileSystemData y TransferComplete: describe el sistema de archivos del que proviene el archivo y el proceso de transferencia, con fines de autenticación.
  • Bagit.txt: simplemente indica que este paquete sigue el estándar BagIt.

Repite este proceso de empaquetado para todos los artículos que deseas agregar a su colección de archivo. Los metadatos que ingresaste para crear la primera bolsa permanecerán cuando cree bolsas posteriores, por lo que solo tienes que editar los campos donde los metadatos son diferentes de la bolsa anterior.

11 Valida y verifica los paquetes según sea necesario

Para validar o verificar un paquete (por ejemplo, si deseas asegurarte de que no haya cambiado o alterado), usa la pestaña Recibir en Exactly:

Señala la ubicación del paquete y presione Validar. El paquete será válido si todos los archivos en las “listas de empaque” están presentes (y no hay archivos nuevos) y si sus sumas de verificación coinciden:

Cómo funciona la validación de BagIt:

  • Cuando creas un paquete con Exactly, los documentos que genera incluyen una lista de archivos y datos de fijación sobre cada archivo, comúnmente conocido como hash o suma de comprobación. Una suma de verificación es un cálculo que se parece a una cadena de números y letras, y es único para cada archivo digital individual. Por esta razón, las sumas de verificación a menudo se denominan “huellas digitales”.
  • Una suma de comprobación no cambiará a menos que se modifique el archivo, por lo que puede usarse para detectar si el archivo ha sido alterado (por ejemplo, editado, dañado, etc.). Si envías un paquete de archivo “empaquetado” a alguien, el validador en Exactly usa las sumas de verificación para confirmar que nada se modificó en tránsito.

Crear copias de seguridad

Si solo tienes una copia, estsá a solo un accidente/derrame/falla del disco duro lejos de perder todo su contenido y trabajo duro.

Recuperar contenido de unidades fallidas no siempre es posible, y puede ser muy costoso.

Crea al menos una copia de seguridad en un dispositivo separado

Hay algunas maneras de hacer esto:

  • Simplemente puedes arrastrar y soltar una copia de su colección desde el disco duro primario a la unidad de respaldo. Esta es la forma más simple, pero puede ser frustrante si está copiando una gran colección que lleva mucho tiempo.
  • Puedes usar una utilidad de línea de comandos llamada rsync, que es una forma más confiable de copiar una gran colección que le permitirá reiniciar desde donde la dejó si se interrumpe la copia.
  • En una Mac, puedes usar la utilidad Time Machine incorporada para hacer una copia de seguridad de una unidad externa.

En Preferencias del sistema, selecciona Time Machine. Luego agrega tu disco de respaldo:

 

 

 

 

 

 

 

 

 

 

 

 

Selecciona “Opciones …” De forma predeterminada, Time Machine no realiza copias de seguridad de unidades externas, por lo que debe eliminar la unidad de la que desea hacer una copia de seguridad de la lista de elementos excluidos:

 

 

 

 

 

 

 

 

 

 

 

 

HERRAMIENTAS DE RESPALDO

 

Rsync es una utilidad gratuita para transferir y sincronizar eficientemente archivos a través de sistemas informáticos, lanzada bajo una Licencia Pública General de GNU.

 

Time Machine es la función de copia de seguridad integrada en Mac.

13 Lo ideal es tener dos copias de seguridad.

Idealmente, desearás crear dos copias de seguridad, una cerca para que puedas recuperar rápidamente cualquier archivo perdido/dañado, y una fuera del sitio para una recuperación más catastrófica.

Incluso si solo tienes una copia de seguridad en el sitio, intenta mantenerla en un lugar diferente (por ejemplo, en otra habitación) de tu copia principal.

 

 

 

 

 

 

 

 

 

 

 

Verificar archivos y reemplazar medios

Asegurar la justicia puede llevar mucho tiempo. Es posible que necesites tus videos dentro de unos años, y deben permanecer intactos, reproducibles y autenticables para que sean útiles.

 

14 Monitorea tus archivos

Revisa tus archivos de video guardados al menos una vez al año para asegurarte de que puedes leerlos. Puedes utilizar la función “Validar” en Exactly para hacer esto.

Restaura desde tus copias de seguridad según sea necesario.

 

15 Monitorea tus unidades

Si una unidad comienza a hacer ruidos inusuales o comienza a funcionar mal, reemplácela inmediatamente. De lo contrario, planea reemplazar tus unidades y volver a copiar los medios cada cinco años o cuando sea necesario para evitar la pérdida de datos.

16 Monitorea tus formatos

A largo plazo, tus formatos de archivo de video pueden volverse obsoletos o no admitidos en hardware y software más nuevos (por ejemplo, en la forma, por ejemplo, el video Flash ya no es compatible con dispositivos iOS hoy en día). Aún debes mantener tus archivos originales, pero es posible que también necesites crear copias en formatos más nuevos (es decir, transcodificar) para mantenerlos utilizables. Planea hacerlo mientras aún tenga el hardware/software para leer tus archivos originales.



¿Eres nuev@ en WITNESS? Mantente en contacto.