Herramientas de catalogación para el archivo de videos sobre derechos humanos

Blog escrito por Ines Aisengart Menezes y Yvonne Ng, traducido por Indira Cornelio

En WITNESS, una pregunta habitual sobre archivo que escuchamos de las organizaciones y personas que utilizan el video para la defensa de derechos humanos es “¿Qué herramienta de base de datos debo utilizar para gestionar mis videos?”. Es una pregunta delicada, porque no hay una única respuesta correcta. Normalmente, nuestra respuesta es: “¡Depende!”.

Son muchos los factores que pueden influir en la elección de una herramienta de catalogación o base de datos: costo, requisitos técnicos, participación de la comunidad y funciones de colaboración, facilidad de uso y accesibilidad, soporte y formación, escalabilidad y sostenibilidad, y seguridad y privacidad de los datos confidenciales.

Hemos elaborado este blog para comparar cuatro herramientas de catalogación / base de datos que hemos utilizado anteriormente en nuestros proyectos, según diversos factores clave. Esta breve lista dista mucho de ser exhaustiva, y puede que no sean las más adecuadas para ustedes. Les animamos a que examinen otras herramientas, quizás utilizando estas mismas categorías que hemos empleado aquí.

Recuerden que, independientemente de la herramienta que elijan, la clave para construir un catálogo eficaz es tener un buen modelo de datos subyacente, es decir, la forma en que estructuran su base de datos, los elementos/campos que utilizan y cómo se relacionan entre sí. Esto es válido tanto si se utiliza una aplicación de base de datos complicada como una simple hoja de cálculo. También es importante documentar el modelo de datos en un diccionario de datos, para garantizar que la catalogación se realiza de forma coherente y correcta, y disponer de una estrategia para incorporar la catalogación al flujo de trabajo.

Para obtener más consejos sobre cómo estructurar los datos, consulten nuestra Guía rápida para el archivo de video.

Uwazi

Uwazi es una aplicación de base de datos de código abierto creada y mantenida por la ONG HURIDOCS (Human Rights Information and Documentation Systems). La estamos usando en la iniciativa del Archivo del Genocidio Rohingya con Rohingya Vision. Uwazi es utilizada por organizaciones, periodistas, académicxs, abogadxs para documentar violaciones de derechos humanos, gestionar documentos, casos y denuncias.

Costo y requisitos

Uwazi es de código abierto, por lo que se puede descargar e instalar de forma gratuita. El autoalojamiento de Uwazi, sin embargo, requiere un servidor y una persona que administre el servidor (por ejemplo, para la configuración, instalación de dependencias, mantenimiento, ejecución de actualizaciones, copias de seguridad, etc.).

Una opción más fácil es tener una instancia de Uwazi alojada y mantenida por HURIDOCS. HURIDOCS ofrece diferentes paquetes de suscripción en función del volumen de datos. Los catálogos de menos de 100 MB son gratuitos, mientras que los de hasta 500 MB cuestan aproximadamente 100 USD al año. La mayoría de las bases de datos de catálogos basados en texto no superarán este tamaño (nota: los contenidos audiovisuales deben almacenarse por separado y enlazarse).

Participación y colaboración de la comunidad

Uwazi permite que varias personas usuarias colaboren en la creación o uso de un catálogo. A lxs usuarixs se les pueden asignar diferentes permisos (niveles de administración, edición o colaboración) y se pueden organizar en grupos de usuarixs para facilitar la gestión. También existe una función de formulario de envío para recopilar información de personas externas.

Usabilidad y accesibilidad

Uwazi tiene una interfaz bastante fácil de usar, pero la configuración de su base de datos Uwazi requiere algunas habilidades de modelado de datos y la revisión de la guía de administración de Uwazi. También es posible contratar a HURIDOCS, como hicimos nosotrxs, para que desarrolle el sistema en función de sus necesidades.

La interfaz de Uwazi está disponible en inglés, árabe, birmano, francés, coreano, ruso, español, tailandés y turco, aunque también es posible que lxs administradorxs traduzcan manualmente y vuelvan a etiquetar los objetos de la interfaz (es decir, botones, menús, etc.) a otros idiomas.

Las instancias de Uwazi alojadas en HURIDOCS o en la nube requieren Internet para acceder a ellas y utilizarlas.

Escalabilidad y sostenibilidad

HURIDOCS mantiene activamente la infraestructura técnica de Uwazi y realiza un desarrollo continuo. Sostiene este trabajo a través de sus tarifas de alojamiento. Aunque Uwazi es de código abierto, existe el riesgo de que, como herramienta comunitaria de nicho, no sea sostenible si HURIDOCS dejara de mantenerla.

Seguridad, privacidad y datos sensibles

De las herramientas de catalogación que revisamos en esta lista, Uwazi es la única creada y mantenida por una organización de derechos humanos, destinada a ser utilizada por la comunidad de derechos humanos. Como tal, Uwazi se ha construido teniendo en cuenta la seguridad de la información. HURIDOCS utiliza centros de datos en los Países Bajos gestionados por Greenhost, con una infraestructura de seguridad específica que incluye cifrado de datos, supervisión y cortafuegos. HURIDOCS publica semanalmente actualizaciones de funciones y parches de seguridad y los envía a las instancias alojadas. También hay opciones para configuraciones alojadas que utilizan VPN y TOR. Las instancias alojadas realizan copias de seguridad programadas en un almacén cifrado.

En cuanto a lxs usuarixs, Uwazi incluye opciones para colecciones públicas y privadas que requieren el inicio de sesión de la persona usuaria y autenticación multifactor opcional. Lxs administradorxs pueden supervisar la actividad sospechosa a través de los registros de actividad.

Por qué lo elegimos para el Archivo del Genocidio Rohingya

Para este proyecto, necesitábamos una herramienta que pudiera dar soporte a un equipo de catalogadorxs remoto y descentralizado. La seguridad de nuestrxs catalogadorxs y de los datos era una preocupación importante, por lo que queríamos una herramienta que fuera consciente de los riesgos a los que se enfrentan quienes documentan derechos humanos.

También queríamos controles de acceso que pudieran acomodar diferentes niveles de catalogadorxs, permitir el acceso selectivo a usuarixs externxs y permitir un eventual acceso público controlado. Teníamos un presupuesto para este proyecto y queríamos ayuda para instalar y configurar una instancia alojada, que pudimos obtener a través de un contrato con HURIDOCS. Además, conocíamos a HURIDOCS desde hacía muchos años como organización homóloga, por lo que ya existía cierta confianza previa. Para nosotrxs, una de las deficiencias de Uwazi es que no se diseñó para catalogar o gestionar colecciones de video, por lo que sus funciones basadas en video son mínimas. Por ejemplo, los videos deben incrustarse en registros de otras plataformas hosts como YouTube o Facebook.

FileMaker

FileMaker es una aplicación comercial de bases de datos relacionales de Claris, una filial de Apple. La utilizamos para crear la Base de Datos Popular para la Responsabilidad Policial Comunitaria con Berkeley Copwatch.Combina un motor de base de datos backend (es decir de lado del servidor) con una interfaz gráfica de usuario (GUI) para que lxs usuarixs puedan crear bases de datos señalando y haciendo clic y rellenando cuadros de diálogo, en lugar de codificando. FileMaker lo utilizan sobre todo en pequeñas organizaciones y empresas de EE.UU. Dado que lxs usuarixs crean sus propias bases de datos desde cero, se puede utilizar para cualquier propósito, como catalogar videos de derechos humanos, por ejemplo cualquier finalidad, incluida la catalogación de videos sobre derechos humanos.

Costo y requisitos

“FileMaker Pro” es la aplicación de escritorio independiente para ordenador, y es la forma más básica de utilizar FileMaker. Existen otras versiones de FileMaker, como “FileMaker Server” y “FileMaker Cloud”, en las que pueden alojar su propia base de datos o escoger la opción de alojamiento con Claris.
A partir de abril de 2023, existen diferentes tarifas de licencia / suscripción para cada versión de FileMaker:

  • FileMaker Pro: Una sola licencia para un ordenador a la vez tiene un costo único de 594 dólares.
  • FileMaker Server: Las licencias para 5-99 usuarixs cuestan a partir de 2.970 USD para una licencia perpetua, o 990 USD al año para una licencia anual. Incluye FileMaker Pro.
  • FileMaker Cloud: Las licencias para 5-10 usuarixs cuestan a partir de 1.260 USD al año. Incluye FileMaker Pro.

Consulten los requisitos detallados de sistema operativo y hardware aquí.

Participación y colaboración con la comunidad

La licencia independiente de FileMaker Pro sólo le permitirá tener una instancia local de FileMaker ejecutándose a la vez (aunque puede crear varias cuentas de usuarix en esa instancia), mientras que FileMaker Server y FileMaker Cloud admiten tener varixs usuarixs remotos simultáneos.

Los datos se pueden exportar fácilmente desde FileMaker a formatos comunes como CSV y XML para compartirlos.

Usabilidad y accesibilidad

Aunque FileMaker tiene una interfaz de usuarix relativamente amigable, tiene muchas funciones y es necesario leer la documentación o seguir algunos tutoriales para aprender a utilizarlo. FileMaker es una “pizarra en blanco”, por lo que lxs usuarixs tendrán que dedicar algún tiempo a planificar y diseñar su base de datos antes de crearla en FileMaker. Dependiendo de la complejidad de su base de datos y de cómo desee trabajar con los datos, puede ser útil tener conocimientos de modelado de datos, secuencias de comandos y diseño gráfico. FileMaker ofrece algunas plantillas básicas estándar, y cualquiera puede crear y compartir su propia plantilla, como la plantilla Base de Datos Popular para la Responsabilidad Policial Comunitaria que creamos con Berkeley Copwatch.

Las bases de datos de FileMaker deben crearse con FileMaker Pro en un ordenador, pero se puede acceder a ellas y utilizarlas en un iPhone/iPad o en un navegador Web si dispone de FileMaker Server o FileMaker Cloud. FileMaker Cloud requiere acceso a Internet, pero FileMaker Pro y FileMaker Server no.

FileMaker admite inglés, francés, italiano, alemán, sueco, japonés, holandés, español, chino simplificado, coreano y portugués de Brasil.

Soporte y capacitación

Al tratarse de una herramienta comercial ampliamente utilizada, FileMaker cuenta con una amplia documentación formal disponible en línea, además de muchas más fuentes informales de información en diversos foros de usuarixs de la web. En nuestra experiencia, utilizar algún buscador web para nuestras preguntas sobre FileMaker también suele funcionar.

En términos de desarrollo y formación, hay muchos consultorxs independientxs de FileMaker disponibles para su contratación. Claris proporciona una lista; nosotrxs utilizamos la organización join::table para conectar con desarrolladorxs para nuestro proyecto Base de Datos Popular.

Escalabilidad y sostenibilidad

FileMaker es la opción más cara de nuestra lista, en términos de costos iniciales de licencias de software, lo que la convierte en una opción poco realista para muchxs. Además, las licencias tienen un precio por usuarix, por lo que el costo aumenta si se añaden más usuarixs. Para aquellxs que pueden permitirse el costo, FileMaker es probablemente una opción sostenible, ya que existe desde hace mucho tiempo, recibe mantenimiento y soporte continuos y es ampliamente utilizado.

En términos de escalabilidad, FileMaker puede soportar técnicamente grandes bases de datos y un gran número de usuarixs simultáneos, pero esto también depende de la versión de FileMaker que esté utilizando y de su plan de precios.

Seguridad, privacidad y datos confidenciales

El acceso a FileMaker se controla mediante cuentas de usuarix, que se pueden configurar de forma muy detallada con conjuntos de privilegios altamente personalizables.

Opcionalmente, puede cifrar el archivo de base de datos localmente en el equipo (que luego se puede cargar en la nube si utiliza FileMaker Cloud). Tengan en cuenta que no hay forma de recuperar la contraseña de cifrado si la pierden (es decir, ya no podrá abrir la base de datos ni acceder a ella).

Dependiendo de su modelo de amenazas, podría ser una opción segura utilizar la versión independiente de FileMaker Pro, ya que está completamente desconectada.

Por qué lo elegimos para la Base de Datos Popular para la Rendición de Cuentas Policial Comunitaria

Plantilla FileMaker de la Base de Datos Popular para la Responsabilidad Policial Comunitaria. https://www.berkeleycopwatch.org/people-s-database

Berkeley Copwatch quería una base de datos que pudiera rastrear distintos tipos de información, como incidentes, videos y agentes de policía, por lo que lo ideal era una base de datos relacional. También necesitaban una base de datos con una interfaz fácil de usar y personalizable que personas voluntarias e investigadoras pudieran aprender a utilizar fácilmente. Por último, por motivos de seguridad, querían una base de datos a la que sólo se pudiera acceder desde su oficina y que pudieran alojar ellxs mismxs, pero que no requiriera mucho soporte informático. Berkeley Copwatch también había utilizado FileMaker anteriormente y disponía de registros de incidentes antiguos que podían importarse a la nueva base de datos.

Tainacan

Tainacan es una plataforma flexible de código abierto para colecciones y repositorios digitales que puede utilizarse, copiarse, modificarse y redistribuirse sin restricciones como un plugin en WordPress. Nuestrxs colaboradorxs, la Asociación Brasileña de Preservación Audiovisual (ABPA) eligieron Tainacan como herramienta para su repositorio colaborativo de recursos de preservación audiovisual. Tainacan ha sido desarrollado desde 2014 por universidades brasileñas, y aunque inicialmente dirigido a colecciones culturales y museológicas, como la plataforma brasileña de patrimonio museológico Brasiliana, muchos proyectos de derechos humanos están adoptando Tainacan, como el Centro de Memória Queixada y Memorial da Resistência. Entre las funciones especiales de metadatos se incluyen la geolocalización (para ver los elementos en un mapa) y la taxonomía (una lista jerarquizada y controlada de términos), y es posible utilizar DublinCore como modelo de metadatos para el intercambio de datos. Existen múltiples formas de personalizar los filtros y visualizar las colecciones. Es posible conectar elementos de la misma colección o de colecciones diferentes.

Costo y requisitos

Aunque Tainacan es gratuito y no tiene costos de instalación o actualización, funciona con WordPress y depende del alojamiento de WordPress, que puede proporcionarse a través de un servicio de alojamiento web (costos según los proveedores locales). Alternativamente, si tienes conocimientos informáticos, puedes instalar un servidor web y WordPress en tu propio ordenador y ejecutar Tainacan sin conexión.

Participación y colaboración de la comunidad

La configuración de lxs usuarixs en Tainacan es similar a los roles y permisos de WordPress, con posibles personalizaciones. El sistema de registro permite a lxs moderadorxs realizar un seguimiento de los cambios.

Entre las características relevantes para la participación de la comunidad se incluyen la posibilidad de aceptar envíos externos que pueden ser aprobados antes de su publicación, y la posibilidad de que usuarixs externxs aporten nuevos términos a una lista controlada de términos. También es posible que lxs usuarixs comenten cada artículo, lo que puede habilitarse para usuarixs anónimxs o identificadxs.

El código fuente de Tainacan está disponible en GitHub, donde lxs usuarixs pueden colaborar en su desarrollo. Tras configurar el esquema de metadatos, es posible subir elementos mediante archivos CSV, lo que permite importar y exportar bases de datos.

Usabilidad y accesibilidad

La interfaz de Tainacan es muy accesible y fácil de usar, con un panel de control y funcionalidades sencillas. La instalación de plugins en el panel de WordPress y la configuración de la colección son rápidas e intuitivas, y no requieren conocimientos de ningún lenguaje de programación.

El plugin Tainacan de WordPress está disponible en inglés, portugués y español; y existen versiones creadas por usuarixs en albanés, catalán, francés, griego, eslovaco, español (de Colombia, México y España), sueco y ucraniano, con diferentes niveles de desarrollo. Con un plugin de Google Translate es posible presentar contenidos en varios idiomas diferentes.

Tainacan tiene más de 1,000 instalaciones activas en todo el mundo, y más de 110 instalaciones están documentadas en un repositorio Tainacan (actualmente disponible en portugués) – principalmente en Brasil, y también Chile, Grecia, México y los EE.UU.

Para mostrar las páginas públicas de Tainacan con todas sus funciones (búsqueda facetada y galería multimedia, por ejemplo), lxs usuarixs pueden utilizar uno de los temas de WordPress compatibles con la comunidad de Tainacan, o implementar plantillas mediante código o bloques disponibles para el editor de WordPress.

Soporte y capacitación

Tainacan ofrece una completa documentación Wiki en inglés, portugués de Brasil y español de México, aunque algunas páginas aún necesitan traducción. El activo foro en línea proporciona una amplia orientación para ayudar con la configuración, donde lxs usuarixs pueden pedir ayuda o informar de errores con soporte multilingüe. Hay varios seminarios web para configurar los repositorios de Tainacan en portugués, español e inglés.

Escalabilidad y sostenibilidad

La inversión constante de las universidades en desarrollo hace de Tainacan una herramienta estable y sostenible para la comunidad. A pesar de ser una herramienta construida y consolidada desde 2014, a junio de 2024, la última versión publicada es la 0.21.6. Se están ultimando algunos detalles y revisiones para poder lanzar la 1.0.

Seguridad, privacidad y datos sensibles

La seguridad de los datos depende en gran parte de las medidas adoptadas por quien aloja el sitio web o de la instalación local de su servidor. Sin embargo, también hay medidas que lxs usuarixs y administradorxs de Tainacan pueden tomar. Se pueden crear diferentes perfiles de usuarix con distintos niveles de acceso y permisos.

WordPress permite la autenticación multifactor y Tainacan ofrece ajustes de privacidad que protegerán los archivos y metadatos, pero necesitan ir acompañados de un conjunto mínimo de configuraciones de backend para protegerse de los ataques. En los casos de uso actuales, el enorme ecosistema de plugins de WordPress y las buenas prácticas de los servicios de alojamiento lo solucionan bien.

Por qué ABPA lo eligió para su proyecto

La Asociación Brasileña de Preservación Audiovisual (ABPA) creó un repositorio colaborativo de recursos sobre preservación audiovisual en portugués, con más de 170 ítems relacionados, incluyendo artículos, debates, disertaciones y tesis, entrevistas, exposiciones, guías, libros y webinars, entre otros. Se eligió Tainacan por su versatilidad en el soporte de tipos de documentos, en el filtrado de los datos y en los modos de presentación, pero sobre todo porque permite a lxs asociadxs colaborar con nuevos ítems y temas.

Hoja de cálculo

Una hoja de cálculo es un sencillo formulario tabular que permite estructurar, formatear, ordenar, filtrar, localizar y difundir datos de forma eficaz. Es una forma más sencilla de organizar y almacenar información que una aplicación de software de base de datos. Las hojas de cálculo pueden utilizarse sin conexión con programas como LibreOffice, Microsoft Excel y Mac Numbers, o en línea, con herramientas como Google Sheets, AirTable y Microsoft Excel Web. Independientemente de la aplicación, una hoja de cálculo básica puede ayudarte a sistematizar y controlar la información.

Costo y requisitos

Los costos varían. Las herramientas de hoja de cálculo como LibreOffice, Google Spreadsheet y Numbers (sólo para Mac) son gratuitas. Microsoft Excel está incluido en Microsoft 365, que está disponible a través de varios planes de precios. Airtable es un servicio “freemium” que ofrece un nivel básico gratuito y planes de precios para usuarixs y funciones adicionales.

Participación y colaboración de la comunidad

Como opción sencilla, las hojas de cálculo son más flexibles, pero requieren más trabajo para garantizar la coherencia. Por ejemplo, si la herramienta no puede aplicar reglas de introducción de datos, resulta más importante emplear un diccionario de datos independiente y listas controladas de términos. Considere la posibilidad de realizar una evaluación de la coherencia de los datos de forma rutinaria cuando trabaje con varixs colaboradorxs. Evalúe periódicamente si todxs lxs colaboradorxs rellenan el catálogo de forma coherente. Los cambios accidentales en los datos pueden ser difíciles de rastrear, incluso con Google Sheets, que guarda registro de los cambios y puede consultarse en el historial de versiones.

Aunque las hojas de cálculo son más limitadas que otras aplicaciones de bases de datos, suelen incluir algunas funciones útiles, como los filtros. Puedes utilizar filtros para ordenar y limitar rápidamente los datos que quieres mostrar (y Google Sheets ofrece la opción de crear un filtro para ti o para todxs lxs usuarixs).

Soporte y capacitación

Consideren la posibilidad de informarse sobre las características de su software de hoja de cálculo antes de iniciar el proceso de catalogación para asegurarse de que es suficiente para sus necesidades. Dado que las aplicaciones de hojas de cálculo son muy utilizadas, suelen tener una documentación oficial bastante buena. También es bastante fácil encontrar orientación de terceros en Internet.

Escalabilidad y sostenibilidad

Las hojas de cálculo pueden volverse difíciles de manejar cuando se dispone de grandes cantidades de datos. Hay que ser consciente de cuando la complejidad de los datos supera las capacidades de una hoja de cálculo. HURIDOCS ofrece consejos útiles sobre cuándo hay que considerar la posibilidad de pasar de las hojas de cálculo al software de bases de datos, por ejemplo, cuando te encuentras codificando por colores las celdas de la hoja de cálculo y haciendo pequeños “hacks” para encontrar datos; desplazándote mucho para encontrar y editar información; o reformateando regularmente los datos para adaptarlos a las necesidades de distintas herramientas para hacer cuadros, mapas o gráficos.

Seguridad, privacidad y datos sensibles

Las hojas de cálculo multiusuarix en línea pueden ser más prácticas para la colaboración, pero son más inseguras. Se puede optar por tener sólo una versión offline por razones de seguridad y privacidad, pero mantener la coherencia requiere un esfuerzo adicional si se comparte un archivo entre colaboradorxs.

Por qué el Laboratorio Popular de Medios Libres eligió Tainacan para migrar el proyecto MemoriaVIVA

MemoriaVIVA es un proyecto dirigido por el Laboratorio Popular de Medios Libres, en colaboración con Antena Negra TV, Sutty, el Centro de Seguridad Informática y Tecnologías de la Comunicación, y con el apoyo de WITNESS. Su misión es recopilar material multimedia de denuncia de violaciones de derechos humanos, crucial para apoyar a abogadxs, periodistas y sociedad civil en los procesos de justicia.

Cada colección se centra en un periodo y territorio concretos, como Perú, Argentina y Chile, y el material se guarda bajo estrictas medidas de seguridad. Los datos sobre los videos, audios y fotografías al inicio de la inciativa eran enviados a la plataforma, recopilándose a través de LimeSurvey, una aplicación web de encuestas en línea gratuita y de código abierto. El acceso a los datos se realiza a través de hojas de cálculo exportadas desde LimeSurvey que se analizan/revisan en LibreOffice. Este proceso impone retos, como la pérdida de información por el diferente formato en cada plataforma y la conexión entre el material (almacenado en una nube segura) y sus metadatos. Por ello, el proyecto se está trasladando a Tainacan.

Estos son sólo cuatro ejemplos de herramientas de catalogación que WITNESS y sus socios han utilizado en nuestros proyectos. Esperamos que este post proporcione una idea de sus fortalezas y debilidades relativas. ¿Qué herramienta de catalogación utilizas o piensas utilizar? Si aún no se ha decidido, esperamos que este artículo les sirva de modelo para tomar sus propias decisiones.

WITNESS acaba de lanzar la campaña mundial “#SomosMemoria: Preservar la Memoria Colectiva a través del Archivo de Video’ – ¡descubre más aquí!

AUTORAS:

Yvonne Ng es una archivista audiovisual con 15 años de experiencia trabajando en la intersección de los derechos humanos, el video y la tecnología, y los archivos. Como Directora del Programa de Archivos de WITNESS, colabora con equipos regionales para ayudar a organizaciones a preservar videos sobre derechos humanos, y elabora materiales de orientación y formación accesibles relacionados con el archivo y la preservación. Yvonne tiene una maestría en Archivo y Conservación de Imágenes en Movimiento por la Universidad de Nueva York.

Ines Aisengart Menezes es Coordinadora del Programa de Archivos y Directora Técnica de la ABPA – Asociación Brasileña de Preservación Audiovisual. Ines tiene un Máster en Preservación y Presentación de la Imagen en Movimiento por la Universidad de Ámsterdam – UvA.

~ Publicado el 14 de mayo de 2024. Traducido el 20 de junio de 2024.



¿Eres nuev@ en WITNESS? Mantente en contacto.