miércoles, 30 de diciembre de 2020

👨‍💻 Mis apuntes sobre los metadatos

metadatos
⏩ Snippet: ⏪

👉 Snippet: En este post se expone una breve definición del concepto de metadatos, sobre los metadatos de los archivos de tu ordenador, como pueden ser documentos de texto, archivos PDF y otros tipos de archivo multimedia como los de música, vídeo o fotografía. Los metadatos sirven para tener datos sobre los datos de estos archivos, información que en ocasiones puede ser privada decir bastante sobre ti. Así también se aborda su definición y su utilidad a la hora de darles uso en el actual entorno digitalizado.


Es común describir el término metadatos como datos que describen otros datos o "datos sobre datos". De forma general, en efecto, el concepto de metadatos se refiere a aquellos datos que hablan de los datos, es decir, describen el contenido de los archivos o la información de los mismos.

¿Cuál es el significado del término "metadatos"?

La etimología del término metadatos también nos pone sobre la pista de su significado. Del griego μετα, "después de" y de "data" plural del latín datum -i, "datos" , literalmente significa "más allá de los datos", aludiendo a datos que describen otros datos. En concreto, el uso del término desde un enfoque informático toma como punto de partida esta concepción genérica, tanto de forma individual como cuando un grupo de metadatos describe a un grupo de datos o recursos.


En general, un grupo de metadatos se refiere a un grupo de datos que describen el contenido informativo de un objeto al que se denomina recurso. El concepto de metadatos es análogo al uso de índices para localizar objetos en vez de datos. Por ejemplo, en una biblioteca se usan fichas que especifican autores, títulos, casas editoriales y lugares para buscar libros. Así, los metadatos ayudan a ubicar datos.

Definiciones


El término «metadatos» no tiene una definición única. Según la definición más difundida de metadatos es que son «datos sobre datos». También hay muchas declaraciones como «informaciones sobre datos», «datos sobre informaciones» e «informaciones sobre informaciones».

Otra clase de definiciones trata de precisar el término como «descripciones estructuradas y opcionales que están disponibles de forma pública para ayudar a localizar objetos» o «datos estructurados y codificados que describen características de instancias conteniendo informaciones para ayudar a identificar, descubrir, valorar y administrar las instancias descritas». Esta clase surgió de la crítica de que las declaraciones más simples son tan difusas y generales que dificultarán la tarea de acordar estándares, pero estas definiciones no son muy comunes.

Podemos también considerar los metadatos, en las áreas de telecomunicaciones e informática, como información no relevante para el usuario final pero sí de suma importancia para el sistema que maneja los datos. Los metadatos son enviados junto a la información cuando se realiza alguna petición o actualización de la misma.

En el campo biológico los metadatos se han convertido en una herramienta fundamental para el descubrimiento de datos e información. En este contexto se pueden definir los metadatos como «una descripción estandarizada de las características de un conjunto de datos» con esto se incluye la descripción del contexto en el cual los datos fueron coleccionados y además se refiere al uso de estándares para describirlos.

Los metadados se caracterizan por:

  • Ser datos altamente estructurados que describen características de los datos, como el contenido, calidad, información y otras circunstancias o atributos.
  • Presentan diferenciaciones que dependerán, en última instancia, de las reglas incluidas en las aplicaciones para determinar la estructura interna de los esquemas de datos.
  • Pueden clasificarse en función de distintos criterios, como su contenido, variabilidad o función. 

En el actual contexto de Big Data, Internet de las cosas y cloud computing los metadatos han adquirido una relevancia inédita. Frente a ingentes cantidades de información que crecen de forma exponencial, la gestión de los metadatos puede ser de gran ayuda para ganar en eficiencia operativa y/o tomar mejores decisiones para la obtención de ventajas competitivas.

Para varios campos de la informática, como la recuperación de información o la web semántica, los metadatos en etiquetas son un enfoque importante para construir un puente sobre el intervalo semántico, ya que cualquier recurso tiene, cuando está almacenado conjuntamente con otros, la necesidad de ser descrito para facilitar las búsquedas que pudieran tratar de encontrarlo a partir de sus características distintivas. Esto es cierto para cualquier tipo de recurso, tanto para un vídeo como para un libro en una biblioteca o para un hueso en el armario de un paleontólogo.

El concepto de metadatos es anterior a Internet y a la web, si bien es cierto que las nuevas necesidades de búsqueda de información han suscitado un interés por las normas y prácticas de metadatos hasta entonces desconocido.

¿Cómo se originan?

Los archivos que generas en tu ordenador con diferentes programas tienen datos concretos, que son los que tú introduces, pero también hay otra serie de datos que describen otras características sobre el contexto del archivo, unos metadatos de los que por defecto no tienes control directo.

Por ejemplo, si creas un archivo de Windows con Word u otra herramienta tú puedes escribir en él todo lo que quieras, pero luego la aplicación generará una serie de metadatos para ese archivo. En ellos describirá aspectos como la fecha en la que fue creado, la aplicación exacta que utilizaste o la fecha en la que hiciste una última modificación del contenido.

También se generan metadatos al crear archivos multimedia, tanto fotografías como vídeos, utilizando una cámara convencional o un smartphone. En estos metadatos encontrarás también información que va desde las características de la foto como la velocidad ISO o tiempo de exposición hasta otros datos más personales, como el fabricante o modelo de la cámara o smartphone desde el que sacaste la foto.

En cualquiera de estos dos casos, son metadatos que se general automáticamente para describir el contenido de los datos del archivo, de ahí la descripción de "datos sobre datos". Este tipo de información puede ser bastante delatora.

Estos metadatos no sólo son útiles para tí como usuario por poder tener más información sobre los archivos. Diferentes servicios y redes sociales también los utilizan para categorizar y organizar el contenido que subes a ellos, pudiendo establecer la fecha exacta cuando se creó el archivo, la localización u otras características.

Cómo ver los metadatos

Ver Metadatos

Ver los metadatos de un archivo de cualquier tipo es bastante sencillo, ya que la mayoría de sistemas operativos te los mostrarán rápidamente. Por ejemplo en Windows, lo único que tienes que hacer es click derecho sobre el archivo y pulsar sobre la opción Propiedades.(1) Te aparecerá una ventana con datos, y en ella debes ir a la pestaña Detalles(2) para visualizar la información sobre el archivo.

Pero en ocasiones los metadatos que muestra tu sistema operativo pueden ser un poco limitados comparados con el total que puedes encontrar. Si quieres saber aún más sobre ellos, puedes recurrir a servicios online como Metapicz para los metadatos EXIF de las fotografías, o Get Metadata para cualquier otro tipo de archivo.

Qué información muestran los metadatos

El tipo de información que puedes obtener mediante los metadatos depende bastante del tipo de archivo que estés analizando. Por ejemplo, si miras los de un vídeo que has grabado por el móvil verás su resolución, el bitrate, los canales y calidad del audio o su duración. También el peso del archivo, su nombre y formato o la geolocalización además de algunos otros datos técnicos.

En el caso de las fotos, puedes ver el modelo, marca o número de serie de una cámara, la apertura de diafragma, sensibilidad o distancia focal a la que se ha tomado, o si la has hecho con un modo manual y flash o sin flash. Si la tomaste con un smartphone también tienes el modelo con el que la sacaste y la latitud, longitud y altura a la que te encontrabas en ese momento. También los datos del archivo en sí, como la resolución, el peso o el tamaño de la imagen.

En cuanto a otros archivos como los documentos de texto, verás datos como la aplicación exacta con la que han sido creados (incluyendo si era una versión de prueba), la fecha en la que lo has hecho y en la que lo hayas podido modificar. También muestra el título, el formato, los párrafos y el número de revisiones, así como otros datos como el si se trata de un documento compartido.

Como puedes ver, algunos de estos datos son bastante inofensivos, pero hay otros que sí pueden decir bastante sobre tí, como los relacionados con la geoposición o el dispositivo que has utilizado. Además, en el caso de los documentos puede que no quieras que otros sepan qué aplicación has utilizado exactamente.

Cómo eliminar los metadatos en Windows 10

Metadatos

Eliminar metadatos en Windows 10 es relativamente fácil. Lo primero que tienes que hacer es acceder a ellos, y peso debes hacer click derecho en el archivo cuyos metadatos quieras borrar y pulsar sobre la opción Propiedades (1). Una vez se abra la ventana de propiedades, entra en la pestaña de Detalles para visualizar los metadatos básicos.

metadatos

Una vez estés en la ventana Propiedades con la pestaña Detalles, debes pulsar sobre la opción Quitar propiedades e información personal que verás en la parte inferior, justo debajo del cuadro en el que se muestran los metadatos.

metadatos

Una vez en el menú de Quitar propiedades e información personal, primero selecciona la opción Quitar las siguientes propiedades de este archivo (1) que tienes en la parte superior. Ahora podrás elegir qué metadatos eliminar, aunque también pulsar el botón Seleccionar todo (2) para elegirlas todas. Por último, pulsa el botón Aceptar para aplicar los cambios.

Utiliza la herramienta nativa de Office

metadatos

La suite de ofimática Office incluye en Word, Excel y todas sus herramientas un gestor de metadatos que también te permite eliminiarlo. Para acceder a él abre el archivo en una aplicación de Office, y luego pulsa sobre el menú Archivo que tienes arriba a la izquierda.

metadatos

Entrarás a una ventana en la que podrás previsualizar varios de los metadatos o propiedades del archivo. En ella tienes que acceder a la herramienta de Inspeccionar documento, para lo cual debes pulsar sobre la opción Comprobar si hay problemas (1). Se te desplegará un menú con tres opciones, en el cual debes pulsar sobre *Inspeccionar documento (2).

metadatos

Irás a una ventana en la que puedes elegir qué tipo de datos quieres examinar. En ella, mantenlo todo seleccionado y pulsa Inspeccionar para analizar todos los datos del archivo.

metadatos

Entonces irás a una ventana en la que de nuevo verás los varios tipos de datos con información sobre el archivo. Aquí, para eliminar los metadatos debes pulsar sobre Quitar todo en el tipo de opciones que lo incluyan, y así borrar todos esos datos del archivo.

Elimina los metadatos con herramientas de terceros

Aunque seguro que con una búsqueda en Google vas a encontrar webs que te prometen eliminar metadatos, es posible que por privacidad prefieras no subir ese archivo a ningún servidor de estas herramientas. Afortunadamente, existen herramientas como Doc Scrubber para documentos de texto o MetaStripper para las fotografías, que son sumamente sencillas a la hora de permitirte cargar los documentos y borrar sus metadatos.

metadatos

Sin embargo, también tienes herramientas online recomendadas por especialistas de la seguridad como MetaShield Analyzer, que aunque te exige estar registrado para poder utilizarlo te permite borrar todo tipo de formatos abiertos y privativos de documentos, de imágenes, de audio y vídeo, de archivos comprimidos y más.

Distinción entre datos y metadatos


La mayoría de las veces no es posible diferenciar entre datos y metadatos. Por ejemplo, un poema es un grupo de datos, pero también puede ser un grupo de metadatos si está adjuntado a una canción que lo usa como texto.

Muchas veces, los datos son tanto "datos" como "metadatos". Por ejemplo, el título de un texto es parte del texto como a la vez es un dato referente al texto (dato como metadato).

Metadatos sobre metadatos


Debido a que los metadatos son datos en sí mismos, es posible crear metadatos sobre metadatos. Aunque, a primera vista, parece absurdo, los metadatos sobre metadatos pueden ser muy útiles. Por ejemplo, fusionando dos imágenes y sus metadatos distintos puede ser muy importante deducir cuál es el origen de cada grupo de metadatos, registrando ello en metadatos sobre los metadatos.

Las ventajas de la gestión de metadatos

Los beneficios de la gestión de metadatos son numerosos. Esta "información sobre información" engloba todos los atributos de los datos que describe cada archivo y, de forma conjunta, proporciona una información de interés con muy distintas utilidades a la hora de mejorar la gestión de los datos.

No en vano, en el entorno organizacional los metadatos juegan un importante papel como marco de referencia, en línea con una visión genérica que Forrester Research resume definiéndolos como "la información que describe o proporciona el contexto para los datos, contenidos, procesos de negocio, servicios, reglas de negocio y políticas de apoyo a los sistemas de información de una organización".

 

Que_son_los_metadatos_para_que_sirven

Su multifuncionalidad, en efecto, es una de las principales características de esta poderosa herramienta para la gestión de los datos como un activo. En concreto, éstas son algunas de las funciones más ventajosas de una buena administración de los metadatos a la hora de mejorar los procesos de gestión y gobierno de datos:

  • Facilita búsquedas y análisis: Los metadatos ayudan a buscar y ubicar datos. Una buena gestión de metadatos también facilita el análisis del curso de los datos desde la fuente, facilitando la autodocumentación, así como funciones de transformación, análisis y reporting.
  • Facilita la estandarización: Al eliminar errores e inconsistencias, la estandarización de datos mejora la calidad de los mismos a lo largo de su ciclo de vida. Con la gestión de los metadastos en un repositorio centralizado conseguiremos una visión más completa del ciclo de vida del dato, desde que se crea hasta que se consume, además de ventajas en el control de procesos.
  • Ayuda a la integración: En la integración híbrida los metadatos son claves. Sirviéndonos de un repositorio centralizado de metadatos para el uso compartido entre los usuarios de TI y de negocio facilitaremos la gobernanza, así como una aplicación de las mejores mejores prácticas por parte de aquellos. De gran utilidad en estructuras híbridas para mejorar la gestión de datos de forma integrada.
  • Gestión del cambio: Sobre todo, en entornos complejos, pues la gestión de metadatos proporciona la visibilidad y el control necesarios para hacerlo en un entorno de integración de datos empresariales. A través de una automatización de los análisis de impacto detectaremos los cambios en las aplicaciones y podremos intervenir para subsanar conflictos.
  • Más seguridad: En caso de haber cambios, una adecuada gestión de metadatos protegerá los datos críticos del negocio y, en general, facilitará el cumplimiento de la normativa.
  • Mejora los informes: Gracias a esa facilidad de intervención datos serán de calidad y, los procesos no presentarán incidencias y, lógicamente, el reporting ganará en confiabilidad. En general, una correcta gestión de metadatos permitirá entregar datos seguros y confiables.
  • Desarrollos más ágiles: Un acceso inteligente a los metadatos, por ejemplo en un entorno híbrido integrado, aumenta la productividad de los desarrolladores y reduce el plazo de suministro de la concectividad. Ello se traduce en una rebaja del coste del cambio entre las diferentes plataformas.
  • Mejor gobernanza de datos: Los metadatos gestionados en un entorno estandarizado mediante un repositorio centralizado son esenciales para implementar un exitoso programa de gobierno de datos. Entre otras ventajas, la gestión de los metadatos aumenta la visibilidad de las distintas ejecuciones de patrones y gestión de diferentes fuentes de datos, propiciando una gobernanza centralizada, así como las mejores prácticas.

Tipos de metadatos


Descriptivos: Para encontrar o entender una fuente de información.

Administrativos: - Metadatos técnicos: Para decodificar y representar archivos. - Metadatos de preservación: Gestión a largo plazo de archivos. - Metadatos de derechos: Derechos de propiedad intelectual adjuntos al contenido.

Estructurales: Relaciones de partes de recursos entre sí.

Lenguajes de marcado: Integra metadatos y marcas para otras características estructurales o semánticas dentro del contenido

Objetivos


El uso de los metadatos mencionado más frecuentemente es la refinación de consultas a buscadores. Usando información adicional los resultados son más precisos, y el usuario se ahorra filtraciones manuales complementarias.

El intervalo semántico plantea el problema de que el usuario y el ordenador no se entiendan porque este último no comprenda el significado de los datos. Es posible que los metadatos posibiliten la comunicación declarando cómo están relacionados los datos. Por eso la representación del conocimiento usa metadatos para categorizar informaciones. La misma idea facilita la inteligencia artificial al deducir conclusiones automáticamente.

Los metadatos facilitan el flujo de trabajo convirtiendo datos automáticamente de un formato a otro. Para eso es necesario que los metadatos describan contenido y estructura de los datos.

Algunos metadatos hacen posible una compresión de datos más eficaz. Por ejemplo, si en un vídeo el software sabe distinguir el primer plano del fondo puede usar algoritmos de compresión diferentes y así mejorar la cuota de compresión.

Otra idea de aplicación es la presentación variable de datos. Si hay metadatos señalando los detalles más importantes, un programa puede seleccionar la forma de presentación más adecuada. Por ejemplo, si un teléfono móvil sabe dónde está localizada una persona en una imagen, tiene la posibilidad de reducirlo a las dimensiones de su pantalla. Del mismo modo un navegador puede decidir presentar un diagrama a su usuario ciego en forma táctil o leída.

Clasificación


Los metadatos se clasifican usando tres criterios:

Contenido

Subdividir metadatos por su contenido es lo más común. Se puede separar los metadatos que describen el recurso mismo de los que describen el contenido del recurso. Es posible subdividir estos dos grupos más veces, por ejemplo para separar los metadatos que describen el sentido del contenido de los que describen la estructura del contenido o los que describen el recurso mismo de los que describen el ciclo vital del recurso.

Variabilidad

Según la variabilidad se puede distinguir metadatos mutables e inmutables. Los inmutables no cambian, no importa qué parte del recurso se vea, por ejemplo el nombre de un fichero. Los mutables difieren de parte a parte, por ejemplo el contenido de un vídeo.

Función

Los datos pueden ser parte de una de las tres capas de funciones: subsimbólicos, simbólicos o lógicos. Los datos subsimbólicos no contienen información sobre su significado. Los simbólicos describen datos subsimbólicos, es decir añaden sentido. Los datos lógicos describen cómo los datos simbólicos pueden ser usados para deducir conclusiones lógicas, es decir añaden comprensión.

Ciclo de vida


El ciclo de vida de los metadatos comprende las fases creación, manipulación y destrucción. El análisis minucioso de cada una de las etapas saca a la luz asuntos significativos.

Creación

Se pueden crear metadatos manualmente, semiautomáticamente o automáticamente. El proceso manual puede ser muy laborioso, dependiente del formato usado y del volumen deseado, hasta un grado en el que los seres humanos no puedan superarlo. Por eso, el desarrollo de utillaje semiautomático o automático es más que deseable.

En la producción automática el software adquiere las informaciones que necesita sin ayuda externa. Aunque el desarrollo de algoritmos tan avanzados está siendo objeto de investigación actualmente, no es probable que la computadora vaya a ser capaz de extraer todos los metadatos automáticamente. En vez de ello, se considera la producción semiautomática más realista; aquí un servidor humano sostiene algoritmos autónomos con la aclaración de inseguridades o la proposición de informaciones que el software no puede extraer sin ayuda.

Hay muchos expertos que se encargan del diseño de herramientas para la creación de metadatos pero que ignoran cuestionar este proceso. Según los que no evitan el asunto, la generación no debe comenzar después de la terminación de un recurso sino que debe hacerse durante la fabricación: hay que archivar los metadatos tan pronto como se originan, con los conocimientos especiales del productor, para evitar una laboriosa reconstrucción posterior. Por eso, se tiene que integrar la producción de metadatos en el procedimiento de fabricación del recurso.15​

Manipulación

Si los datos cambian, los metadatos tienen que cambiar también. Aquí se hace la pregunta: ¿quién va a adaptar los metadatos? Existen modificaciones que pueden ser manejadas de forma sencilla y automática, pero hay otras donde la intervención de un servidor humano es indispensable.

La metaproducción, el reciclaje de partes de recursos para crear otros recursos, demanda atención particular. La fusión de los metadatos afiliados no es trivial, especialmente si se trata de información con relevancia jurídica, como por ejemplo la gestión digital de derechos.

Destrucción

Además hay que investigar la destrucción de metadatos. En algunos casos es conveniente eliminar los metadatos junto con sus recursos, en otros es razonable conservar los metadatos, por ejemplo para supervisar cambios en un documento de texto.

Metadatos en la informática


Los metadatos han cobrado gran relevancia en el mundo de Internet, por la necesidad de utilizar los metadatos para la clasificación de la enorme cantidad de datos. Además de la clasificación los metadatos pueden ayudar en las búsquedas. Por ejemplo, si buscamos un artículo sobre vehículos, este dato tendrá sus correspondiente metadatos clave adjuntos, como 4 ruedas, motor, etc.

Otros ejemplos de usos de metadatos en la informática:

Metatags en HTML: etiquetas con información sobre el propio documento web: autor, editor, codificación, etc.

Información en el propio sistema de ficheros: HFS o ReiserFS, por nombrar dos. Se ven completados por los buscadores inteligentes (Beagle o Spotlight) que saben reconocer estos metadatos.

Clasificaciones de fotos: F-Spot, Picasa o iPhoto, por ejemplo.

Clasificadores de canciones: contienen metadatos sobre las canciones, bien en MP3 o en CD de audio, en un formato llamado ID3. Por ejemplo: iTunes y Rhythmbox.

Almacenamiento


Hay dos posibilidades para almacenar metadatos: depositarlos internamente, en el mismo documento que los datos, o depositarlos externamente, en su mismo recurso. Inicialmente, los metadatos se almacenaban internamente para facilitar la administración.

Hoy, por lo general, se considera mejor opción la localización externa porque hace posible la concentración de metadatos para optimizar operaciones de búsqueda. Por el contrario, existe el problema de cómo se liga un recurso con sus metadatos. La mayoría de los estándares usa URIs, la técnica de localizar documentos en la World Wide Web, pero este método propone otras preguntas, por ejemplo qué hacer con documentos que no tienen URI.

Codificación


Los primeros y más simples formatos de los metadatos usaron texto no cifrado o la codificación binaria para almacenar metadatos en ficheros.

Hoy, es común codificar metadatos usando XML. Así, son legibles tanto por seres humanos como por computadoras. Además este lenguaje tiene muchas características a su favor, por ejemplo es muy simple integrarlo en la World Wide Web. Pero también hay inconvenientes: los datos necesitan más espacio de memoria que en formato binario y no está claro cómo convertir la estructura de árbol en una corriente de datos.

Por eso, muchos estándares incluyen utilidades para convertir XML en codificación binaria y viceversa, de forma que se unen las ventajas de los dos.

Vocabularios controlados y ontologías


Para garantizar la uniformidad y la compatibilidad de los metadatos, muchos sugieren el uso de un vocabulario controlado fijando los términos de un campo. Por ejemplo, en caso de sinónimos o interlenguaje hay que acordarse qué palabras se usan para evitar que el buscador localice «español» pero no «española».

Una ontología además define las relaciones de los términos del vocabulario para que la computadora puede evaluarlas automáticamente. Así es posible presentar una página web sobre «Vincent Van Gogh» aunque el usuario tecleó «pintores neerlandeses»; usando una ontología adecuada el buscador comprende que Van Gogh fue un pintor neerlandés.

Un concepto muy similar a las ontologías son las folksonomías. Las ontologías son definidas por expertos del campo que ordenan los términos, pero las folksonomías son definidas por los mismos usuarios.

Metadatos y objetos de aprendizaje


En el e-learning los metadatos se emplean para describir los objetos y recursos de aprendizaje con el objetivo de facilitar las búsquedas en los repositorios. A menudo la información de metadatos de los repositorios de objetos de aprendizaje cumple el estándar IEEE LOM, el cual define un conjunto de nueve categorías de información, que permiten describir los recursos tanto desde el punto de vista didáctico como técnico, lo que permite hacer búsquedas mucho más ajustadas que permitirán a los usuarios (profesores que componen un nuevo curso con materiales existentes, o alumnos interesados en aprender sobre un cierto tema) obtener resultados más ajustados a los criterios de búsqueda introducidos.

Los metadatos son una parte esencial del paradigma de los objetos de aprendizaje, puesto que:

La reutilización de objetos de aprendizaje se basa en la creación y uso de metadatos, descripciones a menudo externas a los propios recursos.

Los metadatos, si se proporcionan en los lenguajes adecuados, permiten desarrollar novedosas herramientas tecnológicas que facilitan la búsqueda y manipulación de los objetos de aprendizaje. Facilitan la recuperación de la información, al describir el contenido y sus relaciones con otros recursos.

Facilitan la interoperabilidad, ya que hacen más fácil compartir e intercambiar información. Simplifican la gestión y el almacenamiento, pues permiten guardar información sobre el ciclo de vida de los recursos.

Ayudan a gestionar adecuadamente y proteger los derechos de propiedad intelectual.

Los metadatos son por tanto un elemento de valor fundamental. Un recurso digital con un diseño pedagógico excelente no es per se un buen objeto de aprendizaje, sino que lo será en la medida en que los metadatos que lo describan sean también de calidad.

Paradatos


Se conoce como paradatos al conjunto de datos que se genera durante la interacción entre un usuario y un recurso o servicio de un escenario educativo (un entorno virtual de aprendizaje, repositorio, red social, etcétera). En función del recurso o servicio accedido y las operaciones realizadas con el mismo, los paradatos generados contendrán más o menos información. Esta información se puede almacenar para ser posteriormente analizada, con el objetivo de comprender mejor cómo los usuarios interactúan en dicho escenario educativo, detectando posibles problemas, así como oportunidades de mejora tanto del propio escenario educativo y de las herramientas utilizadas como del entendimiento del proceso que siguen los usuarios en el mismo. A partir del análisis realizado, es posible entonces construir, entre otros, sistemas de recomendación, esquemas de reputación, visualizaciones de la interacción, etc.

Por ejemplo, si un usuario se descarga un documento de un repositorio de objetos de aprendizaje, será posible saber que el usuario U ha descargado el documento D en el momento T. Esta información puede usarse para detectar aquellos recursos más descargados o, por el contrario, aquellos que nunca son accedidos por los usuarios, pero también conocer en qué épocas del semestre académico se produce una mayor utilización del repositorio. Otra posibilidad es si un usuario U evalúa un recurso R con una valoración X en el momento T, por ejemplo, un comentario en un grupo de Facebook. Esto permite conocer los comentarios mejor o peor valorados por los usuarios, así como los usuarios más activos.

En general, el objetivo es guardar la interacción de los usuarios con el sistema en forma de tuplas (U, T, S, R, X): un usuario U en el momento T utiliza un servicio S sobre un recurso R con un resultado X. Esta es la mínima información que debe ser almacenada para su posterior análisis.

Almacenamiento de paradatos


Dado que la interacción en un entorno virtual de aprendizaje suele realizarse mediante el uso de un navegador web, un usuario que visita los espacios ofrecidos por el mismo deja un rastro en forma de accesos a páginas web que quedan recogidos en los ficheros de registro (en inglés, log files) de los servidores web que soportan el sistema. Por lo tanto, parece factible analizar los ficheros de registro para extraer la información relativa a la interacción. El problema, no obstante, es que estos ficheros contienen muchas más entradas relativas a la disposición de los elementos que forman una página web, que realmente relacionadas con el propio resultado de la interacción de los usuarios, la cual debe ser calculada a partir de la secuencia de saltos capturada en los ficheros de registro. El coste computacional de analizar ficheros de registro es muy elevado (contienen millones de líneas de registro) y no es sencillo cuando se trata de sistemas complejos con múltiples servidores donde el rastro dejado por un usuario puede estar fragmentado en diferentes ficheros.

Por lo tanto, si es necesario recoger paradatos para su análisis posterior, es mejor que el sistema sea diseñado específicamente con un servicio de recogida enfocado a almacenar solamente la información requerida para el análisis, reduciendo el tamaño necesario así como el tiempo de proceso. En función del objetivo del análisis, los paradatos pueden almacenarse dentro de los metadatos de un recurso, dentro del perfil del usuario o bien, lo más habitual, en una tabla (o base de datos, en función de su complejidad) separada.

Crítica y problemas asociados al uso de los metadatos


Algunos expertos critican fuertemente el uso de metadatos. Sus argumentos más sustanciosos son:

Los metadatos son costosos y necesitan demasiado tiempo. Las empresas no van a producir metadatos porque no hay demanda y los usuarios privados no van a invertir tanto tiempo.

Los metadatos son demasiado complicados. La gente no acepta los estándares porque no los comprende y no quiere aprenderlos.

Los metadatos dependen del punto de vista y del contexto. No hay dos personas que añadan los mismos metadatos. Además, los mismos datos pueden ser interpretados de manera totalmente diferente, dependiendo del contexto.

Los metadatos son ilimitados. Es posible adherir más y más metadatos útiles y no hay fin. Los metadatos son superfluos. Ya hay buscadores potentes para textos, y en el futuro la técnica query by example («búsqueda basada en un ejemplo») va a mejorarse, tanto para localizar imágenes como para música y vídeo.

Algunos estándares de metadatos están disponibles pero no se aplican: los críticos lo consideran una prueba de las carencias del concepto de metadatos. Hay que notar que este efecto también puede ser causado por insuficiente compatibilidad de los formatos o por la enorme diversidad que amedrenta a las empresas. Fuera de eso hay formatos de metadatos muy populares.

Si bien la inclusión de metadatos es necesaria, para facilitar y potenciar un buen número de tareas importantes, también existen problemas asociados al uso de los mismos. Algunos de los problemas más citados en la literatura científica se resumen en los siguientes puntos:

Falta de compleción: introducir metadatos es a menudo una tarea ingrata y que requiere un esfuerzo considerable. Esto lleva a una cierta tendencia a no completar (o a completar deficientemente) los registros de metadatos, ya que las organizaciones bien no perciben adecuadamente la necesidad de ofrecer registros de metadatos completos o no pueden hacer frente a los altos costes, en términos de esfuerzo, de completar sus colecciones. Este problema es más patente cuando el número de objetos de aprendizaje a anotar es importante (colecciones de miles de objetos de aprendizaje) o cuando el número de elementos de metadatos a rellenar es elevado (por encima de la veintena).

Dificultades de interoperabilidad: algunas informaciones de metadatos descansan en el uso de vocabularios, colecciones de términos cerradas cuyos elementos se han de emplear obligatoriamente para consignar la información relativa al elemento de metadatos en cuestión. Los estándares permiten utilizar distintos vocabularios para un elemento de metadatos, por lo que estos pueden variar de una institución a otra causando dificultades para intercambiar recursos, para que sistemas externos operen sobre metadatos con distinto origen, etc. Así por ejemplo, la información para el elemento 5.8.Dificultad del estándar IEEE LOM ha de escogerse (según el estándar IEEE LOM) de la siguiente lista de términos: muy fácil / fácil / medio/ difícil / muy difícil. Sin embargo, el propio estándar IEEE LOM permite utilizar otro vocabulario si se estima oportuno, por lo que una cierta institución podría simplificar el número de categorías a 3, ampliarlo a 10 para ofrecer una escala más detallada, o elegir otra escala más adecuada a su contexto tal como por ejemplo: básico / básico-necesita-apoyo / imprescindible-apoyo-externo/ complejo.

Inconsistencia semántica y otros interesantes problemas derivados de los estándares establecidos: no es infrecuente observar cómo dos instituciones distintas ofrecen informaciones diferentes para el mismo elemento de metadatos, a menudo por falta de claridad del estándar de metadatos utilizado. Tomando como ejemplo el estándar IEEE LOM, algunos elementos como el elemento 5.8.Dificultad dependen en gran medida de la opinión subjetiva de la persona que crea el registro de metadatos y, en consecuencia, están destinados a ser inconsistentes con registros creados por otras personas pues uno podría considerar difícil lo que para otro es muy difícil. Otro problema similar es la incompletitud semántica, es decir, la introducción de información incompleta para un cierto elemento de metadatos, no proporcionando toda la información que sería posible —y deseable— ofrecer.

Están "orientados a humanos": los metadatos son descripciones textuales que las personas interpretamos fácilmente. Sin embargo, a los sistemas y aplicaciones informáticas no les resulta sencillo procesar esta información para ofrecer servicios añadidos, ya que los metadatos no han sido escritos para que los entiendan "máquinas". Así, resulta difícil programar un buscador que priorice los resultados de una búsqueda de objetos de aprendizaje en un repositorio, en función de, por ejemplo, la información sobre derechos de acceso (elemento LOM 6.2.Derechos) o de su cobertura geográfica o temporal (elemento 1.8.Cobertura), sencillamente porque dicha información está en un texto escrito en un lenguaje humano del que es difícil extraer la información buscada: es preciso procesar el texto mediante complejas técnicas de análisis lingüístico, dividirlo en sus partes esenciales, analizar cada parte y extraer la información, etc., teniendo siempre en cuenta que en textos como la descripción de la cobertura puede haber localismos, omisiones obvias para las personas pero incomprensibles para una máquina, o cualesquiera otras complejidades propias de los lenguajes humanos.
.

Bibliografia:
https://blog.powerdata.es/el-valor-de-la-gestion-de-datos/que-son-los-metadatos-y-cual-es-su-utilidad .

https://es.wikipedia.org/wiki/Metadato
.


.


.