Grupo de Trabajo OAI-ORE

De Grupos de trabajo Recolecta

Contenido

Presentación

El proyecto parte de las siguientes premisas:

  • Que los resultados de cualquier investigación son objetos digitales complejos compuestos por unidades de diferentes tipos (tablas , textos, software, imágenes, etc..).
  • Que un tipo de estas unidades es lo que se conoce como dataset: conjunto de datos asociado a una fuente de datos, incluyendo no solo los propios datos sino los detalles de sus características generales: tablas asociadas, características de los datos, etc.
  • Que esas unidades componentes tienen , además, la particularidad de poder estar ubicadas en diferentes localizaciones: para un mismo resultado de investigación, un dataset está ubicado en el repositorio del CESCA, imágenes asociadas estar en la Biblioteca digital del Ciemat en Extremadura y el artículo final en , digamos, el repositorio digital de la UNED. Esto como ejemplo sólo sirve para ilustrar el carácter en red de cada uno de esos objetos digitales.
  • Que en este momento sólo nos ocupamos del llamado resultado final de la investigación. Pero que será conveniente empezar a considerar la necesidad de ampliar el concepto a todo el “workflow” del proceso de investigación: desde la presentación y aprobación del proyecto, pasando por los diferentes documentos que se van generando, sus versiones, su autoría , auditoría y políticas de acceso.
  • Que el proyecto que proponemos tiene en consideración todos estos supuestos y plantea la necesidad de adherirse a un estándar de descripción y representación de esos artefactos digitales en la web.
  • Que hay diferentes opciones para realizar tales representaciones: powder, didl, mets, ... Nosotros proponemos OAI-ORE fundamentalmente por: apoyarse en un modelo abstracto de datos con diferentes representaciones-serializaciones (atom, rdf-xml, rfd-a, ) y por ser “web-centric” (lo que conlleva la necesidad de que cada unidad componente de un objeto digital tenga URI asociada)

Marco europeo de actuación

El proyecto que planteamos se integra en la línea de actuación del proyecto financiado por el 7PM DRIVER II: “Enhanced publications” (http://www.driver-repository.eu/Enhanced-Publications.html).

Descripción del proyecto

  • Creación de 40 (10 por centro) objetos digitales que sean agregaciones (objetos digitales complejos ) en el sentido que hemos hablado -complejos, heterogéneos- y con semántica del estilo "es citado por", "es parte de", etc. . Deberíamos encontrar relaciones que enlacen objetos de diferentes centros.
  • Estudio de tecnologías de almacenamiento. (triplestore, Fedora, ..) y serialización en rdf-xml de los objetos.
  • Representación gráfica de los grafos generados y click de acceso a los recursos en la gráfica.
  • Búsqueda y análisis de las relaciones establecidas, obteniendo resultados del tipo:
    • es autor de tales obras
    • es citado tantas veces y en estos documentos
    • El resultado de la búsqueda de datasets de astronomía son estos y se han utilizado(reutilizado) por estos trabajos(objetos)
  • A partir de cualquiera de los objetos y aprovechando su representación gráfica nos vamos moviendo entre ellos a partir de sus relaciones

Objetivos

Creación de un piloto para la representación y descripción de objetos digitales complejos en la web con las especificaciones OAI-ORE

ESTÁNDARES

XSL Transformations (XSLT) Version 1.0 W3C Recommendation 16 November 1999 http://www.w3.org/TR/xslt

RDF/XML Syntax Specification (Revised) W3C Recommendation 10 February 2004 http://www.w3.org/TR/rdf-syntax-grammar/

Open Archives Initiative/Object Reuse and Exchange OAI-ORE http://www.openarchives.org/ore/

Atom Syndication Format http://tools.ietf.org/html/rfc4287

Fedora Commons http://www.fedora-commons.org/

Coordinación

  • Zorita Vicente, Luis (UNED)


Soporte tecnológico

  • Juan Corrales Correyero


Miembros del grupo

  • De la Vega, Ricard (CESCA)
  • Fernández, Leonor (Universidad de Cádiz)
  • García Madrid, Antonio (Universidad Pontificia de Salamanca)
  • López Medina, Alicia (UNED)
  • Pemau, Julio (CSIC)
  • Quintanilla,Teresa (Universidad Carlos III de Madrid)
  • Salvador Fernández, Mª del Puy (Universidad Pontificia Comillas de Madrid)
  • Tardón, Eugenio (Universidad Complutense)
  • Aramberri, Josu (I2Basque. Universidad del País Vasco)
  • Cuesta, Arantza (Fundación Euskomedia de Eusko Ikaskuntza)
  • Prieto Castillo, Francisco (CIEMAT)
  • Ramos Pollán, Raúl (CIEMAT)