GTEActa090416

De Grupos de trabajo Recolecta

REUNION RECOLECTA GRUPO DE TRABAJO “DEFINICION DE UN SISTEMA DE ESTADISTICAS NORMALIZADO PARA TODOS LOS REPOSITORIOS DE RECOLECTA”

Madrid, 16 de abril 2009-04-16


1. Presentación de FECYT y de los asistentes a la reunión

Ronda de presentaciones de todos los miembros del grupo de trabajo:

- Cecilia Cabello (FECYT) - Cristina González Copeiro (FECYT) - Miguel Ángel Arévalo (FECYT) - Mª Ángeles Coslado (FECYT) - Corrales, Juan (Consorcio Madroño) - De la Vega, Ricard (CBUC/CESCA) - Franco Barroso, Carmen (Universidad de Cádiz) - Lavandera Fernández, Raquel (Oficina de Investigación Biosanitaria-FICYT) - López, Ianko (Consorcio Madroño) - Martín Cuesta, Juan Ignacio (Universidad Complutense de Madrid) - Millor Rego, Victoria (Consorcio de Bibliotecas Universitarias de Galicia) - Navarro Gimena, Eva María (Universidad Pablo de Olavide) - Pemau, Julio (CSIC) - Castro, Pablo de (CSIC) - Poveda, Ana (Universidad Carlos III de Madrid) - Prats, Jordi (UPC – coordinación) - Serrano, Jordi (UPC – coordinación)


2. Presentación y objetivos del grupo de trabajo de estadísticas

Recolecta presenta dos líneas de trabajo, por un lado la integración con Driver y, por otro, la creación de grupos de trabajo a nivel nacional para la coordinación de repositorios cuya idea nace en la reunión del pasado diciembre en la Universidad Complutense de Madrid.

Hay 4 grupos de trabajo cuyo planteamiento es que los análisis no se realicen de forma aislada, por lo que hemos creado herramientas comunes y contamos con la presencia de Juan Corrales como coordinación técnico para encontrar similitudes. Esta es la primera reunión presencial, como punto de partida para que cada uno pueda aportar su punto de vista. El objetivo claro de este grupo es generar servicio en el ámbito de Recolecta.

El orden del día es ver los objetivos planteados como grupo y a nivel de metodología de trabajo se presentará la Wiki preparada para agilizar el trabajo y se abrirá turno de palabras.

Recolecta se puso en marcha como recolector para encontrar marcos de trabajo para gente que gestiona repositorios institucionales. Se ha invitado a Isidro Aguillo para definir el servicio que queremos definir y aunque hoy no ha podido venir se espera contar con sus aportaciones.

Objetivos. Salir con un calendario de ejecución de los objetivos para este año 2009:

Identificar y analizar los principales proyectos internacionales relacionados con el análisis estadístico del uso de los contenidos de los repositorios institucionales.


1. Hay que identificar lo que se está haciendo en el mundo, como se nla propuesta sería compartir en una primera instancia listado de proyectos que se están realizando, como se pueden normalizar estas estadísticas y como se traduce tecnológicamente y se normaliza.

Pablo de Castro menciona el que en Driver aun no se tiene consolidado el tema de las estadísticas hasta que el grupo esté más consolidado. Juan Corrales afirma que aunque hay recomendaciones internacionales, estudian que se necesita para poder hacer agregaciones. Lo ideal es que el trabajo lo hagan los propios programadores y puede llevar mucho trabajo.

Definir un sistema de estadísticas homogéneo para cada uno de los repositorios, de manera que los datos que se obtengan sean comparables y agregables

2. Ricard de la Vega propone describir que es lo que se está haciendo ya en España en los repositorios, porque hay términos que no están tan claros y definiciones que no se entienden por igual; mucha ambigüedad. Esto pasaría más al segundo objetivo.

Se propone que los que estén ya trabajando en esto hagan la definición de cuales van a ser los trabajos homogéneos y hagan la propuesta de este sistema. El CESCA y la Universidad de Alicante son los que mejor están trabajando más en este campo. Se comenta la importancia también de la agregación de los datos, pero primero hay que ver que es lo que queremos ofrecer en Recolecta Se decide que CESCA, CSIC, Madroño y Carlos III junto con Alicante van a trabajar en la homogenización del sistema de estadística. Dada la experiencia lo coordinará el CESCA.

La coordinación del GT, contactará con la Universidad de Alicante para invitarlos a participar en el GT y en el grupo de homogeneización del sistema de estadística dad su experiencia en este ámbito.

Identificar las necesidades de los gestores y depositarios de contenidos en cuanto al desarrollo de servicios de estadísticas en el ámbito de la agregación de datos provenientes de los repositorios.

3. Qué tipo de servicios estamos hablando y que tipo de indicadores vamos a facilitar. Juan Corrales cree que para los administradores de los repositorios, para las agencias y para los mismos autores. Estos serían los principales agentes para los que habría que pensar como hacerlo. Se apunta como bueno para directrices de política científica para saber las áreas de conocimiento e incluso desde los países desde los que se accede. A nivel institucional quizás interesa trabajar más con indicadores y como los podemos utilizar. Habrá que ver que se hace en el grupo de calidad.

Como metodología, hay que identificar que usuarios habría, que indicadores querrán ver y cómo se van a medir (consultas y descargar) y que factores de mínimo nivel de agregación hay que introducir. M.A.Arevalo propone subir a la Wiki el listado de indicadores para su discusión discutirlos

Pablo de Castro comenta que las estadísticas por si solas no sirven para evaluar y menciona los estudios de open access para incrementar las citas. Jordi Prats comenta que a lo mejor hay que plantearse también el diseño del sistema para facilitar el acceso a los datos estadísticos agregados para quien los tenga que utilizar y que cualquiera pueda acceder a los datos en bruto para explotarlos. Se puede plantear como definición y quizás no su ejecución en el 2009, sino para más adelante. Juan Corrales apunta la dificultad que puede conllevar el trabajo de las barreras de privacidad, pero hay que contemplarlo.

A partir de los indicadores, pasaríamos ya al diseño del producto y en el plan de implementación tecnológica.

Pablo de Castro propone saber y conocer cuantos repositorios españoles tienen ya sistemas de estadísticas, cuantos hacen publicas sus estadísticas en la web. Este punto quedaría pendiente para preguntar mejor a los responsables de los repositorios y esperar a tener los trabajos más avanzados para poder tener una foto más fija.

Jordi Prats propone también analizar los programas informáticos a utilizar y saber de qué herramientas se han desarrollado (programa ya comercializado o software específico)

De cara al futuro se piensa en la posibilidad de plantear un sello de certificación de Recolecta que garantice que las estadísticas que los repositorios están facilitando para el desarrollo de servicios siguen las directivas marcadas por el proyecto Recolecta.

Se propone agregar estadísticas de los repositorios i contenidos que cumplan las directrices de Driver más aquellas que defina el grupo y también sumar las sugerencias de portales de revistas. Pablo de Castro propone invitar a la persona del CSIC que trabaja en el tema de portales de revistas Ramón Rodríguez, por lo que se le puede dar permiso sobre la Wiki para que pueda aportar cosas


Diseñar los servicios a desarrollar en Recolecta relacionados con la explotación y difusión de datos estadísticos proporcionados por los repositorios. Realizar la propuesta y ejecución de la implementación de los servicios diseñados.

Pendientes de la definición del modelo de servicio.


3. Metodología de trabajo y calendario

Juan Corrales enseña a todos la Wiki, como se accede y en que consiste. Se creará una lista de correo para todo el grupo y como primera acción se recordará a todos que quien quiera escriba a Juan Corrales para solicitar unas claves de acceso para editar la página De cara a empezar con las conclusiones de la jornada, se crearán enlaces a los objetivos ya definidos y se abrirán dos páginas nuevas con las dos acciones decididas. Para acceder al modo de edición de la wiki de RECOLECTA, los asistentes deben enviar a recolecta@fecyt.es una propuesta individual de username y password

Calendario previsto para la ejecución de los objetivos:

1. Para mayo tiene que estar configurado el mapa de la situación internacional en la que se enmarca el proyecto. 2. Para julio deberá estar disponible un primer borrador que defina los criterios para la realización de un sistema homogéneo de estracción de datos estadístcos de los repositorios. El borrado será publicado en la Wiki para su discusión y aprobación en la reunión de setiembre. . 3. Para Julio deberá estar publicado en la wiki una propuesta del modelo de servicios que se quiere ofrecer en Recolecta para su discusión y aprobación en la reunión de setiembre. 4. Septiembre, reunión para hacer un seguimiento de los trabajos, presentar conclusiones, el modelo de servicio y priorizar los desarrollos a realizar hasta finales de 2009.. También se tratará el tema de cómo priorizar la implementación de los servicios cara al 2010. 5. Octubre-diciembre 09 Diseño de los servicios y ejecutar su implementación 6. Queda pendiente el realizar un estudio sobre es estado e implementación de sistemas de gestión y publicación de estadísticas hasta que no se defina que información hay que solicitar a los gestores de los repositoios.

4. Propuestas y comentarios de los asistentes

Se solicita opinión sobre que otras acciones se pueden iniciar de forma relacionada y que se puede pedir a los otros grupos .Mª Coslado propone enlazando con la idea de Pablo de enlazar con los grupos de bibliometría iniciar una actividad independiente con un análisis de citas.

Intervenciones de las experiencias de cada uno de los miembros

   - Desde la Universidad Complutense de Madrid se cuenta que se ha hecho un gran trabajo a la hora de  compartir autoarchivo por parte de los propios usuarios.

- Victoria Millor comenta que en el repositorio de Bugalicia tienen unos 100 documentos y que por muchas aplicaciones de estadísticas hay poca implicación por parte de los rectores y de los investigadores, a la hora de depositar los documentos. Ellos han empezado por identificar desde 1999 la producción científica de sus investigadores en todas las áreas y eso les ha costado 3 años. No disponen de ningún mandato de autoarchivo, pero las universidades si tienen que almacenen la producción científica. - Eva Navarro de la Pablo Olavide están empezando con la carga inicial de los documentos. - Raquel Lavandera comenta su experiencia con los médicos en Asturias y las dificultades con las que se encuentra para que los investigadores autoarchiven sus investigaciones. - Carmen de Cádiz comenta que también han hecho una recopilación de producción científica pero están empezando. - Ana Poveda comenta que en la Carlos III tienen el problema de conexión del repositorio con el sistema de gestión de la investigación. Sería bueno crear un protocolo de investigación independiente y que tuviera en cuenta este problema. - Ricard de la Vega comenta desde el CESCA que en el grupo de ORE igual alguna cosa si que podrían hacer de lo comentado. Seria importante hacer que los repositorios sean una parte de los sistemas de gestión de la investigación - Pablo de Castro del CSIC comenta que en el grupo de identificación de autor a lo mejor puede llegar un momento de identificar afiliación de instituciones.


Jordi Serrano comenta en relación al certificado de calidad que se podría proponer al grupo de calidad.

Propuesta para el grupo de normalización de hacer también una estadística por género

Crear correo de la lista de distribución con los miembros del grupo