miércoles, 26 de enero de 2011

Economía y segunda fase del #opendata

Hace un par de días, @mgarrigap publicaba una entrada en su bitácora referente a la apertura de una segunda fase del desarrollo del movimiento "opendata". Básicamente, estoy de acuerdo con él, y en ella entramos por puras razones economicistas. Es una consecuencia lógica de la necesidad de dar soporte económico al esfuerzo de puesta a disposición de la información pública, de aminorar la tensión existente entre la demanda de transparencia y el coste de satisfacerla en tiempos de arcas públicas exhaustas. Algo previsible a medida que nuevas unidades administrativas se plantean la necesidad de entrar en el terreno de juego del "opendata" y, como indicaba hace un año, descubren que "la transparencia y apertura de datos no es gratis, y muchas supone trabajar con sistemas obsoletos sobre los que cualquier intervención cuesta un potosí".

Siempre he sido de la idea que no toda la información pública podrá facilitarse de modo gratuito, y mucho menos en formato procesable.  La higiene democrática y las leyes obligan u obligarán a que así sea para ciertos conjuntos de datos (presupuestos, gasto público, ...), y esto será así principalmente para información que sea objeto de reutilización no lucrativa por aplicaciones como ¿Dónde van mis impuestos? de @dcabo, pero no será la norma general. 

Cómo decía @andreadimaio en un post reciente, cobrar por el "opendata" no es una mala idea. El aspecto a determinar es cuánto cobrar. La Ley 37/2007 habla de como establecer contraprestaciones económicas en su artículo 7. Es importante resaltar que el precio a hacer recaer no es referente a una información o conjunto de datos concreto, sino que se refiere a "cubrir al menos los costes del servicio o actividad". Ello permite a las Administraciones Públicas modelos de negocio no onerosos para el erario público, en que se conjugue ofrecer a coste cero conjuntos de información de interés general mientras ciertos conjuntos de información que tengan demanda comercial se ofrezcan a precios superiores a lo que cuesta generarla. La condición es la suma cero de todo ello basándonos en un balanceo entre aquellos que podemos cobrar por uso y aquello que no debemos establecer coste por utilizar.

Y aquí es dónde entran en juego modelos como el puesto encima de la mesa por el Gobierno Británico. La creación de una corporación de opendata que haga la gestión global de todo el servicio para las Administraciones Públicas permite establecer economías de escala y un balanceo apropiado entre aquello que se cobra y lo que se da gratis

Comparto parte del escepticismo alrededor de la propuesta, aunque en mi caso no provenga de la idea sino de la posible titularidad privada de su implementación que deja traslucirse en este caso. En primer lugar, creo que la gestión y puesta a disposición de la información pública debe realizarse por el mismo sector público, evitando en lo posible la entrada de actores privados que den lugar a conflictos de intereses sobre qué liberar y a qué precio. En segundo lugar, el establecimiento de un modelo de partenariado público- privado en esta materia como ha propuesto alguna vez la OECD  lo veo de difícil compatibilidad con el veto a los acuerdos de exclusividad que marca la actual Directiva europea en la materia y la Ley 37/2007.

Efectivamente, entramos en una segunda fase del opendata. Nuevas unidades administrativas que aún no han entrado en juego entrarán en la medida que  el marco legal les obligue y exista un modelo de producción no deficitario. Los dineros van a marcar esta nueva fase además de la demanda de transparencia, y, probablemente, necesitemos adoptar modelos de cooperación interadministrativa que nos permitan adoptar las economías de escala para afrontar esta fase.

32 comentarios:

  1. Pues en esto no estamos de acuerdo. Defiendo el enfoque que estamos siguiendo en Euskadi sobre liberación de datos: inversión importante en transparencia y mínima en colaboración, de manera que la politica de opendata sea sostenible, incluso sin cobrar tasas.

    Me explicaré mejor. Nosotros gastamos dinero en tener una buena web. El principìo de la "transparencia" se encarna sobre todo en eso: tener accesibles muchos contenidos, sacar a la luz aquellos que suelen estar ocultos, presentarlos de manera usable y atractiva, con lenguaje entendible, orinetados a cada público objetivo... Gastamos dinero en que cualquier ciudadano pueda acceder a la enorme veta de información de que dispone la Administración.

    Una vez que tienes una buena web, es muy barato derivar de ahí un espacio donde ofreces esa información como datasets en formatos reutilizables. Es barato y, en mi poinión, debería ser un derecho democrático. El principio al que hace referencia no es "transparencia", sino "colaboración". Es sostenible.

    Ahora bien, estaré de acuerdo en la aplicación de tasas en algunos casos concretos. Por ejemplo, oferecemos en abierto las tablas de la estadística oficial. Por secreto estadístico no se puede acceder a los cuestionarios originales. Si un investigador solicita una explotación especial a partir de esos cuestionarios, supone un trabajo de un funcionario por el que me parece razonable cobrar. Pero, para mí, el caso general debe seguir siendo "gratis total". Como casi todo en Internet.

    ResponderEliminar
  2. Querido Andrés: creo que olvidas varias cosas:

    1º cobrar cuesta dinero (y no poco ya que la gestión es formalista). Cualquiera que haya gestionado tasas o precios públicos lo sabe.

    2º poner precios supone fijar barreras de entrada para start-ups, en un terreno donde la innovación viene precisamente de estas micro-empresas.

    3º liberar datos no debe suponer un coste añadido reseñable. Si simplemente consiste en liberar datos existentes a través de medios existentes no debería cobrarse, pues todo ya lo ha pagado el contribuyente. Si supone un gasto adicional deberá valorarse si el establecimiento de precios se justifica a la luz de los elementos anteriores.

    atentamente,
    J Gorkin

    ResponderEliminar
  3. Andrés: primero agradecerte la mención a mi post y mejorar el debate con el tuyo :)

    Es curioso como está cambiando este tema en poco tiempo.

    Cuando empezamos a hablar del proyecto OpenData BCN fuí uno de los que defendió a ultranza la gratuidad del servicio.

    Sin embargo ahora comparto tu opinión que el servicio OpenData tiene un coste, no hay que obviarlo y precisamente para poder garantizar su futuro conviene imponer tasas.

    No obstante, en este tema sí que estoy más de acuerdo con Alberto.

    La excepción debería ser el pago, la mayoría de datos tienen que ser gratuitos, en caso contrario perdemos algunos de los motivos por les que se implantan servicios OpenData, como por ejemplo la universalización del acceso a la información y el fomento de la actividad económica en el ámbito de las TIC.

    De hecho, tal como apunta 'Anónimo', mi opinión es que todo aquel dato que ya se ha utilizado por el fín que se creó debería abrirse a la sociedad sin ningún coste.

    Sólo debería cobrarse por aquella información específica (o sea, no de interés general).

    Otro tema es el coste de transformación de los formatos actuales de información de interés general a formatos procesables.

    Dependerá de cada caso, pero en general no es un coste despreciable.

    No obstante, este caso sí que creo que tiene que ser asumido al 100% por presupuesto público, en esta información (insisto: de interés general) no se debe cobrar ninguna tasa.

    Con esta estrategia el punto clave es la definición de "información de interés general"...

    Otro tema, que ni tú ni yo hemos hablado es de cómo calcular el retorno de la inversión que realiza la Administración.

    Se necesitan métricas del "retorno social" de la apertura de datos. Estas métricas proporcionarían datos que justificarían (o no) las inversiones públicas y permitirían poder comunicar mejor los procesos de apertura de datos.

    En este tema de las métricas de OpenData soy todo oídos, acepto ideas, sugerencias, buenas prácticas, etc ;-)

    Gracias por el debate.

    ResponderEliminar
  4. Intuyo que estamos de acuerdo en estos presupuestos:
    (a)aquel dato que ya se ha utilizado por el fín que se creó debería abrirse a la sociedad sin ningún coste
    (b)el coste a recuperar sería el de la transformación de los formatos actuales a formatos procesables.

    En tal caso, la solución para mantener la gratuidad es minimizar el coste de transformación de formatos. Aquí el debate se traslada al de "open data" versus "linked data".

    Si has trabajado bien en tu web, te será muy barato ofrecer xml, csv, wms y otros formatos reutilizables. En cambio, será más costosa una orientación fuerte a semántica.

    Por lo tanto, donde hay que justificar el gasto es, sobre todo, en proyectos con mucha carga tecnológica (léase "semántica"). Habrá casos en que la inversión esté justificada, por el valor que añadan al servicio, y otros en que no.

    Marc, Andrés, supongo que no estáis diciendo que es muy costoso ofrecer xml o csv, ¿no?

    ResponderEliminar
  5. Alberto,

    Por mi parte intuyes bién, estoy de acuerdo en lo que comentas acerca de los datos "ya utilizados" y los costes de transformación a formatos procesables.

    A mi entender el resumen es el siguiente:
    1.- En los datos que son muy específicos (mayoritariamente adhoc) se debería repercutir su coste.
    2.- Los datos que ya se han utilizado para otro fín deberían abrirse para el (re)uso de la sociedad:
    > 2.1 - Estos datos no deberían tener ningún coste si se abren en el formato ya disponible.
    > 2.2 - Si se quiere transformar estos datos a formatos más procesables (leáse, por ejemplo, lineked data) entonces se debería analizar: 1.- Si realmente es necesario hacerlo. 2.- Quién asume el coste de hacerlo (¿sólo la Administración?, ¿el usuario final?)

    Tampoco hay que obviar que abrir un dato habitualmente provoca una revisión del workflow de creación/mantenimiento de dicho dato.

    Dicho de otra forma, abrir un dato provoca una mejora interna de la Administración, hecho que también hay que tener en cuenta.

    Efectivamente no es costoso (aunque tampoco es nulo) ofrecer xml o csv, pero a mi juicio es pobre, hay que aspirar a más pero siempre de forma 'sostenible', no hay nada peor que generar falsas expectativas...

    ResponderEliminar
  6. @Marc Algunas matizaciones:

    Los datos "muy específicos" son, como dices, mayoritariamente "adhoc". No son estos los que nos ocupan. El debate está en los datos "en oferta", no "a demanda".

    Esta afirmación es discutible: "ofrecer xml o csv, (...)a mi juicio es pobre, hay que aspirar a más". Yo creo que hay que ofrecer lo que los reutilizadores demanden. A mí me dicen "Raw Data Now".

    En Adejetec pude ver como @saleiva liberaba datos interesantes (los de las bibliotecas de la Comunidad de Madrid) ¡a partir de un PDF!, ¡en 15 minutos!. Véase el resultado. ¿Merece la pena trabajar mucho, y gastar mucho dinero, en el modelo tecnológico de los datos? ¿No hay nadie ahí afuera, externo a la Administración, que tenga interés en hacerlo?

    Yo opino que nuestro negocio es liberar los datos públicos. Por encima de esa obligación, cualquier desarrollo costoso debe estar bien fundamentado.

    ResponderEliminar
  7. Creo que habéis comentado puntos clave que no deberíamos dejar pasar.

    1-Si imponemos un pago, la información dejará de ser libre e impedirá a muchos su disfrute/reutilización o incluso será una barrera para emprendedores o "early adopters".

    En vez de cobrar, creo que lo interesante sería la obligación de que la información derivada permaneciese abierta (al estilo de las licencias Creative Commons). La Administración no recibiría dinero, pero la sociedad recibiría nuevo conocimiento a cambio.

    -En este punto hablaríamos de sobreexplotación del servicio, pero no es un problema informático nuevo (cuotas, limitación conexiones...) y dependerá de la infraestructura disponible o incluso de la implantación de un sistema básico/premium(de pago).

    2-Esa liberalización de datos/servicios debe producirse mayoritariamente a medida que se revisan los flujos de información en la administración. Es decir, habrá algunos desarrollos adhoc que como comenta Alorta haya que realizar, pero lo "normal" sería un desarrollo reutilizable.

    3-Parte de los procesos liberados, repercutirían en disminución de carga de trabajo en otros departamentos/áreas. Recursos humanos/materiales disponibles ahora para potenciar otras áreas. Tratar de implicar esas fuerzas en el cambio será fundamental para minimizar costes.

    4-Lo más importante es que la liberación/exportación "en bruto" se realice en un formato reutilizable y actualizable. De esa manera otros grupos de interés pueden interconectar los distintos datasets. Respecto a esto... supongo que el estándar a utilizar dependerá del tipo de dato a liberar, pero aunque en los últimos años se ha avanzado bastante al respecto (xbrl para finanzas, vcard para contactos o lugares...) creo que el cumplimiento de un estándar puede relentizar demasiado la liberación (1ºliberar y 2º realizar conectores que estandaricen dichios datos).

    De hecho lo bueno de liberar es que la gente podrá adaptar la info. a sus necesidades.

    Muy interesante post y muchas gracias por vuestro trabajo. Sin duda será el cambio que marque los próximos años.

    ResponderEliminar
  8. Alberto,

    Des de luego, vosotros ya tenéis mucha experiencia, tenéis más conocimiento :)

    Yo hablo más desde la teoría, tú más desde la práctica.

    Efectivamente los infomediarios juegan un papel clave a la hora de conocer exactamente qué se necesita abrir (y con qué formato).

    No obstante, la "masa crítica" de infomediarios aún es pequeña y, no podía ser de otra manera, con poca experiencia.

    Dicho de otra forma, aún no está nada claro el camino a seguir.

    Sigo insistiendo que disponer de números (métricas) ayudaría a objetivar un poco más el tema.

    Por otro lado, y aunque sea de perogrullo, conviene recordar que, a menudo, la dificultad no está en abrir datos sinó en mantener estos datos abiertos con la periodicidad acordada.

    Además también hay otro elemento a debatir: la calidad de los datos que se abren.

    Supongo que os habrá pasado a vosotros... Tenemos datos que no tienen una óptima calidad pero que internamente esta baja calidad es asumida y "gestionada", sin embargo, si se cuelgan estos datos tienes la necesidad de ofrecer una calidad óptima, ello implica cambios, cambios que no siempre son fáciles de implementar.

    Resumiendo, me preocupa mucho la gestión de los datos, cómo se mantienen, cómo se refrescan, cómo se ofrecen con una óptima calidad...

    Acciones que usualmente se menosprecian.

    Insisto en que mi experiencia aún es escasa, quizá tú me puedes tranquilizar en base a vuestro caso...

    ResponderEliminar
  9. @Marc No sé si te tranquilizaré :-) Apuntas bien a dos condicionantes:

    (a) La actualización de los datos con la periodicidad acordada. Ahí tengo poco que decir: simplemente es algo que hay que hacer. Por eso hay que tratar de que sea lo más sencillo posible o, aún mejor, un proceso automático.

    (b) La calidad de los datos. Tenemos la obligación de aportar datos de calidad en la web. Si lo estás haciendo bien en la web, lo harás bien en Open Data. Luego el problema no está ahí: es anterior.

    ...y no te disculpes, que todos estamos aprendiendo :-)

    ResponderEliminar
  10. Alberto,

    ¿Me he disculpado?

    No era mi intención... ;-)

    Bromas aparte, como apuntas, un proceso de apertura de datos puede aflorar problemas subyacentes previos.

    Cada Administración es un mundo pero quién más quién menos tiene miserias de esta índole, no hay que menospreciarlas.

    Dicho de otra forma, me preocupan más los temas de gestión que los temas técnicos.

    ResponderEliminar
  11. Bruno,

    Entiendo tus opiniones pero, tal como apunta Andrés, con unas arcas públicas exhaustas no tengo nada claro que se cumpla lo que dices.

    En todo caso, se necesitarán métricas que "objetivizen" tus opiniones, que realmente demuestren que, por ejemplo, se reduce la carga en otros departamentos.

    No digo que no pueda ser cierto...

    Lo único que digo es que si no lo pasamos al ámbito de los números no conseguiremos convencer al dirigente/político que toque.

    ResponderEliminar
  12. Veo que se ha montado un debate considerable, lo cual era el objetvo buscado. Trataré de responder a puntos de todos, aunque ruego se disculpe que no responda a los muchos puntos abiertos.

    @alorza, no estoy taxativamente a favor ni en contra de cobrar por la información. Creo que el modelo de negocio aún está por determinar, pero que va a ser inevitablemente lo que centre la segunda fase. Como dice anonimo-Gorkin, cobrar no es gratis, y han de sopesarse los pros y los contras, de modo global de establecer tasas. Quiero resaltar no obstante por contradecir a anonimo-Gorkin, que tampoco me parece que cobrar sea un esfuerzo excesivo en el mundo electrónico, aunque como bien demuestra el debate de las descargas, lo que es imposible es el control de la piratería. Precios razonablemente bajos son la solución.

    Estoy de acuerdo con anonimo-Gorkin que liberar datos no supone un coste excesivo, siempre que los datos existan en formato electrónico, claro. Lo que es costoso es el proceso hasta llegar a ellos. Pongamos un ejemplo, la elaboración de datos por el INE. Permitir la reutilización gratuita supone asumir que el trabajo de encuestadores no lo vamos a repercutir sobre el reutilizador que haga negocio con los datos. ¿Es lo que quiere la Sociedad? Pues intuyo que para ciertas cosas si y para ciertas cosas no. No obstante y como bien dices, el establecimiento o no de precios ha de realizarse a la luz de todos los datos anteriores. Pero obviamente, es más fácil establecer una política de precios que compense el Data-As-A-Service desde un óptica global como plantea el modelo Británico que en un modelo atomizado.

    @mgartigap lo indica claramente, la excepción debe ser el pago, pero el pago no ha de ser establecido sólo para compensar el caso concreto, sino para compensar el caso global. No hay que olvidar además, que el retorno de la inversión de las AAPP no es meramente monetario.

    Discrepo de @alorza en que nuestro negocio sea liberar datos públicos. Nuestro negocio es dar soporte TIC a los procesos de la Administración (no quiero buscar la definición de egov de la Comisión, pero esa sería la definición de nuestro negocio). Es decir, mejorar el servicio de las AAPP mediante las TIC. Una parte de ese negocio es hacer disponible la información por medios electrónicos a ser posible de modo procesable, la decisión de hacerlo o no permitiendo una reutilización gratuita es una decisión que no es nuestro negocio. Probablemente, y con matices, todos los que participamos en este debate estamos por ello salvo excepciones, pero no es nuestro negocio determinarlo, sino proponerlo y en su caso ejecutarlo. Ello no quita para que, como indica Bruno Rico, tratemos que en el rediseño de procesos que acompaña al introducción de las TIC abramos la puerta lo más posible a que la información pueda estar disponible en formato procesable.

    Anomimo-Gorkin dice que fijar precios es crear barreras de entrada. Efectivamente, es algo con lo que ha de actuarse de modo cuidadoso para evitar este efecto. Pero para eso estamos aún en la primera fase del opendata, estamos en el gratis total que segun vayamos aprendiendo como indica @alorza ira afinándose (ver el ejemplo de algunos servicios Internet o de la televisión por satélite). Este es el momento en que se crean las condiciones para que florezcan las start-up, pero no es un modelo que necesariamente ha de perpeturase.

    Resumiendo, no necesariamente el gratis total será la tónica, si queremos facilitar muchos datos gratís habrá que facilitar alguno bajo pago y, finalmente, la sociedad y las circunstancias nos irán orientando hacia donde encaminarnos.

    En cualquier caso, es un debate que va a ser largo.

    ResponderEliminar
  13. @Andrés Buf, qué mal me he explicado.

    Cuando digo "nuestro negocio es liberar datos públicos" me refiero a que la Administración tiene entre sus funciones y capacidades la de la información pública, y no tanto la de montar virguerías tecnológicas por encima. No estaba hablando de la función TIC, sino de la Admon. en su conjunto. Y, desde luego, se puede hacer cobrando tasas o no cobrándolas.

    Mi punto es otro: todo el que haga un esfuerzo en tener una web rica, apenas tendrá que gastar para poder además liberar datos. Y tener una web rica es una obligación que todos vamos intentando cumplir. Como dice el banner en tu blog: public=online.

    Creo que las prioridades en opendata ahora son otras que la de establecer tasas:

    1.- Liberar muchos datos
    2.- Gestionar la actualización y calidad de los datos
    3.- Fomentar su uso en la sociedad

    ResponderEliminar
  14. "A la par de Dior, herbanos".

    Hablo no tanto como experto, pero sí como defensor a ultranza del opendata (y por ende del Open Government) como fórmulas de conseguir que la Administración y la Ciudadanía (ambas con mayúsculas) se relacionen entre sí más y mejor. Y no voy a entrar en asuntos técnicos (en los que, obviamente, ante vosotros) no puedo más que hacer que aprender.

    Hecha la introducción aclaratoria, desarrollo brevemente mi punto de vista. Por un lado tenemos, como comenta Marc en su post, que hay que hacer atractivo de una vez el asunto del opendata, atractivo para empresas que quieran invertir en ello, atractivo para las administraciones para que pueda suponer un cambio en su estructura organizativa y para la ciudadanía (personas jurídicas o físicas) ofreciendo servicios atractivos a través de esos datos.

    Que se deba cobrar por esos datos o no por parte de la Administración dependerá de muchos factores y, hasta el momento, ya los habéis apuntado todos: si han sido procesados ya, si son interesantes, la calidad y el formato de los mismos, etc.

    Yo creo que sí debería haber un cobro más o menos general para el acceso a los datos públicos, pero meramente simbólico, de tal manera que sirviera de barrera de entrada para que la reutilización de los datos redunde no sólo en beneficio de la ciudadanía sino también para que las aplicacions que se generen sean de utilidad.

    El todo gratis, Alberto, se valora poco ;-)

    ResponderEliminar
  15. @Mediotic Como ha apuntado Andrés, si pretendemos cobrar por los datos nos van a florecer los piratas. Ya es posible extraerlos del html de las webs con un poco de scraping, ¿vamos a cobrar por dejar que accedan al xml?

    Cobrar por los datos no es sensato (salvo, como se ha dicho, por la confección de información personalizada) en la mayor parte de los casos, porque tendríamos que añadir dos nuevas costosas tareas al proceso: cobrar y vigilar para que no se lleven gratis los datos. Una pesadilla.

    Creo que estamos desenfocando el debate. Habría que volver al post de Marc sobre los "openservices". Tal vez sea posible y deseable cobrar tasas por "openservices" de la Administración, donde se haya añadido una buena capa de valor sobre la mera capa de datos.

    Ese es otro debate, en el que supongo que algunos llevaríais la contraria al clásico "open data and the invisible hand".

    ResponderEliminar
  16. Leí este artículo y me encantó.
    ¿Por qué no compartir el conocimiento, ya sea científico, informático o jurídico?

    http://www.lavanguardia.es/lacontra/20110121/54103612286/esto-no-es-una-crisis-es-un-cambio-historico.html

    Tanto el desarrollo tecnológico como el acceso libre al conocimiento tienen un camino que ya es imparable. Habrá que articular mecanismos que hagan compatible esta situación con la creación de empleo.

    ResponderEliminar
  17. @alorza, una cuestion public=online pero ello no significa necesariamente free. Aunque insisto, cobrar o no cobrar es sólo una posibilidad, y modelos de cobro existen muchos. Por ejemplo, ¿porque no un modelo tipo spotify? El domingo en Público hablaba de un servicio de ese tipo para ebooks.

    ResponderEliminar
  18. @andrés El lema public=online no lo empleo para justificar la gratuidad, sino para eso de que "tener una web rica es una obligación".

    Supongo que ninguno os planteáis que cobremos por acceder al sitio web de la Administración. Pues bien, si esa web está bien hecha la derivada opendata es casi gratis. Se incurre en gastos cuando se hacen cosas raras que implican un doble procesamiento de la información: por una parte, para la web y, por otra, para opendata.

    Por eso, mi punto no es tanto si debe ser gratis o no, sino más bien que el modelo de opendata debe ser uno que proporcione los datasets de manera muy, muy económica. Conseguido eso, el debate de las tasas desaparece.

    ResponderEliminar
  19. Tch, me alargo aquí que Twitter da para lo que da ;-)

    Yo voy más en la línea de lo que comenta Andrés y que, creo, es lo que entiendo por "acceso a datos de pago". Como es obvio, si los datos se entregan sin tratar (sea el formato que sea, las cuestiones técnicas os las dejo a vosotros), los mismos han de estar disponibles.

    Pero determinados datos, sea por lo "sensible" (si es que hay algo verdaderamente sensible en la actuación de cualquier Administración) o porque hayan sido tratados por la Administración, deberían ofrecerse bajo pago de una tasa, ya que el desarrollo a la Administración le ha costado un dinero y es lógico que la empresa o particular que vaya a tratar esos datos (especialmente los ya procesados por la Administración) tenga que retornar parte de la inversión.

    No tanto por el hecho del "pirateo" de los datos, que entiendo perfectamente lo que dices, sino porque sería una fórmula tanto de estimular la innovación de las empresas (¿de qué manera puedo dar un valor añadido a los datos que me entrega la Administración ya tratados?) como de financiar el trabajo administrativo.

    Obviamente, y ya que el afán detrás de esta tasa no sería la mera recaudación sino el dar valor a la información que se presta, habría que definir qué datos deberían ser tratados y cuáles dejarse en bruto, con lo cual veríamos qué datos son los que pueden estimular la innovación de las empresas. Un ejemplo: las obras públicas. Dichos datos pueden ofrecerse en bruto (son objeto de publicación en los Boletines pertinentes) en el formato que sea, ya que es accesible, al igual que los concursos públicos como indicaba Marc en su post. Pero, por ejemplo, datos relativos al personal funcionarial, su titulación, asignación por departamentos, ya es información tratada por la Administración y que puede servir a empresas para fijar estrategias comerciales, con lo que cobrar una tasa (pequeña) para dar valor a esa información no me parece una opción tan descabellada.

    En cuanto al scraping, pues ya sabéis en qué Administraciones se usa: en aquéllas que son especialmente opacas y cuya única información es accesible a través de información "estática".

    Espero que se me entienda lo que quiero decir, que ando un poco espeso...

    ResponderEliminar
  20. La verdad es que estoy encantado de haber caído por aquí.

    Antes de nada (y por si no había quedado claro en el anterior comentario ;)) decir que mi visión es la de un ciudadano "normal" firme creyente de los beneficios del oGov, y trabajando en temas de analítica web.

    Creo que los KPIs no se deben alejar demasiado de lo que es el "mundo real", es decir, deberíamos ir por pasos, y atacando los problemas estructurales a los que nos enfrentamos y que son realmente medibles.

    Sé que con un ejemplo puedo "ensuciar" todo el debate, pero por favor obviarlo en caso de que sea una tontería y quedaros con la idea.

    A estas alturas, no es lógico que la gente se esté registrando en infojobs... es decir, por muy bien que esté funcionando el sistema de empleo nacional, está claro que los ciudadanos no lo ven de la misma manera y que echan en falta algo más.

    A lo que iba, los KPIs en ese servicio (API web libre de obtención de candidatos, por ej.) serán diferentes a un Webservice que nos devuelva la localización de los autobuses, o la consulta de los últimos préstamos de mi biblioteca...

    Supongo que a la hora de establecer políticas de precios, hay que analizar las peticiones de los usuarios, y los que realmente sabéis "qué hay por debajo" tenéis la opinión formada de qué es posible y que no.

    Siguiendo el ejemplo del empleo, al ser un servicio estratégico, no cobraríamos el uso del API, pero a lo mejor el de consulta de libros de la biblioteca, se puede sufragar subiendo la cuota de préstamo/alta.

    Consulta de mi expediente médico, pues al ciudadano no se lo cobramos, pero el accesso a un API con los datos estadísticos tendrá el modo de pago(Farmacéuticas y empresas) y modo gratuito(Universidades y centros de investigación concertados).

    Estos costes tan brutales como podrían ser el "NationalInfojobs" y el "SaludStats" tendrán KPIs muy diferentes: 1 fácilmente contable(disminución o consecución de objetivos desempleo) y el segundo de una manera más indirecta (avances médicos, disminución consultas).

    Además, para controlar si una iniciativa funciona o no, siempre tendríamos la analítica web y técnicas básicas de Marketing Online:
    -Visitas, páginas vistas, consultas, llamadas
    -Funnels de conversión
    -Comentarios o consultas resueltas a través de los servicios...
    -...

    Dependerá de qué se quiera liberar... pero creo que la visión es ir paso a paso y plantear los servicios en relación de cliente/proveedor

    ResponderEliminar
  21. Al releer mi comentario, veo que realmente me centré en la capa externa(lo que vería el ciudadano) y esa no era mi intención, me refería a la estructura subyacente...a los servicios web que comentaba Alorza... es decir la información+openservices(cuando los haya).

    Luego, que cada cual lo use como quiera...

    ResponderEliminar
  22. Por cierto José, en mi Ayuntamiento(A Coruña), dos ciudadanos hicieron una app para Android y otra para iphone mediante scrapping/parseo de la web del ayuntamiento...

    Justo antes de que la compañía sacara otra(por lo que cuentan peor) y publicaran un servicio de sms de pago, pusieron barreras en la web para impedir la toma de datos... por suerte las eliminaron(tras el revuelo) +info http://cuandosecomeaqui.com.es/2011/01/20/144/

    ResponderEliminar
  23. @mediotic No te me líes. La Administración puede cobrar tasas sólo para recuperar el coste ocasionado por la prestación de un servicio, en ciertos casos. El hecho de los datos públicos puedan ser de provecho económico para un tercero no es motivo para cobrar tasas.

    La Ley 37/2007 de reutilización de la información del sector público establece la posibilidad de que los datos públicos se usen como materia prima para generar nuevos servicios que generen beneficios a empresas. De hecho, es lo mejor que puede pasar, ya que los datos deben servir para generar riqueza, la cual revierte en toda la sociedad.

    Ahora mismo ese es nuestro reto: que los datos sean usados y generen riqueza. Y está costando conseguirlo. Todavía son pocas las reutilizaciones. Si ponemos una tasa, vamos a encontrarnos con que nadie usa los datos, y que la Administración no ingresa un euro. Y eso, después de habilitar un sistema en el que haya que identificarte y pagar para obtener los datos, sistema mucho más caro de montar que el simple método de dejarlos para su descarga, con una licencia abierta.

    @Bruno ¿No estás mezclando datos con servicios? Por ejemplo, la consulta de un expediente médico jamás será un dato público, por motivos obvios de protección de datos personales.

    ResponderEliminar
  24. Sí, sí, mezclé ambas cosas de una manera semi-intencionada ;)

    Todos sabemos(o nos hacemos a la idea) lo complicado que es hacer datamining manual sobre Bases de Datos para luego realizar cruces que transformen y doten de valor esos datos...

    Hay que evitar que una persona pierda todos los meses una semana enfrascado en excels y exportando consultas para sacar un informe y luego colgar el excel.

    Que pierda dos semanas en diseñar lo que necesita y que luego se implante la exportación automática. [*sé que el mundo no es de color de rosa, pero hablo de la línea de actuación, que sé que difiere de la realidad/recursos disponibles...]

    A lo que me refería es que los datos que se liberen primero, deberían ser los más explotables.

    Respecto a la LOPD, y en el caso de los datos médicos, remarcaba lo del acceso estadístico para empresas(y anonimizado), ya que quedan fuera de la relación médico-paciente

    Alorza, me ha sorprendido lo que comentabas de que no se puede sacar beneficio de la explotación de los datos (no lo sabía y por otra parte tiene su lógica...)

    ResponderEliminar
  25. Don Alberto, léase ud. bien este párrafo que cito de mi anterior comentario:


    "Pero determinados datos, sea por lo "sensible" (si es que hay algo verdaderamente sensible en la actuación de cualquier Administración) o porque hayan sido tratados por la Administración, deberían ofrecerse bajo pago de una tasa, ya que el desarrollo a la Administración le ha costado un dinero y es lógico que la empresa o particular que vaya a tratar esos datos (especialmente los ya procesados por la Administración) tenga que retornar parte de la inversión."

    Esa inversión de la Administración que comento es precisamente el coste ocasionado por la prestación del servicio por parte de ésta ;-)

    Vamos, que estamos de acuerdo, aunque no lo quieras reconocer ;-)

    ResponderEliminar
  26. @mediotic No, tío, no estamos de acuerdo en esto y además me parece importante dejar claro ese punto, porque la evolución de la apertura de datos se vería comprometida con medidas de ese tipo.

    Con todo respeto afirmo que no necesitamos cobrar tasas por los datos (dejando de lado la confección de informes adhoc a que se ha hecho referencia en algún momento) si hacemos unas web bien hechas. Y cobrar es un trabajo añadido para la Administración, una barrera para la reutilización, una inutilidad en el entorno de internet donde los bits son libres, además de un potencial motivo de conflicto no deseado.

    Y, por otra parte, abre una deriva peligrosa. ¿Por qué cobrar tasas por datos y no, por ejemplo, por pedir cita al médico por teléfono? Es más caro instalar un sistema de cita que una plataforma de datos abiertos.

    Y, si vas a perseverar en tu argumento, creo que deberías poner ejemplos. ¿A qué le pondrías tasas, por qué y qué beneficio crees que se obtendría?

    ResponderEliminar
  27. Buf!, estoy unas horas sin pasar por aquí y me encuentro el patio revuelto :)

    Creo yo que el tema se reduce a: ¿es conveniente instaurar unas tasas (para el uso de los datos abiertos) para conseguir que dicho servicio de apertura tenga más futuro, más datos?

    La pregunta es perversa :(

    Sigo pensando que la excepción debe ser el pago.

    Aunque la realidad (como mínimo la que conozco yo) difiere de la que comenta Alberto:

    - Efectivamente si tienes una web "en condiciones" pasar los datos a OpenData será sencillo.

    Pero es que la realidad es que la mayoría de webs no estan "en condiciones", muchas son herederas de viejas tecnologías o (desgraciadamente) de presiones, prisas que provocan que visualmente estén bién pero que realmente no estén "en condiciones" (ya me entendéis :)

    - Hay otra cuestión que no se ha hablado aún aquí.

    ¿Cómo convences a un departamento para que abra (gratuitamente) datos que a día de hoy cobra por ellos?

    Es cierto que no es lo más usual, pero también es cierto que existe.


    - Alberto propone la siguiente hoja de ruta:

    1.- Liberar muchos datos
    2.- Gestionar la actualización y calidad de los datos
    3.- Fomentar su uso en la sociedad

    Yo propongo la siguiente:

    1.- Liberar muchos datos
    1.- Gestionar la actualización y calidad de los datos
    1.- Fomentar su uso en la sociedad
    1.- Pedagogía interna para que la Administración empieze a "trabajar en clave OpenData".

    Fijaros que todos estos puntos tienen el mismo número dado que creo que deben realizarse todos los puntos a la vez.

    Por otro lado, cuando hablo de "trabajar en clave OpenData" me refiero a que la apertura de datos forme parte del día a día de la Administración, que no sea un añadido al final de los procesos.

    Un ejemplo podría ser todos los datos relacionados con la limpieza de una ciudad.

    Cuando se redacte el nuevo (mega)contrato de limpieza se debería incluir un apartado específico que obligue al adjudicatario a colgar datos en el portal OpenData.

    Es una forma de traspasar el coste a un proveedor y de "diluir" dicho coste en otras partidas tan importantes que éste se obvia.

    Para mi esta es la cuestión: estamos debatiendo si aplicar tasas o no en los datos abiertos simplemente pq. los estamos abriendo ahora.

    Cuando haya un número considerable de datos abiertos, su uso sea importante (o sea, se haya demostrado que hay un retorno social) y la reorganización interna de procesos sea una realidad ya no habrá debate.

    ¿No lo veis así?

    ResponderEliminar
  28. @Marc Acuerdos y desacordes :-)

    Veo que coincidimos en que "si tienes una web "en condiciones" pasar los datos a OpenData será sencillo". Corolario: si tienes la web mal, tienes que arreglarla, no sólo porque así podrás ofrecer opendata fácilmente, sino ¡porque la tienes mal!

    En cuanto al caso de quien ya está cobrando tasas, suele ser peliagudo... y muy infrecuente. Quizá no hay que prestarle mucha atención por el momento, y más bien centrarse en que ofrezca esos datos bajo una licencia adecuadamente abierta, aunque cobre tasas.

    Añades a la hoja de ruta la "pedagogía interna". Por supuesto, es importante. Más importante aún, es obtener suficiente liderazgo para el proyecto. Si el liderazgo procede de lo bastante arriba, muchos de los problemas planteados desaparecen.

    Muy de acuerdo con lo de "trabajar en clave OpenData". Nuevamente, la clave es la política de transparencia que se siga en la web. Yo propongo esta idea: toda información que no tenga una fuerte restricción legal en contra debe ser hecha pública, en la web de la Administración. La intranet debe contener lo mínimo y la web en internet lo máximo.

    Y, una vez más, si ya lo tienes en la web, con poquita cosa lo liberas como dato abierto...

    ResponderEliminar
  29. Se mezclan muchas cosas; la pasión/ilusión por la apertura, los movimientos de formatos de intercambio, el impacto en términos de comunicación y política y hasta algún alarido desviado que mezcla Open Source con Open Data y el resultado genera confusión, proyectos desviados, acciones politizadas y un eventual vacío al sentido que llega a producir opiniones como:

    "a lo mejor hay que cobrar por esto porque hay que mantenerlo".

    ¿Qué es "esto"? ¿Quién lo ha pedido? ¿Qué hace que sea útil?

    Os dejo una anécdota curiosa:

    Estaba en la CNMV y al ver los servicios web que facilitan para actualizar en tiempo real los datos de valores en bolsa, alertas notificaciones, tipos de acciones, etc, etc. Les comenté que era un ejemplo impresionante de Open Data y me respondieron que no sabían lo que era eso, solamente habían tenido que ir cediendo a continuas solicitudes por multitud de empresas, fondos de inversión, bancos y agencias de noticias e información financiera.

    ;)

    ResponderEliminar
  30. Alberto,

    No es tan fácil definir cuándo una web está mal o no, depende del punto de vista de quién tiene qeu asumir el coste de su eventual "reparación".

    Cuando trabajas en una web con 16 años de historia nada es fácil.

    Evidentemente ello no implica que no se deban "arreglar" las webs, ni tampoco estoy diciendo que todo sea un caos.

    Simplemente digo que la situación que planteas no siempre es fácil de conseguir, (como minimo ésta es mi experiencia).

    Comparto tu objetivo de "toda información que no tenga una fuerte restricción legal en contra debe ser hecha pública, en la web de la Administración".

    Yo añadaría la coletilla "priorizando aquella información que más uso social se prevee".

    Dicho de otra forma, hay que indicar una cierta priorización (la que sea) y, sobretodo, con sentido común teniendo en cuenta (otra vez) que los presupuestos no son muy holgados.

    ResponderEliminar
  31. Al final estamos mezclando cosas, y probablemente sean por errores mios en el arranque del debate:
    - Publicidad de la información generada por sector público: Toda información del sector público (de acceso no limitado por ley) debería estar pública y accesible por medios electrónicos de modo gratuito
    - Reutilización de la información del sector público: La reutilización debería ser autorizada por defecto. El establecer tasas a la reutilización es lo que es potestativo de cada organismo, y dependerá de si él mismo quiere o no recuperar costes y en que medida.

    Sobre esa reutilización (pagada o gratuita) es sobre la que montan su negocio los infomediarios. Aunque reitero mi escepticismo por el nuevo modelo UK hasta que sepamos en que se traduce, si es posible que un modelo centralizado de gestión de la info pública, con tasas de reutilización de lo valioso y sin tasas en lo restante, pueda redundar en una sostenibilidad del opendata y en una mayor publicación de datos (+ transparencia).

    ResponderEliminar
  32. Solo matizar que al decir Servicios Web me refería a Servicios API en origen para inter-actuar con automatismos mediante formatos autoprocesables (XML)

    ResponderEliminar