Esta entrada del blog forma parte de una serie que analiza la Internet de interés público, es decir, las partes de Internet que no acaparan los titulares de Facebook o Google, pero que proporcionan silenciosamente bienes públicos y servicios útiles sin requerir la escala o las prácticas comerciales de los gigantes tecnológicos. Dale una mirada a nuestras anteriores entregas.

La última vez vimos cómo gran parte de los primeros contenidos de Internet fueron creados por sus usuarios y posteriormente adquiridos por empresas tecnológicas. Al capturar y monopolizar estos primeros datos, estas empresas pudieron monetizar y escalar este trabajo más rápidamente que la red de voluntarios que lo creó por primera vez para su uso por todo el mundo. Es un patrón que ha sucedido muchas veces en la historia de la red: llámalo el cercado de los bienes comunes digitales. A pesar de esta historia familiar, la antigua Internet de interés público ha seguido sobreviviendo al lado de los gigantes tecnológicos que engendró: poco probable y poco dispuesto a atraer los grandes dólares de inversión que podrían conducir a un crecimiento acelerado, pero también lo suficientemente resistente como para persistir en su propio ecosistema. Algunos de estos proyectos son conocidos: Wikipedia o el proyecto de software libre GNU, por ejemplo. Otros, por ocupar nichos más pequeños y no ser visibles para el usuario medio de Internet, son menos conocidos. La Internet de interés público llena los espacios entre los gigantes de la tecnología como si fuera materia oscura, manteniendo invisible todo el universo digital.

A veces, la historia del paso de un proyecto al modelo comercial es más conocida que su permanencia en el espacio de interés público. El ejemplo más notorio de nuestra tercera entrada fue la comercialización de la base de datos de CDs (CDDB) de creación pública: cuando una rama comercial de esta base de datos libre, creada por los usuarios, Gracenote, bloqueó el acceso, bifurcaciones como freedb y gnudb siguieron ofreciendo el servicio de forma gratuita a su público de usuarios de CDs participantes.

El cofundador de Gracenote, Steve Scherf, afirmó que, sin inversión comercial, las alternativas libres de CDDB estaban condenadas al "estancamiento". Aunque alternativas como gnudb han sobrevivido, es difícil argumentar que freedb o gnudb hayan innovado más allá de su objetivo original de proporcionar y recopilar listados de pistas de CD. Por otra parte, eso es exactamente lo que se propusieron hacer, y lo han hecho admirablemente durante décadas.

Pero, ¿se puede innovar y crecer dentro de la Internet de interés público? La comercialización de CDDB ha llevado a su mercado inicial a una serie de ofertas basadas en la música. El desarrollo de estos productos les llevó a ser comprados, en varios momentos, por el fabricante de AV Escient, Sony, Tribune Media y, más recientemente, Nielsen. Cada venta hizo ganar dinero a sus inversores. ¿Puede una alternativa gratuita aprovechar también sus inicios, en lugar de limitarse a preservarlos para sus usuarios originales?

MusicBrainz, una alternativa comunitaria a Gracenote

Entre los usuarios de CDDB que se vieron sorprendidos por su cambio a un sistema cerrado en los años 90, estaba Robert Kaye. Kaye era un amante de la música y, en ese momento, un codificador que trabajaba en uno de los primeros codificadores y reproductores de MP3 en Xing. Ahora él y un pequeño equipo trabajan a tiempo completo en MusicBrainz, una alternativa a Gracenote impulsada por la comunidad. (Revelación: Cory Doctorow, asesor especial de la EFF, forma parte del consejo de MetaBrainz, la organización sin ánimo de lucro que supervisa MusicBrainz).

"Utilizábamos CDDB en nuestro servicio", me dijo desde su casa en Barcelona. "Entonces, un día, recibimos un aviso que decía que debían mostrar nuestro logotipo [de Escient, el primer propietario comercial de CDDB] cuando se buscaba un CD. Esto perjudicaba inmediatamente a los usuarios ciegos que utilizaban una interfaz de texto de otro reproductor de CD de código abierto que no podía cumplir con el requisito. Y me cabreó porque había introducido un centenar de CD en esa base de datos... así que ese fue mi impulso para iniciar CD Index, que fue el precursor de MusicBrainz".

Más de dos décadas después de la rebelión de los usuarios que la crearon, MusicBrainz sigue avanzando

Desde entonces, MusicBrainz sigue ofreciendo una base de datos de metadatos de CD compatible con la CDDB, de uso gratuito para cualquiera. La mayor parte de los datos aportados por los usuarios son de dominio público, y los datos complementarios -como las etiquetas adicionales añadidas por los voluntarios- se ofrecen bajo una licencia de atribución no comercial.

Con el paso del tiempo, MusicBrainz se ha expandido creando otras bases de datos musicales de uso gratuito y a disposición del público, a menudo como alternativa para cuando otros proyectos se comercializan y cierran. Por ejemplo, Audioscrobbler era un sistema independiente que recogía información sobre la música que has escuchado (sin importar en qué plataforma lo hayas hecho), para aprender y ofrecer recomendaciones basadas en las aportaciones de sus usuarios, pero bajo tu control. Se fusionó con Last.fm, un primer servicio de streaming similar a Spotify, que luego se vendió a CBS. Cuando la CBS pareció descuidar a la comunidad "scrobbling", MusicBrainz creó ListenBrainz, que volvió a implementar funciones que se habían perdido con el tiempo. El plan, dice Kaye, es crear un sistema de recomendación igualmente independiente.

Mientras que los nuevos gigantes de la música en Internet -Spotify, Apple Music, Amazon- han estado construyendo modelos cerrados de aprendizaje automático para la minería de datos de sus usuarios y sus intereses musicales, MusicBrainz ha estado trabajando en abierto con la Universidad Pompeu Fabra de Barcelona para derivar nuevos metadatos de las contribuciones de las comunidades de MusicBrainz. Las deducciones automáticas de género, estado de ánimo, pulsaciones por minuto y otra información se añaden a la base de datos de AcousticBrainz para que todo el mundo pueda utilizarlas. Estos algoritmos aprenden de las correcciones de sus colaboradores, y las correcciones que aportan se añaden a la mancomunidad de datos públicos para que todo el mundo pueda beneficiarse de ellos.

Las aspiraciones de MusicBrainz suenan en sincronía con las primeras esperanzas de Internet y, después de veinte años, parecen haber demostrado que Internet puede apoyar y expandir un bien público a largo plazo, en contraposición a un modelo de crecimiento propietario e impulsado por el capital de riesgo. Pero, ¿qué impide que la organización siga el mismo camino que esos otros proyectos con sus elevados objetivos? Kaye trabaja a tiempo completo en MusicBrainz junto con otros ocho empleados: ¿qué puede decir que no se están beneficiando exclusivamente de la comunidad no remunerada de la misma manera que empresas más grandes como Google se benefician de las contribuciones de sus usuarios?

MusicBrainz cuenta con algunas protecciones institucionales a la antigua usanza, anteriores a Internet. Se gestiona como una organización sin ánimo de lucro 501(c), la Fundación MetaBrainz, que impone algunas limitaciones teóricas a la hora de comprarla. Otro viejo valor de Internet es la transparencia radical, y la organización la tiene a raudales. Todas sus transacciones financieras, desde las hojas de pérdidas y ganancias hasta los costes de empleo, pasando por los gastos de los servidores y las notas de las reuniones de la junta directiva, se publican en línea.

Otro factor, dice Kaye, es mantener una clara delimitación entre el trabajo realizado por el personal remunerado de MusicBrainz y el trabajo de la comunidad de voluntarios de MusicBrainz. "Mi equipo debe trabajar en las cosas que no son divertidas. Los voluntarios trabajan en las cosas divertidas", dice. Cuando se gestiona un gran servicio web basado en las contribuciones de una comunidad, no faltan voluntarios para proyectos interesantes, pero, como señala Kaye, "hay muchísimas cosas que simplemente no son divertidas, ¿verdad? Nuestro equipo se centra en hacer estas cosas". Ayuda que MetaBrainz, la fundación, contrate casi exclusivamente a miembros de la comunidad de MusicBrainz de larga duración.

Quizá la mayor defensa de MusicBrainz contra su propio declive sean las licencias de software (y de datos) que utiliza para sus bases de datos y servicios. En caso de que la organización se separe de los deseos de su comunidad, toda su composición y producción -sus activos digitales, la historia institucional- están dispuestos para que la comunidad pueda clonar su estructura y crear otra institución casi idéntica más cercana a sus necesidades. El código es de código abierto; los datos son de uso libre; la transparencia radical de las estructuras financieras significa que la propia organización puede reconstruirse desde cero si es necesario.

Estas bifurcaciones son dolorosas. Cualquiera que haya visto recientemente al personal voluntario y a la comunidad de Freenode, la red distribuida de Internet Relay Chat (IRC), separarse del propietario de la red y empezar de nuevo en Libera.chat, lo habrá comprobado. Las bifurcaciones pueden dividir a una comunidad, y pueden ser devastadoras para la reputación de aquellos que son abandonados por la comunidad que decían liderar y representar. El sustento del personal de MusicBrainz depende de sus usuarios de una manera que ni siquiera la corporación más comercialmente sensible lo hace.

Es poco probable que una empresa ponga su viabilidad futura tan directamente en manos de sus usuarios. Pero es esta espada de Damocles autoimpuesta que pende sobre la cabeza de Rob Kaye y su personal lo que alimenta la confianza de las comunidades en sus intenciones.

¿De dónde viene el dinero?

Sin embargo, las licencias abiertas también pueden dificultar que los proyectos consigan financiación para persistir. ¿De dónde sale el dinero de MusicBrainz? Si cualquiera puede utilizar su base de datos de forma gratuita, ¿por qué no lo hacen todas sus posibles fuentes de ingresos, aprovechándose de la comunidad sin devolver el dinero? ¿Por qué una empresa comercial no reproduce lo que hace MusicBrainz, utilizando los mismos recursos que utilizaría una comunidad para bifurcar el proyecto?

Las finanzas abiertas de MusicBrainz muestran que, a pesar de esas generosas licencias, les va bien. La transparencia del proyecto nos permite ver que obtuvo unos ingresos de 400.000 dólares en 2020, y que tuvo 400.000 dólares de gastos (experimentó una ligera pérdida, pero otros años ha sido lo suficientemente rentable como para que esto sea un pequeño bache). Los ingresos proceden de una combinación de pequeños donantes y grandes patrocinadores, incluidos gigantes como Google, que utilizan los datos de MusicBrainz y pagan un contrato de apoyo.

Dado que esos patrocinadores podrían aprovecharse, ¿cómo consigue Kaye que paguen? Tiene algunas estrategias poco ortodoxas (la más famosa, enviar una tarta a Amazon para que pague una factura de hace tres años), pero la razón más común parece ser que un mantenedor de bases de datos abiertas que responde a una comunidad más amplia es también más fácil para los intereses comerciales, tanto técnica como contractualmente. Los tecnólogos que crean una herramienta o un servicio musical recurren a MusicBrainz por la misma razón por la que podrían elegir un proyecto de código abierto: es más fácil incorporarlo a su sistema sin tener que pasar por el aro de la autenticación o iniciar negociaciones con un equipo de ventas. Luego, cuando se forma una empresa en torno a ese hack inicial, sus ejecutivos acaban dándose cuenta de que ahora tienen una dependencia real de un proyecto con el que no tienen ninguna relación contractual o financiera. Un contrato de soporte significa que tienen a alguien a quien llamar si se cae; una relación financiera significa que es menos probable que desaparezca mañana.

Si Sony hubiera utilizado los datos de MusicBrainz, habría podido seguir adelante a pesar de todo

Una vez más, las alternativas comerciales pueden hacer la misma oferta, pero mientras que una organización de interés público sin ánimo de lucro como MusicBrainz podría desaparecer si falla a su comunidad, o simplemente se queda sin dinero, esas otras empresas privadas pueden tener otras razones para abandonar sus compromisos con sus clientes. Cuando Sony compró Gracenote, presumiblemente fue en parte para poder dar soporte a sus productos que utilizaban las bases de datos de Gracenote. Después de que Sony vendiera Gracenote, terminaron por poner fin a su propio uso de las bases de datos. Sony anunció a sus valiosos clientes en 2019 que los productos Blu-Ray y Home Theater de Sony ya no tendrían funciones de reconocimiento de CD y DVD. Lo mismo ocurrió con la aplicación móvil Music de Sony en 2020, que dejó de ser capaz de reconocer CDs cuando se cortó el servicio de Gracenote. No podemos conocer estos acuerdos comerciales cerrados, pero podemos suponer que Sony y el nuevo propietario de Gracenote no pudieron llegar a un acuerdo amistoso.

En cambio, si Sony hubiera utilizado los datos de MusicBrainz, habría podido seguir adelante a pesar de todo. Tendrían la seguridad de que ningún competidor les compraría MusicBrainz o bloquearía sus productos sin una función anunciada. E incluso si MusicBrainz, la organización sin ánimo de lucro, muriera, habría muchas más posibilidades de que surgiera de las cenizas una alternativa compatible con la API. Si fuera tan importante, Sony podría haber apoyado a la comunidad directamente. Así las cosas, Sony pagó 260 millones de dólares por Gracenote. Para sus servicios de CD, al menos, podrían haber tenido un acuerdo de servicio más estable con MusicBrainz por 1500 dólares al mes.

Más de dos décadas después de la rebelión de los usuarios que la crearon, MusicBrainz sigue funcionando. Su personal está formado por aficionados a la música de todo el mundo y se reúne cada año en una conferencia pagada por la Fundación MusicBrainz. Sus colaboradores saben que siempre pueden confiar en que sus datos seguirán siendo gratuitos; sus clientes de pago saben que siempre pueden confiar en que sus datos se podrán utilizar en sus productos. El personal de MusicBrainz puede estar seguro de que no será comprado por las grandes empresas tecnológicas, y puede ver el presupuesto con el que tiene que trabajar.

No es perfecto. Una organización transparente sin ánimo de lucro que aspira a los valores de Internet puede tener tantos fallos como cualquier otra. Por ejemplo, MusicBrainz sufrió un golpe a su reputación el año pasado cuando se filtraron datos personales de su sitio web. Pero al seguir existiendo, incluso con esos errores, y a pesar de las múltiples recesiones económicas, demuestra que una organización sin ánimo de lucro, dedicada al interés público, puede prosperar sin estancarse, ni vender a sus usuarios.

Pero, pero, pero. Aunque es bueno saber que los servicios de interés público tienen éxito en territorios nicho como el reconocimiento de la música, ¿qué pasa con las partes del mundo digital que realmente parecen necesitar una alternativa más democrática y descentralizada, y que sin embargo carecen notoriamente de ella? Sitios como Facebook, Twitter y Google no sólo han construido sus imperios a partir de los datos de otros, sino que han encerrado a sus clientes, aparentemente sin escapatoria. ¿Podría ser posible una red social alternativa de interés público? ¿Y qué aspecto tendría?

Los trataremos en una parte posterior de nuestra serie. (Para ver un adelanto, consulte los debates grabados en "Reimagining the Internet", de nuestros amigos del Knight First Amendment Institute de la Universidad de Columbia y de la Initiative on Digital Public Infrastructure de la Universidad de Massachusetts, Amherst, que exploran en profundidad muchos de los temas que hemos tratado aquí).

Este es el cuarto artículo de nuestra serie de blogs sobre Internet de interés público. Lea más en la serie: