As¨ª funcionan los algoritmos que ordenan la informaci¨®n en internet
Ninguna educaci¨®n moderna est¨¢ completa sin entender c¨®mo los algoritmos de los sitios web combinan, procesan y sintetizan la informaci¨®n antes de present¨¢rnosla
Cuando buscamos informaci¨®n en Google, cuando comparamos diferentes objetos en Amazon o cuando nos tomamos un descanso para ver una pel¨ªcula o una serie usamos lo que podr¨ªamos llamar los tres principios b¨¢sicos de la ¨¦poca de Internet: puntuar, clasificar y recomendar.
Al igual que los tres principios b¨¢sicos tradicionales de la educaci¨®n ¨C leer, escribir y contar¨C ninguna educaci¨®n moderna es completa sin entender c¨®mo los algoritmos de los sitios web combinan, procesan y sintetizan la informaci¨®n antes de present¨¢rnosla.
Las tres tareas, puntuar, clasificar y recomendar, son interdependientes, aunque al principio puede que no resulte evidente
Como analizamos en nuestro nuevo libro, The Power of Networks: Six Principles that Connect Our Lives [El poder de las redes: seis principios que conectan nuestras vidas], las tres tareas, puntuar, clasificar y recomendar, son interdependientes, aunque al principio puede que no resulte evidente. Antes de poder clasificar una serie de objetos, necesitamos alg¨²n tipo de medida para ordenarlos, que es una puntuaci¨®n de la calidad de cada objeto seg¨²n alg¨²n criterio.
Cuando disponemos de listas con una clasificaci¨®n, podemos cambiar de opini¨®n y hacer recomendaciones sobre objetos concretos a la gente que puede estar interesada en adquirirlos. Esta interrelaci¨®n pone de manifiesto la importancia de la manera en que la calidad y el atractivo de un objeto se cuantifican en primer lugar con una puntuaci¨®n.
Puntuar
Lo que los consumidores y los usuarios de Internet llaman a menudo ¡°puntuar¡±, las empresas tecnol¨®gicas lo pueden llamar scoring [poner una nota]. Esto es fundamental, por ejemplo, en la manera en que el motor de b¨²squeda de Google sit¨²a los enlaces de alta calidad en los primeros resultados de sus b¨²squedas, en las que normalmente la informaci¨®n m¨¢s relevante aparece en la primera p¨¢gina de las respuestas. Cuando una persona realiza una b¨²squeda, Google asigna dos notas principales a cada p¨¢gina en su base de datos de billones de p¨¢ginas web y las usa para ordenar sus resultados.
Cuando una persona realiza una b¨²squeda, Google asigna dos notas principales a cada p¨¢gina
La primera de estas notas es una ¡°nota sobre la relevancia¡±, una combinaci¨®n de m¨²ltiples factores que miden lo relacionados que est¨¢n la p¨¢gina y su contenido con la b¨²squeda. Por ejemplo, tiene en cuenta si el lugar que ocupan las palabras clave de la b¨²squeda en la p¨¢gina de resultados es un lugar m¨¢s o menos destacado. La segunda es una ¡°nota sobre la importancia¡±, que refleja la manera en que la red de p¨¢ginas web est¨¢ conectada entre s¨ª mediante hiperv¨ªnculos para determinar la importancia de cada p¨¢gina.
La combinaci¨®n de estas dos notas, junto a otra informaci¨®n, otorga una puntuaci¨®n a cada p¨¢gina, y as¨ª se determina lo ¨²til que podr¨ªa resultarle al usuario final. Las puntuaciones m¨¢s elevadas aparecer¨¢n entre los primeros resultados de la b¨²squeda. Estas son las p¨¢ginas que Google recomienda impl¨ªcitamente al usuario que visite.
Clasificar
Los tres principios b¨¢sicos tambi¨¦n existen en el comercio minorista en Internet. Amazon y otros sitios de comercio electr¨®nico permiten que los clientes escriban comentarios sobre los productos que han adquirido. Las puntuaciones con estrellas que aparecen en estos comentarios normalmente se suman y se convierten en una sola cifra que representa la opini¨®n generalizada de los clientes. El principio en el que se basa esto se llama ¡°la sabidur¨ªa de las masas¡±, seg¨²n el cual se presupone que la combinaci¨®n de muchas opiniones independientes reflejar¨¢ m¨¢s la realidad que cualquier evaluaci¨®n individual.
El principio fundamental de la sabidur¨ªa de las masas es que los comentarios reflejan de forma precisa las experiencias de los clientes y no est¨¢n sesgados o influidos por, digamos, el hecho de que el fabricante a?ada una serie de evaluaciones positivas a sus propios productos. Amazon dispone de mecanismos para eliminar este tipo de comentarios, por ejemplo, exigiendo que la compra se haya hecho desde una determinada cuenta antes de poder escribir un comentario. Luego, Amazon calcula la media de las puntuaciones con estrellas de los comentarios que quedan.
Las puntuaciones con estrellas se suman y se convierten en una sola cifra que representa la opini¨®n generalizada de los clientes
Calcular la media de las puntuaciones es bastante sencillo, pero es m¨¢s complicado saber c¨®mo clasificar de forma eficaz los productos en funci¨®n de esas puntuaciones. Por ejemplo, ?es mejor un producto que tiene 4 estrellas seg¨²n 200 comentarios que uno que tiene 4,5 estrellas pero con solo 20 comentarios? Hay que tener en cuenta en la nota de la clasificaci¨®n tanto la puntuaci¨®n media como el tama?o de la muestra.
Existen todav¨ªa m¨¢s factores que hay que tener en cuenta, como la reputaci¨®n del que hace el comentario (se puede confiar m¨¢s en las puntuaciones basadas en comentarios de personas con mejor reputaci¨®n) y la disparidad de las puntuaciones (a la hora de ordenar los productos se puede rebajar la categor¨ªa de los que tienen unas puntuaciones que var¨ªan mucho). Amazon tambi¨¦n puede presentar productos a diferentes usuarios en un orden distinto seg¨²n su historial de navegaci¨®n y los registros de compras anteriores en el sitio web.
Recomendar
El ejemplo perfecto de un sistema de recomendaci¨®n es el m¨¦todo de Netflix para determinar qu¨¦ pel¨ªculas le gustar¨¢n a un usuario. Los algoritmos predicen qu¨¦ nota le pondr¨ªa cada usuario concreto a diferentes pel¨ªculas que todav¨ªa no ha visto analizando su historial anterior de puntuaciones y compar¨¢ndolas con las de unos usuarios parecidos. Las pel¨ªculas con m¨¢s probabilidades de gustarle a un usuario concreto son las que finalmente se le ofrecer¨¢n.
La calidad de estas recomendaciones depende mucho de la precisi¨®n del algoritmo y de su uso del aprendizaje autom¨¢tico, de la extracci¨®n de datos y de los propios datos. Cu¨¢ntas m¨¢s puntuaciones tengamos de cada usuario y de cada pel¨ªcula, mejores ser¨¢n las predicciones.
La calidad de estas recomendaciones depende mucho de la precisi¨®n del algoritmo y de su uso del aprendizaje autom¨¢tico
Un mecanismo sencillo para predecir las puntuaciones podr¨ªa asignar un par¨¢metro a cada usuario que determine lo poco severo o lo duro que suele ser en sus comentarios. Otro par¨¢metro podr¨ªa asignarse a cada pel¨ªcula para determinar la aceptaci¨®n de esa pel¨ªcula con respecto a otras. Algunos modelos m¨¢s complejos identifican las similitudes entre los usuarios y las pel¨ªculas, por tanto, si a las personas a las que les gusta el tipo de pel¨ªculas que a ti te gustan han dado una puntuaci¨®n elevada a una pel¨ªcula que no has visto, el sistema podr¨ªa suponer que a ti tambi¨¦n te gustar¨¢n.
Esto puede implicar que existan algunos aspectos ocultos en las preferencias de los usuarios y en las caracter¨ªsticas de las pel¨ªculas. Tambi¨¦n puede hacer que haya que medir c¨®mo han cambiado las puntuaciones de una pel¨ªcula dada a lo largo del tiempo. Si una pel¨ªcula que antes era desconocida se convierte en un cl¨¢sico de culto, podr¨ªa empezar a aparecer m¨¢s en las listas de recomendaciones de la gente. Un aspecto fundamental cuando se usan varios modelos es que hay que combinarlos y ajustarlos bien: el algoritmo que gan¨® el Premio Netflix en el concurso para predecir las puntuaciones de pel¨ªculas en 2009, por ejemplo, fue una mezcla de cientos de algoritmos individuales.
Esta combinaci¨®n de algoritmos de puntuaci¨®n, clasificaci¨®n y recomendaci¨®n ha transformado nuestras actividades diarias en Internet, mucho m¨¢s all¨¢ de las compras, las b¨²squedas y el entretenimiento. Su interconexi¨®n nos permite saber de una forma m¨¢s clara ¨C y a veces inesperada ¨C lo que queremos y c¨®mo conseguirlo.
Christopher Brinton es investigador y profesor visitante de Ingenier¨ªa El¨¦ctrica de la Universidad de Princeton.
Mung Chiang es catedr¨¢tico de Ingenier¨ªa El¨¦ctrica de la Universidad de Princeton.
Cl¨¢usula de divulgaci¨®n: Christopher Brinton trabaja para Zoomi Inc. y posee acciones de esta empresa. Princeton EDGE Lab recibe financiaci¨®n de organismos del Gobierno estadounidense para la financiaci¨®n de la investigaci¨®n como la National Science Foundation.
Este art¨ªculo fue publicado originalmente en ingl¨¦s en la web The Conversation.
Traducci¨®n de News Clips.
Tu suscripci¨®n se est¨¢ usando en otro dispositivo
?Quieres a?adir otro usuario a tu suscripci¨®n?
Si contin¨²as leyendo en este dispositivo, no se podr¨¢ leer en el otro.
FlechaTu suscripci¨®n se est¨¢ usando en otro dispositivo y solo puedes acceder a EL PA?S desde un dispositivo a la vez.
Si quieres compartir tu cuenta, cambia tu suscripci¨®n a la modalidad Premium, as¨ª podr¨¢s a?adir otro usuario. Cada uno acceder¨¢ con su propia cuenta de email, lo que os permitir¨¢ personalizar vuestra experiencia en EL PA?S.
En el caso de no saber qui¨¦n est¨¢ usando tu cuenta, te recomendamos cambiar tu contrase?a aqu¨ª.
Si decides continuar compartiendo tu cuenta, este mensaje se mostrar¨¢ en tu dispositivo y en el de la otra persona que est¨¢ usando tu cuenta de forma indefinida, afectando a tu experiencia de lectura. Puedes consultar aqu¨ª los t¨¦rminos y condiciones de la suscripci¨®n digital.