viernes septiembre 14, 2007
Igual que "cuando el bosque no deja ver qué árboles tienen fruto", en las nube de etiquetas (tags cloud), y que aparecen últimamente por doquier, si alguien se pone a mirar atentamente dentro de ellas para ver cuales son los términos más buscados o por cuales los internautas parece que están más interesados, podrá observar dos cosas curiosas que a mi se me han revelado:
- Que muchos de los términos con mayor puntuación son términos genéricos, de apenas valor, que son la parte insustancial de frases o que no se sabe el porqué es difícil desbancarlos de los primeros puestos, pero que son de dudosa relevancia.
- Que con frecuencia se cuela algún que otro término de naturaleza HOIGAN como yasta; yaparte; osea; ..., (otros HEJEMPLOS).
La conclusión es que los algoritmos de generación de nubes de etiquetas deberían de ser un poco más inteligentes, ¿qué valor tiene que la palabra blog, o internet, o humor, o sexo, aparezcan como las de mayor relevancia ? ¿qué aporta el hecho de que perpetuamente estén en dichas posiciones ? ¿El problema está en la elección de los términos?.
De hecho, los términos de una sola palabra, son a menudo poco orientativos, que el término juego aparezca como muy relevante seguido de otros de menor relevancia como blog, internet, gratis o sexo es apenas ilustrativo, pero si el tag es 'juegos gratis internet sexo', sí que se sabe a ciencia cierta que es lo que interesa a dichos internautas.
Dicho de otro modo, cuando asociamos a algún objeto (una entrada en un weblog, una foto, un vídeo, una canción, ...) varios tags simples, lo que queremos hacer a menudo, es que dicho conjunto de tags, formen un todo asociado a dicho objeto, por lo que si el analizador de tags luego nos los descompone en los simples, no obtendrá una nube de términos relevante. En dichos casos, lo mejor es crear términos formados por más de una palabra, aunque esto multiplique el número de tags a utilizar..
Search This Site
Recent Entries
- HSPA USB Modem de MoviData
- Windows 7, el último S.O.
- Navegadores web en la Antártida
- En la tónica de hace 5 años
- Script para ordenar una tabla html print friendly (2/2)
- El definitivo script para ordenar una tabla html con javascript (1/2)
- Cuando la seguridad flaquea en sutilezas
- Recuperar los passwords de Firefox 3 (habiendo tenido FF2)
- Otro tonto error de un programador
- Incongruencias espacio temporales
- Día internacional del Software Libre
- Canon y la sopa boba
- Ideas y Buenas ideas
- Relanzamiento de cocoon.apache.org
- Wii con teclado USB
- Edicion en Roller off-line con w.bloggar
- Los términos mas buscados
- ¿Cuándo terminamos el proyecto?
- Recuperación de fotos (y II)
- Recuperar fotos borradas (I)
No sé si estás refiriéndote a un tag cloud de alguna página en concreto, pero yo creo que tal y como están planteados inicialmente funcionan bien en promedio.
El problema principal es que la propia categorización es dinámica y depende del factor humano: yo soy muy dado a tener muy desordenado mi delicious (http://del.icio.us/vitxo mira el tagcloud y échate a reir :D), aún así cuando quiero rescatar un enlace entre mil, siempre llego a él sin mucho esfuerzo :-).
Es probable que el "Tag Cloud Agent Controller" esté por inventar. :-)
Enviado por vitxo. en septiembre 15, 2007 a las 03:54 PM CEST #