Parseando el BOE con jLibrary

Tanta gente me ha preguntado como poder utilizar el API de jLibrary que no me ha quedado más remedio que crear un par de ejemplos. Uno de ello utiliza el archivo del BOE para descargarse los boletines e indexarlos en un repositorio de jLibrary. Dejo aquí la referencia al artículo por si a alguien le interesa o le da ideas

Parseando el BOE

Ojo si ejecutáis el ejemplo. 1 mes = +600Mb ;-)

Permalink Comentarios [2]
Comentarios:

Prueba a utilizar Nutch , utilidad opensource basada en lucene que tiene un crawler con tecnologia GRID al estilo de google.

Enviado por batch4j en May 30, 2006 a las 07:22 AM EDT #

Bueno, jLibrary es open source y ya lo hace, no creo que pruebe nutch ;)

Enviado por martin en May 31, 2006 a las 08:51 AM EDT #

Enviar un comentario:

Los comentarios han sido deshabilitados.