Noticias Weblogs Foros Wiki Código

Meta-Info

¿Que es?

Planeta Código es un agregador de weblogs sobre programación y desarrollo en castellano. Si eres lector te permite seguirlos de modo cómodo en esta misma página o mediante el fichero de subscripción.

rss subscripción

Sponsors

Puedes utilizar las siguientes imagenes para enlazar PlanetaCodigo:
planetacodigo

planetacodigo

Si tienes un weblog de programación y quieres ser añadido aquí, envíame un email solicitándolo.

Idea: Juanjo Navarro

Diseño: Albin

vnsjava

En busca de parseadores HTML

Enero 9th, 2007 - [Enlace local]

Estoy en busca de parseadores HTML para mi spider implementado en Jade,

encontré este HTMLParser, el cual es simple y rápido.



Ahora es más simple obtener el texto de una pagina web y la lista de enlace de esta misma.



Ejemplo:

String URL = "http://htmlparser.sourceforge.net";

StringExtractor se = new StringExtractor (URL);

String contents = se.extractStrings(true);

System.out.println(contents);

» Leer más, comentarios, etc...

Información legal y técnica