GRAB4J: UNA LIBRERIA JAVA UTILE PER ESTRARRE INFORMAZIONI DA UN DOCUMENTO HTML ONLINE.

Click to rate this post!
[Total: 0 Average: 0]

Varie regole (logica grabbing) permettono di estrarre determinate informazioni da qualsiasi pagina web. Questa soluzione migliora l’approccio dei token. Spesso veniva utilizzata infatti in questi casi la classe della microsoft HTMLTokenizer.
La seguente routine permette di :

  1. Scaricare il documento dalla rete.
  2. Interpretare il documento e costruirne una rappresentazione ad oggetti.
  3. Estrarre informazioni dalla rappresentazione del documento, eseguendo la routine con la logica di grabbing.

LIBRERIA

Verione della libreria:  grab4j V1.0

Nel archivio sono presenti:
Eseguibili, sorgenti, esempi e documentazione.

0 0 votes
Article Rating
Subscribe
Notify of
guest
0 Comments
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x