Parsing HTML - catatanarif

Monday, September 29, 2014

Parsing HTML

Parsing sendiri adalah suatu cara memecah-mecah suatu rangkaian masukan (misalnya dari berkas atau keyboard). sedangkan Parsing HTML adalah proses memecah-memecah tag-tag yang ada pada HTML untuk mendapatkan informasi yang dibutuhkan.
ada beberapa jenis library untuk melakukan parsing HTML menggunakan JAVA antara lain JSOUP dan HTML PARSER, tapi menurut saya mungkin yang paling digunakan adalah JSOUP.
contoh parsing HTML pada JAVA :


public String cleanHtml2(String url){
        String result = null;
        Document doc;
        try {
            System.out.println("Connect to "+url);    
            doc = Jsoup.connect(url).get();
            System.out.print("Connection success..\n");
            Elements links = doc.select("html");  //select all tag HTML
            result = links.text();
            doc = null; links = null;
            return result;
        } catch (IOException ex) {
            System.out.println("can't connect to "+url+" "+ex.getMessage());  
            return "";
        }
    }
disini akan diambil informasi yang ada pada situs dimulai pada tag HTMLnya

2 comments:

  1. Coding nya sangat berguna sekali gan..
    saya udah follow blog agan kalau bisa follback dong gan :)
    www.huntingapk.com

    ReplyDelete
  2. ok gan makasi...sip nanti sy follow blog agan...

    ReplyDelete


EmoticonEmoticon