视窗
loading...
您现在的位置:首页 > IT认证 > JAVA >

Java基础知识:java获取网页源代码


要分析某个网页中的代码构成,需要某个结点下的内容。用此原始方法可以得到整个网页的源码。其实更简单的方法是使用 WebClient 或 HtmlUtil 等开源方式 。

[java]  

public class HtmlParser {  

    public static String getHtmlContent(URL url, String encode) {  

        StringBuffer contentBuffer = new StringBuffer();  

  

        int responseCode = -1;  

        HttpURLConnection con = null;  

        try {  

            con = (HttpURLConnection) url.openConnection();  

            con.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");// IE代理进行下载  

            con.setConnectTimeout(60000);  

            con.setReadTimeout(60000);  

            // 获得网页返回信息码  

            responseCode = con.getResponseCode();  

            if (responseCode == -1) {  

                System.out.println(url.toString() + " : connection is failure...");  

                con.disconnect();  

                return null;  

            }  

            if (responseCode >= 400) // 请求失败  

            {  

                System.out.println("请求失败:get response code: " + responseCode);  

                con.disconnect();  

                return null;  

            }    InputStream inStr = con.getInputStream();  

            InputStreamReader istreamReader = new InputStreamReader(inStr, encode);  

            BufferedReader buffStr = new BufferedReader(istreamReader);  

  

            String str = null;  

            while ((str = buffStr.readLine()) != null)  

                contentBuffer.append(str);  

            inStr.close();  

        } catch (IOException e) {  

            e.printStackTrace();  

            contentBuffer = null;  

            System.out.println("error: " + url.toString());  

        } finally {  

            con.disconnect();  

        }  

        return contentBuffer.toString();  

    }  

  

    public static String getHtmlContent(String url, String encode) {  

        if (!url.toLowerCase().startsWith("")) {  

            url = "" + url;  

        }  

        try {  

            URL rUrl = new URL(url);  

            return getHtmlContent(rUrl, encode);  

        } catch (Exception e) {  

            e.printStackTrace();  

            return null;  

        }  

    }  

    public static void main(String argsp[]){  

        System.out.println(getHtmlContent("","utf-8")) ;  

          

    }  

}  

闁靛棌鍋�

闁靛棌鍋�

闁靛棙鍔曢崢銈囨嫻閿濆拑绱i柡鍕閹蜂即鎮ч崼鐔哥秬閻犲洤鐡ㄥΣ鎴﹀Υ閿燂拷
闁哄牜鍓涢悵顖炴焾閵娿儱鐎诲ǎ鍥e墲娴煎懘寮堕妷锔剧埍濞存粌绨肩花浼存嚂閺冨倻绉归柨娑虫嫹閻庣數顢婂ù鍡樻姜閻e本鐣卞ǎ鍥e墲娴煎懘骞嬮幋婊勭拨闁告梹绋掗惇浼村冀閸ャ劍顫栧ǎ鍥e墲娴煎懘鎯冮崟顐㈡瘔濠㈣泛瀚哥槐锟�闁瑰瓨鍨冲⿰鎴犱焊婵犲洤娅㈠ù锝嗙矎閳ь剙鎳愬▓鎴︽偋閸喐缍€闁戒焦銇炵紞鏃堝级閸愯法绀�閻庝絻顫夐崹婊勭椤掑啯绁弶鐐垫櫕濞堟垶绌遍埄鍐х礀濠碘€冲€瑰﹢浣割嚕閸屾繍鍞撮柟瀛樼墬濠€浣圭瑹閸偅缍€闁瑰瓨鐗炵换姘枖閺囨矮绻嗛柟顓у灥椤曨剟宕f繝鍐╊槯闁艰鲸姊婚柈鎾箣閹存粍绮﹂柨娑樻湰濠€鎵博濞嗗海绐楃紒鏂款儏瀹撳棝宕氶悩缁樼彑闁挎冻鎷�閻庣數鎳撶敮顐﹀礆濞戞ê鏁堕悗纭咁潐閸ㄦ粍绂掗浣稿Ы闁规澘绻戦弫顔界濮椻偓閳ь剙鍊哥紞瀣儍閸曨厐褰掓煀椤掑﹦绀�闁艰鲸姊婚柈鎾棘閻熸壆纭€闁挎稒宀搁崑鏍ㄧ閿燂拷:webmaster@jscj.com闁靛棌鍋撻柣顫祷閻︿粙鏁嶉敓锟�4008816886

相关文章

无相关信息
更新时间2022-09-16 10:07:22【至顶部↑】
联系我们 | 邮件: webmaster@jscj.com | 客服热线电话:4008816886(QQ同号) |  婵犵數濮烽弫鎼佸磿閹寸姷绀婇柍褜鍓氶妵鍕即閸℃顏柛娆忕箻閺岋綁骞囬鍛瘜闂佺ǹ顑嗛幑鍥偘椤曗偓瀹曞綊顢欓崣銉ф/濠电姷鏁告慨顓㈠磻閹剧粯鐓曢柕澶嬪灥閼活垰鈻撻銏╂富闁靛牆妫欓ˉ鍡樸亜閺傚尅鍔熼柟骞垮灲閺佹捇鏁撻敓锟�

付款方式留言簿投诉中心网站纠错二维码手机版

电话:
付款方式   |   给我留言   |   我要纠错   |   联系我们