JAVA通过正则匹配html里面body标签的内容

2022-10-24实例代码
489

java通过正则匹配html里面body标签的内容,具体代码如下,如果要取得html代码中body里面的内容 不包含body标签,直接调用 removeBody

/**
     *  获取html中body的内容 包含body标签
     * @param htmlStr  html代码
     * @return
     */
    public static String getBody(String htmlStr){


        String pattern = "<body[^>]*>([\\s\\S]*)<\\/body>";

        Pattern p_body = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
        Matcher m_body = p_body.matcher(htmlStr);
        if (m_body.find()){
            return m_body.group();
        }
        return htmlStr;
    }


    /**
     * 取到html中body里面的内容 不包含body标签
     * @param htmlStr
     * @return
     */
    public static String removeBody(String htmlStr){

        /**
         * 获取html代码中body标签里的内容
         */
        htmlStr=getBody(htmlStr);

        //body开头标签
        String bodyEx_start = "<body[^>]*>";

        //body结尾标签
        String bodyEx_end = "<\\/body>";

        Pattern p_script = Pattern.compile(bodyEx_start, Pattern.CASE_INSENSITIVE);
        Matcher m_script = p_script.matcher(htmlStr);
        htmlStr = m_script.replaceAll(""); // 过滤script标签

        Pattern p_style = Pattern.compile(bodyEx_end, Pattern.CASE_INSENSITIVE);
        Matcher m_style = p_style.matcher(htmlStr);
        htmlStr = m_style.replaceAll(""); // 过滤style标签



        return htmlStr;
    }
 
The End
正则表达式 java

相关推荐

mui消息框alert,confirm,prompt,toast实例
mui消息框alert,confirm,prompt,toast实例 script type="text/javascript" charset="utf-8" //mui初始化 mui.init({ swipeBack: true //启用右滑关闭功能 }); var info = document.getElementById("info"); document.getElementById("alertBtn").addEventL...
2024-12-21 实例代码
249

layui table中的数据列中加入图片的上传和展示的例子
layui table 中数据列中可点击按钮直接上传图片或者展示图片,实现功能如下: 这里直接展示代码(主要逻辑是要在table 加载时把upload 组件渲染在每一个格子) //table 列中模板的代码script type="text/html" id="imgTpl2"#[[a href="javascript:void(0);" on...
2024-06-17 实例代码
458

PHP正则表达式匹配是否为IP地址段
我们要验证一段信息是否为ip地址段,用php代码怎么写呢?具体实例代码如下: /** * 匹配IP地址 * @param string $subject * @return bool */function checkVailIp(string $subject){ $pattern = "/(1\d{2}|2[0-4]\d|25[0-5]|[1-9]\d|[1-9])\."; $pattern .="(...
2023-03-03 实例代码
240

php采集图片的一个实例代码
我们需要做采集,首先要了解正则表达式,在这里我们用到的是-phpQuery。phpQuery用来匹配html中的内容比正则简单太多了,只要会jquery,使用起来几乎无障碍。这里只是提供一个demo实例,可能随着原网址内容的调整无法采集到内容,具体大家可以尝试下。 ?phpre...
2022-12-14 实例代码
102

在javascript中将GBK转UTF-8的实例代码
在javascript中将GBK转UTF-8的实例代码,具体代码如下,希望能够帮到您: script type="text/javascript" var easyUTF8 = function(gbk){ if(!gbk){return '';} var utf8 = []; for(var i=0;igbk.length;i++){ var s_str = gbk.charAt(i); if(!(/^%u/i.test(e...
2022-11-19 实例代码
245

JAVA通过正则匹配html里面body标签的内容
JAVA通过正则匹配html里面body标签的内容,具体代码如下,如果要取得html代码中body里面的内容 不包含body标签,直接调用removeBody /** * 获取html中body的内容 包含body标签 * @param htmlStr html代码 * @return */ public static String getBody(String...
2022-10-24 实例代码
489