js过滤HTML标签以及空格的思路及代码

如题所述

第1个回答 2019-07-18

代码如下:
function
setContent(str)
{
str
=
str.replace(/</?[^>]*>/g,'');
//去除HTML
tag
str.value
=
str.replace(/[
|
]*n/g,'n');
//去除行尾空白
//str
=
str.replace(/n[s|
|
]*r/g,'n');
//去除多余空行
return
str;
}

测试的时候发现这段代码不能过滤掉网页中空格字符(即：
)。于是自己又改造了一下：
代码如下:
function
removeHTMLTag(str)
{
str
=
str.replace(/</?[^>]*>/g,'');
//去除HTML
tag
str
=
str.replace(/[
|
]*n/g,'n');
//去除行尾空白
//str
=
str.replace(/n[s|
|
]*r/g,'n');
//去除多余空行
str=str.replace(/
/ig,'');//去掉
return
str;
}

恩，我的要求达到了。
现在来稍稍解释一下所用到的三个正则表达吧(需要说明的是，因为自己也是刚刚接触，也许我的解释并不是正确的，仅供参考)：
第一个:/</?[^>]*>/g
在js中正则表达式是以“/”开头的，后面的/g，含义是表示全局模式，意思是在将匹配的模式应用于整个字符串，而不是在第一次匹配上之后就停止匹配了。
</?[^>]*>
这个分开来解释，其中第二个字符“”是一个转移字符，用来转移后面的”/”字符的。?匹配0或1个正好在它之前的那个字符。注意：这个元字符不是所有的软件都支持的。所以</?就是匹配html标签中的”</”格式或者“<”格式的。
再来说[^>]*>。[]是含义是：
^的含义是：匹配一行的开始。例如正则表达式^When
in能够匹配字符串"When
in
the
course
of
human
events"的开始，但是不能匹配"What
and
When
in
the"。意思就是匹配以“When
in”开头的文字。
*的含义是：匹配0或多个正好在它之前的那个字符。例如正则表达式。*意味着能够匹配任意数量的任何字符
因此[^>]*意思是匹配>之外的字符。所以[^>]可以匹配出的模式可以像下面这样的：
div
我需要的文字</div
我需要的文字</p
*和前面的[^>]结合在一起就可以匹配下面这些字符了：
div>我需要的文字</div
p>我需要的文字</p
br
/
再加上后面的>就可以匹配下面的字符了：
div>我需要的文字</div>
p>我需要的文字</p>
br
/>
这样就完成了一对HTML标签的匹配了。(多句话，总觉得这个匹配有点啰嗦，但是不知道到底在哪个地方啰嗦)
第二个：/[
|
]*n/g：我也没有看懂
第三个：/
/ig：就是直接查找
字符，后面的/ig的含义是在全局模式下进行不区分大小写的查找。g代表全局，i表示不区分大小写。

相似回答

js正则表达式过滤html标签,这个正则式怎么写?答：代码虽短功能却超强，运行效率也很高！public static string ClearHtmlCode(string text){ text = text.Trim();if (string.IsNullOrEmpty(text))return string.Empty;text = Regex.Replace(text, "[/s]{2,}", " "); //two or more spaces text = Regex.Replace(text, "(<[b|B][r|R...

js如何过滤div内某特定HTML标签???答：// 这里为了方便使用jQuery// 移除使用tag类的div标记下的strong标记下a标记下没有子元素(链接为空)的节点元素jQuery('div.tag strong a:empty').parent().remove();

怎么用js或者jQuery去除掉某个标签但是不去除里面的内容答：1、可以使用正则直接取到img //思路分两步：//1，匹配出图片img标签（即匹配出所有图片），过滤其他不需要的字符//2.从匹配出来的结果（img标签中）循环匹配出图片地址（即src属性）var str = "<td>this is test string <img src=\"http:yourweb.com/test.jpg\" width='50' > 123 and th...

JS输出空格的简单实现方法答：在写JS代码的时候，大家可以会发现这样现象：document.write("1 2 3 ");结果:1 2 3 无论在输出的内容中什么位置有多少个空格，显示的结果好像只有一个空格。这是因为浏览器显示机制，对手动敲入的空格，将连续多个空格显示成1个空格。解决方法：1.使用输出html标签 来解决 document.write(" "+"...

求用jquery或者js 清除指定元素内的 html标签和文本,但是要保留<img /...答：var $imgs= $("#container").find("img");//先从指定元素（id=container）内的img找到 ("#container").html("");//清空指定元素内容 ("#container").append($imgs);//把img元素加进去

HTML/javascript 文本清除 CSS 样式代码等标签如何编写答：</?[a-zA-Z]+[^><]*> 这个就是我最上面写的那个,会去掉所有的标签,包括font .</?[a-zA-Z]+[^><]*> 这个表达式可以去掉所有HTML的标签 JAVA代码可以这样写:public static String delTagsFContent(String content){ String patternTag = "</?[a-zA-Z]+[^><]*>";String ...

HTML利用JS移除指定的标签答：用Js匹配li的t内容就可以的，看如下代码：<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml"><head><meta http-equiv="Content-Type" content="text/html; ...

大家正在搜

javascript空格代码 js去除字符串中的空格 js去除字符串前后的空格 html5空格标签 html标签空格 html5空格保留标签 html空格符号标签空格闭合标签 html空格标签怎么写