php教程

超轻量级php框架startmvc

PHP将HTML转换成文本的实现代码

更新时间:2020-03-02 00:47:03 作者:startmvc
核心代码:<?php//$document应包含一个HTML文档。//本例将去掉HTML标记,javascript代码//和空

核心代码:


<?php
// $document 应包含一个 HTML 文档。
// 本例将去掉 HTML 标记,javascript 代码
// 和空白字符。还会将一些通用的
// HTML 实体转换成相应的文本。

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
 "'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 标记
 "'([\r\n])[\s]+'", // 去掉空白字符
 "'&(quot|#34);'i", // 替换 HTML 实体
 "'&(amp|#38);'i",
 "'&(lt|#60);'i",
 "'&(gt|#62);'i",
 "'&(nbsp|#160);'i",
 "'&(iexcl|#161);'i",
 "'&(cent|#162);'i",
 "'&(pound|#163);'i",
 "'&(copy|#169);'i",
 "'&#(\d+);'e"); // 作为 PHP 代码运行

$replace = array ("",
 "",
 "\\1",
 "\"",
 "&",
 "<",
 ">",
 " ",
 chr(161),
 chr(162),
 chr(163),
 chr(169),
 "chr(\\1)");

$text = preg_replace ($search, $replace, $document);
?>
HTML 文本