php:html富文本提取text普通文本内容
原创
©著作权归作者所有:来自51CTO博客作者彭世瑜的原创作品,请联系作者获取转载授权,否则将追究法律责任
<?php
function getPlainTextFromHtml($html)
{
// Remove the HTML tags
$html = strip_tags($html);
// Convert HTML entities to single characters
$html = html_entity_decode($html, ENT_QUOTES, 'UTF-8');
$html_len = mb_strlen($html, 'UTF-8');
// Make the string the desired number of characters
// Note that substr is not good as it counts by bytes and not characters
$html = mb_substr($html, 0, strlen($html), 'UTF-8');
return $html;
}
echo getPlainTextFromHtml('<p>主任医师,教授,<a>硕士生导师</a>,中山医学院医疗系毕业。<\/p>');
// 主任医师,教授,硕士生导师,中山医学院医疗系毕业。
参考
php 提取html 文本内容,正文内容