Mail.ruПочтаМой МирОдноклассникиВКонтактеИгрыЗнакомстваНовостиКалендарьОблакоЗаметкиВсе проекты

PHP - разделение HTML строки после закрывающихся тегов по регулярному выражению.

Dmitriatika Ученик (190), закрыт 5 лет назад
Стала задача разбить html строку (полученную после парсинга страницы) после любых закрывающих тегов, что бы почистить от пробелов, задать переносы строк и проставить где надо маркеры.
Нашёл на просторах интернета рабочее решение:
preg_match_all('#<([a-z]+)[^/>]*(?:/>|>(?:.+\1>))#Uis',$content,$array);
foreach ($array[0] AS $val){
$text .= trim($val)."\n";
}
Но есть минус - теги h1, h2 и подобные где, есть числовая составляющая, просто удаляются полостью.
Может кто подскажет как регулярку поправить.
Лучший ответ
Андрей Высший разум (425688) 5 лет назад
Замени [a-z] на [a-z0-9] или на \w
DmitriatikaУченик (190) 5 лет назад
Спасибо) Помогло [a-z0-9]. С- \w не понял куда вставлять.
Dmitriatika Ученик (190) Разобрался. [\w] - тоже работает как надо.
Остальные ответы
Похожие вопросы