После парсинга xls файла средствами php, русские буквы заменяются кодами ascii

программирование php кодировка парсер

Вот например эта строка:
"&#1043&#1088&#1091&#1087&#1087&#1072&#32&#1079&#1072&#1073&#1086&#1083&#1077&#1074&#1072&#1085&#1080&#1081"
соответствует русской фразе - "Группа заболеваний"

сама строка генерируется вот этой функцией:
function uc2html($str) {
$ret = '';
for( $i=0; $i<strlen($str)/2; $i++ ) {
$charcode = ord($str[$i*2])+256*ord($str[$i*2+1]);
$ret .= '&#'.$charcode;

}
return $ret;
}

Вопрос
1. как преобразовать строку вида "&#1043&#1088&#1091" в нормальный русский текст? в браузере она показывается нормально. вот только в базу данных в таком виде записывать не хочется.
2. если первый вариант невозможен, то как имея входную строку на русском языке в кодировке utf-8 получить строку вида "&#1043&#1088"?

Примечание:
html_entity_decode - не работает. он просто эту строку выводит без изменений

Примечание:
разобрался.
нужно исправить $ret .= '&#'.$charcode; ---> $ret .= '&#'.$charcode.';';
+ при записи в базу
function conv($m) {
return mb_convert_encoding($m[1], "UTF-8", "HTML-ENTITIES");
}
$text = preg_replace_callback("/(&#[0-9]+;)/", "conv", $text);
Ответы:
1. используйте html_entity_decode


11 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.