У меня на компьютере есть несколько файлов в формате UTF-16, хотя это, похоже, из-за ошибок или повреждения файлов, а не из-за намерения - они должны быть простыми английскими. Я загрузил один из них (здесь). Если я оставлю кодировку в Firefox (Viwe>Character Encoding) на UTF-8, то получу кучу тарабарщины (см. скриншот). Если я изменю кодировку на UTF-16, она будет выглядеть намного лучше (см. скриншот2) , хотя есть еще куча персонажей CJK.
Я хотел бы просмотреть все эти файлы, очистить их и, возможно, сохранить в формате utf-8 (я буду вставлять содержимое в таблицу mysql, в которой используется сопоставление utf8_general_ci). Кто-нибудь знает, как я могу сделать это автоматически с помощью PHP? Я хотел бы избавиться от всех забавных символов, отображаемых в файле, если вы попытаетесь просмотреть его в UTF-8, а также от всех символов CJK, отображаемых при просмотре в UTF-16.