Вопросы по теме 'file-encodings'
C#: шведские символы в Xpath при разборе документов Lating1Encoded
У меня есть набор html-документов, которые мне нужно проанализировать. Они закодированы в Latin1Encoded. Я использую пакет HtmlAgiliy для «парсинга».
У меня есть запрос Xpath (со шведскими символами), который я не могу заставить работать из-за...
795 просмотров
schedule
06.08.2022
Определить, содержит ли файл текст
Возможный дубликат: Как определить, является ли файл двоичным или текстовым в C #? C # - Проверить, является ли файл текстовым
Чтобы лучше понять многопоточность и асинхронные задачи, я написал простое приложение на C # для подсчета...
2398 просмотров
schedule
22.08.2023
Как установить кодировку системного файла по умолчанию в IntelliJ IDEA
Я хочу, чтобы IDEA использовала любую системную кодировку по умолчанию, вместо этого она использует все, что установлено через «Настройки»> «Кодировки файлов». Который установлен в UTF-8.
Мое приложение отлично работает в Eclipse, который...
9981 просмотров
schedule
16.02.2023
Кодировка VS 2012 в объявлении «utf-16» не соответствует документу «utf-8»
Когда я открываю Visual Studio 2012, меня встречает сообщение «Visual Studio Кодировка в объявлении utf-16 не соответствует кодировке документа utf-8».
Кто-нибудь знает, почему это может происходить? Или какие действия по устранению неполадок...
3067 просмотров
schedule
06.12.2022
новая строка (байт []) дает разные результаты, когда я вставляю ее и вытаскиваю из базы данных
Прежде чем я сохраню массив байтов в базу данных, если я распечатаю вывод new String(data) , он вернет удобочитаемую строку, такую как foobar, но после того, как я вытащу ее из базы данных, new String(data) будет читаться как куча тарабарщины,...
677 просмотров
schedule
27.02.2023
Преобразование символа Mac Roman в эквивалент UTF-8
Мне дали несколько файлов HTML, в которых используется кодировка файлов Mac OS Roman. В файлах текст на французском языке, но в редакторе многие диакритические знаки выглядят странно (т. е. не на французском языке).
Si cette option est...
8014 просмотров
schedule
17.09.2023
Ошибка сравнения французских символов в строке С++
Мне было интересно, может ли кто-нибудь из вас помочь мне с моей проблемой. В настоящее время у меня есть функция, которая принимает строку в стиле c, создает временную строку в стиле c++ и сохраняет в ней строку c, а также использует команду...
271 просмотров
schedule
20.12.2022
Почему Java не генерирует исключение при сбое декодирования байтов в строку?
Если есть какое-то исключение, когда декодирование не удалось, то мы можем попытаться определить кодировку файла по очереди.
Но я не нашел способ, который вызовет какое-то исключение, например «UnicodeDecodeError» в python, есть ли какая-то...
218 просмотров
schedule
14.07.2023
Поиск и замена специальных символов в файле
Я пытаюсь найти и заменить некоторые специальные символы в файле, закодированном в ISO-8859-1, а затем записать результат в новый файл, закодированный в UTF-8:
package inv
class MigrationScript {
static main(args) {
new...
75 просмотров
schedule
14.03.2023
Почему стоит выбрать EUC-JP, а не UTF-8 или SHIFT-JIS?
Я работал с японской компанией, которая решила кодировать наши файлы с помощью EUC-JP. Мне уже давно было любопытно, и я пытался спросить начальство, почему EUC-JP вместо SHIFT-JIS или UTF-8, но получил ответы «как будто это соглашение или что-то в...
2684 просмотров
schedule
24.08.2023