Вопросы по теме 'file-encodings'

C#: шведские символы в Xpath при разборе документов Lating1Encoded
У меня есть набор html-документов, которые мне нужно проанализировать. Они закодированы в Latin1Encoded. Я использую пакет HtmlAgiliy для «парсинга». У меня есть запрос Xpath (со шведскими символами), который я не могу заставить работать из-за...
795 просмотров
schedule 06.08.2022

Определить, содержит ли файл текст
Возможный дубликат: Как определить, является ли файл двоичным или текстовым в C #? C # - Проверить, является ли файл текстовым Чтобы лучше понять многопоточность и асинхронные задачи, я написал простое приложение на C # для подсчета...
2398 просмотров
schedule 22.08.2023

Как установить кодировку системного файла по умолчанию в IntelliJ IDEA
Я хочу, чтобы IDEA использовала любую системную кодировку по умолчанию, вместо этого она использует все, что установлено через «Настройки»> «Кодировки файлов». Который установлен в UTF-8. Мое приложение отлично работает в Eclipse, который...
9981 просмотров
schedule 16.02.2023

Кодировка VS 2012 в объявлении «utf-16» не соответствует документу «utf-8»
Когда я открываю Visual Studio 2012, меня встречает сообщение «Visual Studio Кодировка в объявлении utf-16 не соответствует кодировке документа utf-8». Кто-нибудь знает, почему это может происходить? Или какие действия по устранению неполадок...
3067 просмотров

новая строка (байт []) дает разные результаты, когда я вставляю ее и вытаскиваю из базы данных
Прежде чем я сохраню массив байтов в базу данных, если я распечатаю вывод new String(data) , он вернет удобочитаемую строку, такую ​​​​как foobar, но после того, как я вытащу ее из базы данных, new String(data) будет читаться как куча тарабарщины,...
677 просмотров

Преобразование символа Mac Roman в эквивалент UTF-8
Мне дали несколько файлов HTML, в которых используется кодировка файлов Mac OS Roman. В файлах текст на французском языке, но в редакторе многие диакритические знаки выглядят странно (т. е. не на французском языке). Si cette option est...
8014 просмотров

Ошибка сравнения французских символов в строке С++
Мне было интересно, может ли кто-нибудь из вас помочь мне с моей проблемой. В настоящее время у меня есть функция, которая принимает строку в стиле c, создает временную строку в стиле c++ и сохраняет в ней строку c, а также использует команду...
271 просмотров
schedule 20.12.2022

Почему Java не генерирует исключение при сбое декодирования байтов в строку?
Если есть какое-то исключение, когда декодирование не удалось, то мы можем попытаться определить кодировку файла по очереди. Но я не нашел способ, который вызовет какое-то исключение, например «UnicodeDecodeError» в python, есть ли какая-то...
218 просмотров
schedule 14.07.2023

Поиск и замена специальных символов в файле
Я пытаюсь найти и заменить некоторые специальные символы в файле, закодированном в ISO-8859-1, а затем записать результат в новый файл, закодированный в UTF-8: package inv class MigrationScript { static main(args) { new...
75 просмотров
schedule 14.03.2023

Почему стоит выбрать EUC-JP, а не UTF-8 или SHIFT-JIS?
Я работал с японской компанией, которая решила кодировать наши файлы с помощью EUC-JP. Мне уже давно было любопытно, и я пытался спросить начальство, почему EUC-JP вместо SHIFT-JIS или UTF-8, но получил ответы «как будто это соглашение или что-то в...
2684 просмотров
schedule 24.08.2023