Терминал Cygwin не отображает определенные символы?

Я запускаю стандартную установку Cygwin с добавленным пакетом wget.

Если я запускаю команду

wget -qO- tetristv.com/zapni.tv.php

Я понимаю это; обратите внимание на неправильное отображение символов

session=OTA5Mjc0ODU5OA==&stream=play</a></b><br>#EXTINF:0,▒T 1<br><b><a     
href="http://212.80.69.19/stream/vlc.php?id=39&session=OTA5Mjc0ODU5OA==&
stream=play" target="_blank" rel="nofollow">http://212.80.69.19/stream 
/vlc.php?id=39&session=OTA5Mjc0ODU5OA==&stream=play</a></b><br>#EXTINF:0,▒T 
2<br><b><a href="http://212.80.69.19/stream/vlc.php?id=40& 
session=OTA5Mjc0ODU5OA==&stream=play" target="_blank" 
rel="nofollow">http://212.80.69.19/stream/vlc.php?id=40&
session=OTA5Mjc0ODU5OA==&stream=play</a></b><br>#EXTINF:0,▒T 24<br><b><a 

Если я просто загружаю файл, в Блокноте все выглядит нормально.

wget tetristv.com/zapni.tv.php

person Steven Penny    schedule 15.06.2012    source источник


Ответы (2)


$ LANG=en_US.CP1252
$ wget -qO- tetristv.com/zapni.tv.php

Результат

261&session=NTk1NTg0ODU5OA==&stream=play</a></b><br>#EXTINF:0,Oèko<br><b><a

Это также работает

wget -qO- tetristv.com/zapni.tv.php | iconv -f cp1252
person Steven Penny    schedule 15.06.2012
comment
Это означает, что веб-страница закодирована не в UTF-8, а в кодировке CP1252. - person ak2; 15.06.2012

Я использую стандартный cygwin в Mintty, и мой язык установлен как LANG=en_US.UTF-8, и у меня он работает нормально (к сожалению, наш прокси-сервер блокирует сайт, на который вы ссылаетесь, поэтому я не могу это проверить). Дополнительные сведения см. в разделе Интернационализация в документации по cygwin.

Редактировать: проверено, что этот UTF-8 правильно отображается в minty:

$ cat /d/temp/test.txt                                                                                                              
Creds Go here®
person AlG    schedule 15.06.2012
comment
Вы используете minty или модифицированную командную строку? Я только что убедился, что все еще правильно вижу UTF-8 в минти. У меня было много проблем с правильным набором символов в cmd. - person AlG; 15.06.2012
comment
Странно, я знаю, что это отлично работает в Cyg (раньше это сводило меня с ума, когда это не так). Вы уверены, что wget правильно загружает файл? - person AlG; 15.06.2012
comment
@svnpenn: перейдите к параметрам MinTTY в разделе «Текст». Выбран ли UTF-8 в раскрывающемся списке «Набор символов»? Кроме того, вы выбрали подходящий шрифт? Я рекомендую Lucida Console или DejaVu Sans Mono. Многие в остальном хорошие шрифты не имеют подходящего широкого набора символов для использования в качестве консольного шрифта, особенно когда вы работаете с UTF-8. - person Warren Young; 15.06.2012