Я пишу программу, которая загружает веб-страницы. Он отлично работает для большинства веб-страниц, но я нашел несколько страниц, на которых он не работает.
Эти страницы содержат символы 0x00.
Я могу читать содержимое страницы до этого символа, но не содержимое после.
Я использую эту часть кода для чтения ответа:
IAsyncResult ar = null;
HttpWebResponse resp = null;
Stream responseStream = null;
String content = null;
...
resp = (HttpWebResponse)req.EndGetResponse(ar);
responseStream = resp.GetResponseStream();
StreamReader sr = new StreamReader(responseStream, Encoding.UTF8);
content = sr.ReadToEnd();
В этом примере я использую асинхронный запрос, но я пытаюсь использовать синхронный, и у меня такая же проблема.
Я также пробую это с тем же результатом:
HttpWebResponse resp = null;
Stream responseStream = null;
String content = new String();
...
responseStream = resp.GetResponseStream();
byte[] buffer = new byte[4096];
int bytesRead = 1;
while (bytesRead > 0)
{
bytesRead = responseStream.Read(buffer, 0, 4096);
content += Encoding.UTF8.GetString(buffer, 0, bytesRead);
}
например, проблема возникает для этого URL-адреса http://www.daz3d.com/i/search/searchsub?sstring=ps_tx1662b&_m=dps_tx1662b
спасибо за ваши ответы
Эуйесу