Я просто хочу получить исходный код любой веб-страницы из Java. На данный момент я нашел множество решений, но не смог найти ни одного кода, который работал бы для всех ссылок ниже:
- http://www.cumhuriyet.com.tr?hn=298710
- http://www.fotomac.com.tr/Yazarlar/Olcay%20%C3%87ak%C4%B1r/2011/11/23/hesap-makinesi
- http://www.sabah.com.tr/Gundem/2011/12/23/basbakan-konferansta-konusuyor#
Основная проблема для меня в том, что некоторые коды извлекают исходный код веб-страницы, но с отсутствующими. Например, приведенный ниже код не работает для первой ссылки.
InputStream is = fURL.openStream(); //fURL can be one of the links above
BufferedReader buffer = null;
buffer = new BufferedReader(new InputStreamReader(is, "iso-8859-9"));
int byteRead;
while ((byteRead = buffer.read()) != -1) {
builder.append((char) byteRead);
}
buffer.close();
System.out.println(builder.toString());