Вопросы по теме 'jsoup'

Как извлечь абсолютный URL-адрес из относительных ссылок HTML с помощью Jsoup?
Я использую Jsoup для извлечения URL-адреса веб-страницы. Атрибут href этих URL относителен, например: <a href="/text">example</a> Вот моя попытка: Document document = Jsoup.connect(url).get(); Elements results =...
17009 просмотров
schedule 11.06.2022

Пример JSoup для Android
Мне просто интересно, есть ли у кого-нибудь образец проекта eclipse с работающей реализацией JSoup? Я пытаюсь использовать его для извлечения информации с веб-сайтов и обошел весь Google, пытаясь заставить его работать, но не могу. Если бы...
23852 просмотров
schedule 24.07.2023

Jsoup.connect(url) всегда выдает исключение
Я разрабатываю приложение для Android, которое использует Jsoup для извлечения информации из Интернета. Мой код такой: public void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout.main);...
2343 просмотров
schedule 05.04.2023

прогресс jsoup.connect/jsoup.parse
Я использую Jsoup в своем приложении для Android для анализа данных с веб-страницы. Я хочу показать ход Jsoup.connect(...).get(); or Jsoup.parse(....); Как это сделать? Есть ли какой-либо метод, который вызывается автоматически,...
1093 просмотров
schedule 16.04.2022

Откуда загрузить сохраненный HTML в WebView?
Я хочу, чтобы мой WebView загрузил обработанный мной HTML, который будет сохранен в /klw.html. После этого я загружаю его с помощью mWebView.loadUrl("file:///android_asset/klw.html"); Но когда я пробую его в эмуляторе, он говорит: «Веб-страница...
444 просмотров
schedule 05.11.2022

Проблемы с использованием расширенного режима escape для вывода jsoup
Мне нужно преобразовать файл HTML, удалив из файла определенные теги. Для этого у меня есть что-то вроде этого - import org.jsoup.Jsoup; import org.jsoup.helper.Validate; import org.jsoup.nodes.Document; import org.jsoup.nodes.Entities; import...
7925 просмотров
schedule 19.02.2023

Jsoup выбирает и повторяет все элементы
Я подключусь к URL-адресу через jsoup и получу все его содержимое, но дело в том, что если я выберу лайк, doc.select("body") он возвращает один элемент, но я хочу получить все элементы на странице и повторять их один за другим, например,...
47398 просмотров
schedule 26.05.2022

Использование Selector с JSOUP и DOM
После прочтения документации. Я пришел к выводу, что метод селектора - это то, что мне нужно, чтобы иметь возможность сканировать различные источники html (например, веб-страницы) для получения определенных тегов. Например. У меня есть список...
412 просмотров
schedule 02.12.2023

Jsoup: выбирать только ссылки с text() равным
Один из способов отобрать ссылки с помощью text(), равных некоторым предопределенным строкам, прост: Elements links = document.getElementsByTag("a"); for (Element link : links) { if (link.text().equals("So & so") ||...
1523 просмотров
schedule 02.03.2023

Документ JSoup отличается от источника страницы
У меня проблема при попытке проанализировать веб-страницу с помощью jSoup. Если я просматриваю исходный код страницы в Chrome, там есть все, что вы ожидаете, - полная страница. Однако, когда я подключаюсь к URL-адресу с помощью JSoup, документ Jsoup...
1049 просмотров
schedule 16.07.2023

Синтаксис Jsoup div[class=] работает, а синтаксис div.class — нет. Почему?
Для следующего фрагмента HTML: <div class="class_one class_two class_three classfour classfive classsix"> some inner content </div> Следующий селектор Jsoup работает : div[class=class_one class_two class_three classfour...
10776 просмотров
schedule 09.01.2023

Как добавить новый HTML-тег с помощью Jsoup?
У меня возникли проблемы с добавлением нового тега в мой документ. Например, у меня есть: Document doc = Jsoup.parse(htmlString); Element table = doc.select("table").first(); Теперь, если я хочу добавить <LINK> tag с атрибутами...
7332 просмотров
schedule 24.12.2022

Как я могу проанализировать XML из тега script в документе HTML?
Я использую Jsoup для очистки данных HTML с веб-сайта, но внутри тега javascript есть один раздел XML, который мне нужно получить, потому что у него есть куча URL-адресов, которые мне нужно извлечь и загрузить изображения. Вот как это выглядит:...
724 просмотров
schedule 05.11.2022

JSoup: получить элемент, который не содержит определенного атрибута
У меня есть таблица, содержащая следующую логику. В таблице отображается список имен Для каждой строки, содержащей <tr class=hiderow><td class=packagename>...</td></tr> -> эта строка не будет видна. Таким образом,...
5666 просмотров
schedule 08.02.2023

Jsoup: сортировка элементов
Мне нужно отсортировать контейнер Jsoup Elements по его ownText(). Каков рекомендуемый способ сделать это? Имеет ли смысл сначала преобразовать его в ArrayList для использования с пользовательским компаратором ? Кстати, я попытался...
1471 просмотров
schedule 16.06.2023

Получить URL-адрес изображений в файле CSS с помощью Java?
Я пытаюсь получить URL-адреса для изображений (все типы MIME) в удаленном файле CSS с помощью Java. Я использую jsoup для получения URL-адреса css. После бесчисленных часов изучения парсера CSS я не смог разобраться из-за отсутствия...
2756 просмотров
schedule 16.07.2022

Как извлечь абзац с веб-сайта с помощью JSoup?
Мне нужно получить тело статьи из этого URL: Заголовок Эгги Я знаю, что статья находится внутри тегов div class="article-body". Как я могу извлечь его как строку?
588 просмотров
schedule 22.04.2022

Получение файла cookie после нажатия входа?
Привет, я делаю приложение для Android, для которого требуются данные, которые мне нужны для входа на веб-сайт. Я работал с JSoup раньше, поэтому я пытался использовать его для всего моего html-очистки здесь. В основном поток вещей я иду на сайт...
337 просмотров

Jsoup.connect() работает с Java, а не с Android
Я попробовал пример Jsoup.connect() , приведенный на веб-сайте Jsoup, и он отлично работает на Java. По какой-то причине я не могу заставить его работать в проектах Android (Eclipse), хотя я разрешаю доступ в Интернет в моем файле AndroidManifest...
10829 просмотров
schedule 25.09.2022

Импорт org.jsoup не может быть разрешен
Я думал, что у меня это отлично работает, но, видимо, нет. Я оставил свой проект в отпуске, затем, когда я вернулся и попытался открыть его, я получаю: Импорт org.jsoup не может быть разрешен во всех файлах, которые имеют этот импорт....
10953 просмотров
schedule 05.07.2022