Вопросы по теме 'jsoup'
Как извлечь абсолютный URL-адрес из относительных ссылок HTML с помощью Jsoup?
Я использую Jsoup для извлечения URL-адреса веб-страницы. Атрибут href этих URL относителен, например:
<a href="/text">example</a>
Вот моя попытка:
Document document = Jsoup.connect(url).get();
Elements results =...
17009 просмотров
schedule
11.06.2022
Пример JSoup для Android
Мне просто интересно, есть ли у кого-нибудь образец проекта eclipse с работающей реализацией JSoup? Я пытаюсь использовать его для извлечения информации с веб-сайтов и обошел весь Google, пытаясь заставить его работать, но не могу. Если бы...
23852 просмотров
schedule
24.07.2023
Jsoup.connect(url) всегда выдает исключение
Я разрабатываю приложение для Android, которое использует Jsoup для извлечения информации из Интернета.
Мой код такой:
public void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.main);...
2343 просмотров
schedule
05.04.2023
прогресс jsoup.connect/jsoup.parse
Я использую Jsoup в своем приложении для Android для анализа данных с веб-страницы. Я хочу показать ход
Jsoup.connect(...).get();
or
Jsoup.parse(....);
Как это сделать? Есть ли какой-либо метод, который вызывается автоматически,...
1093 просмотров
schedule
16.04.2022
Откуда загрузить сохраненный HTML в WebView?
Я хочу, чтобы мой WebView загрузил обработанный мной HTML, который будет сохранен в /klw.html. После этого я загружаю его с помощью mWebView.loadUrl("file:///android_asset/klw.html"); Но когда я пробую его в эмуляторе, он говорит: «Веб-страница...
444 просмотров
schedule
05.11.2022
Проблемы с использованием расширенного режима escape для вывода jsoup
Мне нужно преобразовать файл HTML, удалив из файла определенные теги. Для этого у меня есть что-то вроде этого -
import org.jsoup.Jsoup;
import org.jsoup.helper.Validate;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Entities;
import...
7925 просмотров
schedule
19.02.2023
Jsoup выбирает и повторяет все элементы
Я подключусь к URL-адресу через jsoup и получу все его содержимое, но дело в том, что если я выберу лайк,
doc.select("body")
он возвращает один элемент, но я хочу получить все элементы на странице и повторять их один за другим, например,...
47398 просмотров
schedule
26.05.2022
Использование Selector с JSOUP и DOM
После прочтения документации.
Я пришел к выводу, что метод селектора - это то, что мне нужно, чтобы иметь возможность сканировать различные источники html (например, веб-страницы) для получения определенных тегов.
Например. У меня есть список...
412 просмотров
schedule
02.12.2023
Jsoup: выбирать только ссылки с text() равным
Один из способов отобрать ссылки с помощью text(), равных некоторым предопределенным строкам, прост:
Elements links = document.getElementsByTag("a");
for (Element link : links) {
if (link.text().equals("So & so") ||...
1523 просмотров
schedule
02.03.2023
Документ JSoup отличается от источника страницы
У меня проблема при попытке проанализировать веб-страницу с помощью jSoup. Если я просматриваю исходный код страницы в Chrome, там есть все, что вы ожидаете, - полная страница. Однако, когда я подключаюсь к URL-адресу с помощью JSoup, документ Jsoup...
1049 просмотров
schedule
16.07.2023
Синтаксис Jsoup div[class=] работает, а синтаксис div.class — нет. Почему?
Для следующего фрагмента HTML:
<div class="class_one class_two class_three classfour classfive classsix">
some inner content
</div>
Следующий селектор Jsoup работает :
div[class=class_one class_two class_three classfour...
10776 просмотров
schedule
09.01.2023
Как добавить новый HTML-тег с помощью Jsoup?
У меня возникли проблемы с добавлением нового тега в мой документ. Например, у меня есть:
Document doc = Jsoup.parse(htmlString);
Element table = doc.select("table").first();
Теперь, если я хочу добавить <LINK> tag с атрибутами...
7332 просмотров
schedule
24.12.2022
Как я могу проанализировать XML из тега script в документе HTML?
Я использую Jsoup для очистки данных HTML с веб-сайта, но внутри тега javascript есть один раздел XML, который мне нужно получить, потому что у него есть куча URL-адресов, которые мне нужно извлечь и загрузить изображения. Вот как это выглядит:...
724 просмотров
schedule
05.11.2022
JSoup: получить элемент, который не содержит определенного атрибута
У меня есть таблица, содержащая следующую логику.
В таблице отображается список имен
Для каждой строки, содержащей <tr class=hiderow><td class=packagename>...</td></tr> -> эта строка не будет видна.
Таким образом,...
5666 просмотров
schedule
08.02.2023
Jsoup: сортировка элементов
Мне нужно отсортировать контейнер Jsoup Elements по его ownText(). Каков рекомендуемый способ сделать это?
Имеет ли смысл сначала преобразовать его в ArrayList для использования с пользовательским компаратором ?
Кстати, я попытался...
1471 просмотров
schedule
16.06.2023
Получить URL-адрес изображений в файле CSS с помощью Java?
Я пытаюсь получить URL-адреса для изображений (все типы MIME) в удаленном файле CSS с помощью Java.
Я использую jsoup для получения URL-адреса css.
После бесчисленных часов изучения парсера CSS я не смог разобраться из-за отсутствия...
2756 просмотров
schedule
16.07.2022
Как извлечь абзац с веб-сайта с помощью JSoup?
Мне нужно получить тело статьи из этого URL:
Заголовок Эгги
Я знаю, что статья находится внутри тегов div class="article-body". Как я могу извлечь его как строку?
588 просмотров
schedule
22.04.2022
Получение файла cookie после нажатия входа?
Привет, я делаю приложение для Android, для которого требуются данные, которые мне нужны для входа на веб-сайт. Я работал с JSoup раньше, поэтому я пытался использовать его для всего моего html-очистки здесь.
В основном поток вещей я иду на сайт...
337 просмотров
schedule
13.04.2022
Jsoup.connect() работает с Java, а не с Android
Я попробовал пример Jsoup.connect() , приведенный на веб-сайте Jsoup, и он отлично работает на Java.
По какой-то причине я не могу заставить его работать в проектах Android (Eclipse), хотя я разрешаю доступ в Интернет в моем файле AndroidManifest...
10829 просмотров
schedule
25.09.2022
Импорт org.jsoup не может быть разрешен
Я думал, что у меня это отлично работает, но, видимо, нет. Я оставил свой проект в отпуске, затем, когда я вернулся и попытался открыть его, я получаю:
Импорт org.jsoup не может быть разрешен
во всех файлах, которые имеют этот импорт....
10953 просмотров
schedule
05.07.2022