Я хочу собрать вопросы из Quora, связанные с какой-то конкретной темой, на которую есть более 4 ответов или около того.
Я хочу найти
а) Количество ответов
б) теги, связанные с каждым вопросом
Это моя программа:
res=requests.get("https://www.quora.com/How-does-Quora-automatically-know-what-tags-to-put-for-a-question")
soup=BeautifulSoup(res.text, 'lxml')
# All the ans inside pagedlist_item
ans=soup.find_all('div', {'class' : 'pagedlist_item'})
#Question Name inside question_text_edit
qname=soup.find('div', {'class' : 'question_text_edit'})
#qnam=soup.find('div', {'class' : 'question_text_edit'})
#Tag of Question
tags=soup.find('div', {'class' : 'QuestionTopicHorizontalList TopicList'})
#checking to see if "TV" is the tag of the question in the current webpage
#Also, checking if no. of answers of the given question >=4, if yes then print the question
#logic for checking the conditions
no_ans=0;
if "TV" in tags.text:
print(i.text)
for a in ans:
no_ans=no_ans+1
if no_ans>=4:
print(qname.text)
Я хочу выполнить поиск по многим таким страницам с тегом TV
, а затем выполнить проверку этих страниц, чтобы удовлетворить вышеуказанному условию.
Логика проверки условий присутствует в конце кода. Но это будет работать только для одного вопроса на веб-странице, адрес которой находится внутри функции requests.get("")
.
Как я могу позволить коду автоматически перебирать многие веб-страницы (несколько вопросов) с тегом «ТВ», а не передавать адрес одной веб-страницы в функцию requests.get("")
?
Кроме того, я хочу очистить несколько вопросов (до 40 или около того).
curl
- person Sembei Norimaki   schedule 18.12.2018BeautifulSoup
помочь мне в этом? - person ajaysinghnegi   schedule 18.12.2018downvotes
даже послеEDIT
!! - person ajaysinghnegi   schedule 21.12.2018