Я пытаюсь использовать BeautifulSoup для извлечения текста из гида по концертам со списками по жанрам. Я совершенно новичок в этом, и я обнаружил, что могу вернуть список жанров и полный список названий концертов, но, конечно, я хочу вернуть только названия концертов, связанные с определенным жанром (и затем перейти к следующий жанр и выбрать его названия концертов и т. д.) Исходный код руководства по концертам выглядит следующим образом:
<h3>indie</h3>
<span class="gig-title"><a href="/gig/BandA">BandA</a></span>
<span class="gig-title"><a href="/gig/BandB">BandB</a></span>
<span class="gig-title"><a href="/gig/BandC">BandC</a></span>
<h3>jazz</h3>
<span class="gig-title"><a href="/gig/BandD">BandD</a></span>
<span class="gig-title"><a href="/gig/BandE">BandE</a></span>
Я могу найти все жанры и названия концертов примерно так:
genres = soup.find_all("h3")
for genre in genres:
titles = soup.find_all("span","gig-title")
for title in titles:
gig = title.a.string
Но я просто хочу вернуть текст: "BandA", "BandB", "BandC" - это текст между двумя тегами h3 (жанр), прежде чем перейти к следующему жанру.
Как я могу подойти к этой проблеме?