Я хочу удалить все изображения с HTML-страницы (фактически пользовательский ввод tinymce), которые не соответствуют определенным критериям (класс = "int" или класс = "ext"), и я борюсь с правильным подходом. Вот что я делаю до сих пор:
hbody = Hpricot(input)
@internal_images = hbody.search("//img[@class='int']")
@external_images = hbody.search("//img[@class='ext']")
Но я не знаю, как найти изображения, где класс имеет неправильное значение (не «int» или «ext»).
Мне также приходится перебирать элементы, чтобы проверять другие атрибуты, которые не являются стандартными html (я использую их для установки внутренних значений, таких как идентификатор БД, который я устанавливаю в атрибуте dbsrc). Могу ли я также получить доступ к этим атрибутам и есть ли способ удалить определенные элементы (которые находятся в результатах поиска hpricot), если они не соответствуют моим критериям?
Спасибо за вашу помощь!