• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

wyszukiwanie linku w kodzie html

Object Storage Arubacloud
0 głosów
91 wizyt
pytanie zadane 1 listopada 2023 w Python przez mark162 Początkujący (410 p.)

próbuje wyciągnąć link do zdjęcia z kodu html, lecz problem polega na tym że nazwa tej class-y co chce wyciągnąć występuje kilka razy w fragmencie innej class-y

img_tags = soup.find_all('img', class_='wp-post-image')

nazwa class-y której szukam: class="wp-post-image"
inna class-a : class="secondary-product-image attachment-woocommerce_thumbnail attachment-shop-catalog wp-post-image wp-post-image--secondary"

Jak to obejść ??

 

 

 

1 odpowiedź

0 głosów
odpowiedź 1 listopada 2023 przez VBService Ekspert (253,400 p.)
wybrane 1 listopada 2023 przez mark162
 
Najlepsza

Zalecam użycie metody select, bo w pewnym sensie metoda ta działa podobnie jak querySelectorAll w js-ie, więc możemy użyć selektorów css-owych.

img[class*="wp-post-image"]:not([class*="--secondary"])

Przykład js  [ kod on-line ]

<ul style="list-style: none">
  <li>
    <img src="https://picsum.photos/140/160?random=1" class="wp-post-image">
    <img src="https://picsum.photos/140/160?random=2" class="wp-post-image">
    <img src="https://picsum.photos/140/160?random=3" class="wp-post-image wp-post-image--secondary">
  </li>
  <li>
    <img src="https://picsum.photos/140/160?random=4" class="wp-post-image wp-post-image--secondary">
    <img src="https://picsum.photos/140/160?random=5" class="wp-post-image wp-post-image--secondary">
    <img src="https://picsum.photos/140/160?random=6" class="wp-post-image">
  </li>
  <li></li>
</ul>

<script>
  /*
    img[class*="wp-post-image"]:not([class*="--secondary"])
  */
  const images = [...document.querySelectorAll('img[class*="wp-post-image"]:not([class*="--secondary"])')];
  document.querySelector('ul li:last-child').innerHTML = images.map(img => img.src).join('<br>');
</script>

 

więc w python-ie powinno to zadziałać  [ kod on-line ]

images = soup.select('img[class*="wp-post-image"]:not([class*="--secondary"]')
for img in images:
    print(img)
    print(img['src'])
    print('-' * 70)

 

[ Beautifulsoup : Difference between .find() and .select() ]
[ CSS Selector Reference ]

Podobne pytania

0 głosów
0 odpowiedzi 496 wizyt
+2 głosów
1 odpowiedź 125 wizyt
pytanie zadane 16 grudnia 2019 w Python przez Marak123 Stary wyjadacz (11,190 p.)
0 głosów
1 odpowiedź 205 wizyt
pytanie zadane 18 grudnia 2022 w C i C++ przez Krloo Początkujący (480 p.)

92,579 zapytań

141,429 odpowiedzi

319,657 komentarzy

61,963 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...