Witam wszystkich. Z góry przepraszam, jeśli błędnie napisałem/umieściłem post.
Mój problem prezentuje się następująco: Programistycznie jestem absolutnie zielony. Potrzebuję na studia skonstruować bazę danych na podstawie której później będę robił różne analizy. Kod nie musi być piękny, najważniejsze bym osiągnął cel. Po długim przeszukiwaniu internetu udało mi się w końcu utworzyć kod, dzięki któremu scrapuję konkretną daną tekstową (wykorzystuję serwis otodom.pl). Na przykładzie konkretnej aukcji, chcę z niej wyciągnąć informację o tym, na którym piętrze znajduje się mieszkanie:
import requests
from lxml import html
url = "https://www.otodom.pl/59646415"
response = requests.get(url)
byte_data = response.content
source_code = html.fromstring(byte_data)
xpath_dana = '/html/body/div[1]/article/div[3]/div[1]/section[1]/div/ul/li[5]/strong'
tree_dana = source_code.xpath(xpath_dana)
if len(tree_dana) != 0:
dana = tree_dana[0].text_content()
print(dana)
Wynik: parter. A więc wszystko się zgadza.
Problem pojawił się, gdy chciałem wyciągnąć współrzędne korzystając z mapki Google. Współrzędne te odnalazłem po kliknięciu "zbadaj", w adresie URL prowadzącym do tej mapki:
Mając ten link będę już w stanie wyciągnąć z niego współrzędne.
Klikając "Copy Xpath" otrzymuję: /html/body/div[1]/article/div[3]/div[1]/section[4]/div/div/div/div/div[1]/div/div/div/div[2]/a
Mam jednak świadomość, że wklejając tą ścieżkę do kodu, w wyniku nie dostanę widocznego wyżej adresu. Przeszukując internet znalazłem informacje, że należy na końcu dodać /@href. Niestety, ta opcja, ani żadna podobna typu:
/html/body/div[1]/article/div[3]/div[1]/section[4]/div/div/div/div/div[1]/div/div/div/div[2]//a/@href
również nie działają, wynik jest pusty.
Czy jest jakieś rozwiązanie tego problemu? Z góry dziękuję za każdą pomoc.