• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Parsowanie niestandardowych XML

Object Storage Arubacloud
0 głosów
360 wizyt
pytanie zadane 7 lutego 2018 w JavaScript przez Anoonymous Obywatel (1,560 p.)

Próbuję parsować pliki XML za pomocą cheerio na backendzie (Node), wszystko działa fajnie, gdy mam domyślny rss tzn np.: 

rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" version="2.0">
<channel>
<title>
xxxx</title>
<link>xxxx</link>
<atom:link href="xxxx" rel="self" type="application/rss+xml"/>
<description>
xxxx</description>
<language>pl-PL</language>
<item>
<title>
xxxx
</title>
<link>
xxxx
</link>
<guid isPermaLink="false">
xxxx
</guid>
<pubDate>Wed, 07 Feb 2018 18:46:33 +0100</pubDate>
<description>
xxx
</description>
</item>
<item>
<title>
xxxx</title>
<link>
xxxx</link>
<guid isPermaLink="false">
xxx</guid>
<pubDate>Wed, 07 Feb 2018 17:46:58 +0100</pubDate>
<description>
<![CDATA[
xxx]]>
</description>
</item>

Problem zaczyna się w przypadku, gdy owy rss wygląda np. tak (Jekyll):

<feed xmlns="http://www.w3.org/2005/Atom">
<generator uri="https://jekyllrb.com/" version="3.6.0.pre.beta1">Jekyll</generator>
<link href="xxx" rel="self" type="application/atom+xml"/>
<link href="xxxx" rel="alternate" type="text/html"/>
<updated>xxxx</updated>
<id>xxxx</id>
<title type="html">xxxx</title>
<subtitle>
xxx</subtitle>
<entry>
<title type="html">xxx</title>
<published>xxx</published>
<updated>xxxx</updated>
<id>
xxxx
</id>
<content type="html" xml:base="xxx">
xxx
</content>
<author>
<name>xxx</name>
</author>
<summary type="html">
...

Mogę w jakiś sposób 'uniwersalnie' parsować dane bez względu na strukturę, albo chociaż jakoś wykryć jaka ona jest i zastosować odpowiedni schemat?

Zaloguj lub zarejestruj się, aby odpowiedzieć na to pytanie.

Podobne pytania

0 głosów
1 odpowiedź 1,060 wizyt
pytanie zadane 27 października 2016 w JavaScript przez Newperty Początkujący (280 p.)
0 głosów
0 odpowiedzi 132 wizyt
pytanie zadane 26 października 2020 w Inne języki przez Lyokoheros Początkujący (340 p.)
0 głosów
1 odpowiedź 284 wizyt
pytanie zadane 14 sierpnia 2017 w C i C++ przez niezalogowany

92,573 zapytań

141,423 odpowiedzi

319,648 komentarzy

61,959 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Kolejna edycja największej imprezy hakerskiej w Polsce, czyli Mega Sekurak Hacking Party odbędzie się już 20 maja 2024r. Z tej okazji mamy dla Was kod: pasjamshp - jeżeli wpiszecie go w koszyku, to wówczas otrzymacie 40% zniżki na bilet w wersji standard!

Więcej informacji na temat imprezy znajdziecie tutaj. Dziękujemy ekipie Sekuraka za taką fajną zniżkę dla wszystkich Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 10% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...