• Najnowsze pytania
  • Bez odpowiedzi
  • Zadaj pytanie
  • Kategorie
  • Tagi
  • Zdobyte punkty
  • Ekipa ninja
  • IRC
  • FAQ
  • Regulamin
  • Książki warte uwagi

Parsowanie niestandardowych XML

Hosting forpsi easy 1 pln
0 głosów
355 wizyt
pytanie zadane 7 lutego 2018 w JavaScript przez Anoonymous Obywatel (1,560 p.)

Próbuję parsować pliki XML za pomocą cheerio na backendzie (Node), wszystko działa fajnie, gdy mam domyślny rss tzn np.: 

rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:wfw="http://wellformedweb.org/CommentAPI/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:sy="http://purl.org/rss/1.0/modules/syndication/" xmlns:slash="http://purl.org/rss/1.0/modules/slash/" version="2.0">
<channel>
<title>
xxxx</title>
<link>xxxx</link>
<atom:link href="xxxx" rel="self" type="application/rss+xml"/>
<description>
xxxx</description>
<language>pl-PL</language>
<item>
<title>
xxxx
</title>
<link>
xxxx
</link>
<guid isPermaLink="false">
xxxx
</guid>
<pubDate>Wed, 07 Feb 2018 18:46:33 +0100</pubDate>
<description>
xxx
</description>
</item>
<item>
<title>
xxxx</title>
<link>
xxxx</link>
<guid isPermaLink="false">
xxx</guid>
<pubDate>Wed, 07 Feb 2018 17:46:58 +0100</pubDate>
<description>
<![CDATA[
xxx]]>
</description>
</item>

Problem zaczyna się w przypadku, gdy owy rss wygląda np. tak (Jekyll):

<feed xmlns="http://www.w3.org/2005/Atom">
<generator uri="https://jekyllrb.com/" version="3.6.0.pre.beta1">Jekyll</generator>
<link href="xxx" rel="self" type="application/atom+xml"/>
<link href="xxxx" rel="alternate" type="text/html"/>
<updated>xxxx</updated>
<id>xxxx</id>
<title type="html">xxxx</title>
<subtitle>
xxx</subtitle>
<entry>
<title type="html">xxx</title>
<published>xxx</published>
<updated>xxxx</updated>
<id>
xxxx
</id>
<content type="html" xml:base="xxx">
xxx
</content>
<author>
<name>xxx</name>
</author>
<summary type="html">
...

Mogę w jakiś sposób 'uniwersalnie' parsować dane bez względu na strukturę, albo chociaż jakoś wykryć jaka ona jest i zastosować odpowiedni schemat?

Zaloguj lub zarejestruj się, aby odpowiedzieć na to pytanie.

Podobne pytania

0 głosów
1 odpowiedź 985 wizyt
pytanie zadane 27 października 2016 w JavaScript przez Newperty Początkujący (280 p.)
0 głosów
0 odpowiedzi 122 wizyt
pytanie zadane 26 października 2020 w Inne języki przez Lyokoheros Początkujący (340 p.)
0 głosów
1 odpowiedź 274 wizyt
pytanie zadane 14 sierpnia 2017 w C i C++ przez niezalogowany

92,087 zapytań

140,745 odpowiedzi

317,708 komentarzy

61,408 pasjonatów

Motyw:

Akcja Pajacyk

Pajacyk od wielu lat dożywia dzieci. Pomóż klikając w zielony brzuszek na stronie. Dziękujemy! ♡

Oto polecana książka warta uwagi.
Pełną listę książek znajdziesz tutaj.

Akademia Sekuraka

Akademia Sekuraka 2024 zapewnia dostęp do minimum 15 szkoleń online z bezpieczeństwa IT oraz dostęp także do materiałów z edycji Sekurak Academy z roku 2023!

Przy zakupie możecie skorzystać z kodu: pasja-akademia w koszyku, uzyskując rabat aż -50% (jeszcze tylko dziś 30.11 z okazji Black Week, a potem będzie to 30%) na bilety w wersji "Standard"! Więcej informacji na temat akademii znajdziecie tutaj. Dziękujemy Sekurakowi za tak fajną zniżkę dla Pasjonatów!

Akademia Sekuraka

Niedawno wystartował dodruk tej świetnej, rozchwytywanej książki (około 940 stron). Mamy dla Was kod: pasja (wpiszcie go w koszyku), dzięki któremu otrzymujemy 15% zniżki - dziękujemy zaprzyjaźnionej ekipie Sekuraka za taki bonus dla Pasjonatów! Książka to pierwszy tom z serii o ITsec, który łagodnie wprowadzi w świat bezpieczeństwa IT każdą osobę - warto, polecamy!

...