Permalänk
Medlem

DOMDocument tar bort htmltaggar?

Säg att jag vill rippa ut en nyhetsartikel på t ex. dn.se.
Denna gång tänkte jag använda mig xpath istället för regex.
Har dubbelkollat att xpath utrycket är korrekt och markerar artikeln inkl htmlformatering med XPather i Firefox.

Detta är koden jag använder:

$html = new DOMDocument(); @$html->loadHtmlFile( 'http://www.dn.se/sthlm/ranpengar-aterfinns-sallan-1.964561' ); $xpath = new DOMXPath($html); $queryResult = $xpath->evaluate('//*[@id="article"]'); echo $queryResult->item(0)->nodeValue;

Problemet är bara att utrycket strippar bort alla html-taggar ur förfrågningen!

Varför och hur får jag bort det?
Kanske finns det bättre sätt använd xpath i php än med DOMDocument?

EDIT: Det ordnade sig på annat håll

$html2 = new DOMDocument(); $html2->appendChild($html2->importNode($queryResult->item(0), true)); echo $html2->saveHTML();