Hoe krijg ik innerHTML van DOMNode?

Welke functie gebruik je om innerHTML van een bepaalde DOMNode op te halen in de PHP DOM-implementatie? Kan iemand een betrouwbare oplossing geven?

Natuurlijk voldoet outerHTML ook.


Antwoord 1, autoriteit 100%

Vergelijkdeze bijgewerkte variant met PHP handleiding gebruiker opmerking #89718:

<?php 
function DOMinnerHTML(DOMNode $element) 
{ 
    $innerHTML = ""; 
    $children  = $element->childNodes;
    foreach ($children as $child) 
    { 
        $innerHTML .= $element->ownerDocument->saveHTML($child);
    }
    return $innerHTML; 
} 
?> 

Voorbeeld:

<?php 
$dom= new DOMDocument(); 
$dom->preserveWhiteSpace = false;
$dom->formatOutput       = true;
$dom->load($html_string); 
$domTables = $dom->getElementsByTagName("table"); 
// Iterate over DOMNodeList (Implements Traversable)
foreach ($domTables as $table) 
{ 
    echo DOMinnerHTML($table); 
} 
?> 

Antwoord 2, autoriteit 19%

Hier is een versie in een functionele programmeerstijl:

function innerHTML($node) {
    return implode(array_map([$node->ownerDocument,"saveHTML"], 
                             iterator_to_array($node->childNodes)));
}

Antwoord 3, autoriteit 9%

Om de htmlvan een element te retourneren, kun je gebruiken C14N():

$dom = new DOMDocument();
$dom->loadHtml($html);
$x = new DOMXpath($dom);
foreach($x->query('//table') as $table){
    echo $table->C14N();
}

Antwoord 4, autoriteit 5%

Een vereenvoudigde versie van het antwoord van Haim Evgi:

<?php
function innerHTML(\DOMElement $element)
{
    $doc = $element->ownerDocument;
    $html = '';
    foreach ($element->childNodes as $node) {
        $html .= $doc->saveHTML($node);
    }
    return $html;
}

Voorbeeld van gebruik:

<?php
$doc = new \DOMDocument();
$doc->loadHTML("<body><div id='foo'><p>This is <b>an <i>example</i></b> paragraph<br>\n\ncontaining newlines.</p><p>This is another paragraph.</p></div></body>");
print innerHTML($doc->getElementById('foo'));
/*
<p>This is <b>an <i>example</i></b> paragraph<br>
containing newlines.</p>
<p>This is another paragraph.</p>
*/

Het is niet nodig om preserveWhiteSpaceof formatOutputin te stellen.


Antwoord 5, autoriteit 2%

Naast de mooie versie van trincot met array_mapen implodemaar deze keer met array_reduce:

return array_reduce(
   iterator_to_array($node->childNodes),
   function ($carry, \DOMNode $child) {
        return $carry.$child->ownerDocument->saveHTML($child);
   }
);

Begrijp nog steeds niet waarom er geen reduce()methode is die zowel arrays als iterators accepteert.


Antwoord 6, autoriteit 2%

function setnodevalue($doc, $node, $newvalue){
  while($node->childNodes->length> 0){
    $node->removeChild($node->firstChild);
  }
  $fragment= $doc->createDocumentFragment();
  $fragment->preserveWhiteSpace= false;
  if(!empty($newvalue)){
    $fragment->appendXML(trim($newvalue));
    $nod= $doc->importNode($fragment, true);
    $node->appendChild($nod);
  }
}

Antwoord 7

Oude query, maar er is een ingebouwde methode om dat te doen. Geef het doelknooppunt gewoon door aan DomDocument->saveHtml().

Volledig voorbeeld:

$html = '<div><p>ciao questa è una <b>prova</b>.</p></div>';
$dom = new DomDocument($html);
@$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
$node = $xpath->query('.//div/*'); // with * you get inner html without surrounding div tag; without * you get inner html with surrounding div tag
$innerHtml = $dom->saveHtml($node);
var_dump($innerHtml);

Uitvoer: <p>ciao questa è una <b>prova</b>.</p>


Antwoord 8

Voor mensen die de HTML uit de XPath-query willen halen, hier is mijn versie:

$xpath = new DOMXpath( $my_dom_object );
$DOMNodeList = $xpath->query('//div[contains(@class, "some_custom_class_in_html")]');
if( $DOMNodeList->count() > 0 ) {
    $page_html = $my_dom_object->saveHTML( $DOMNodeList->item(0) );
}

Other episodes