• Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

Mit PHP Seite crawlen

philodance

Mitglied
Wenn ich https://www.tutti.ch/de/vi/zaurich/...-unterteller-arv-ikea-blaue-streifen/27002681 im Browser anschau, seh ich ganz was anderes, als wenn ich die Seite mit

file_get_contents(...) oder

$agent= 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_URL,...);
die(curl_exec($ch));

einles. Wie kann ich mit PHP auf den Inhalt (wie im Browser) zugreifen / lesen?
 
Werbung:
Wenn ich https://www.tutti.ch/de/vi/zaurich/...-unterteller-arv-ikea-blaue-streifen/27002681 im Browser anschau, seh ich ganz was anderes, als wenn ich die Seite mit

file_get_contents(...) oder

$agent= 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_URL,...);
die(curl_exec($ch));

einles. Wie kann ich mit PHP auf den Inhalt (wie im Browser) zugreifen / lesen?

Du bekommst schon die gleiche Response, da du das ganze aber im Browser ausgibst, wird auch das JS ausgeführt, welches den Seiteninhalt ändert. Wenn du das im Browser ansehen willst, braucht es:

PHP:
die(htmlspecialchars(curl_exec($ch)));
 
Zurück
Oben