Mit PHP Seite crawlen

  • Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

philodance

Mitglied
7 Juli 2012
36
0
6
Wenn ich https://www.tutti.ch/de/vi/zaurich/...-unterteller-arv-ikea-blaue-streifen/27002681 im Browser anschau, seh ich ganz was anderes, als wenn ich die Seite mit

file_get_contents(...) oder

$agent= 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_URL,...);
die(curl_exec($ch));

einles. Wie kann ich mit PHP auf den Inhalt (wie im Browser) zugreifen / lesen?
 

scbawik

Senior HTML'ler
14 Juli 2011
2.552
448
83
Wenn ich https://www.tutti.ch/de/vi/zaurich/...-unterteller-arv-ikea-blaue-streifen/27002681 im Browser anschau, seh ich ganz was anderes, als wenn ich die Seite mit

file_get_contents(...) oder

$agent= 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.0.3705; .NET CLR 1.1.4322)';
$ch = curl_init();
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_VERBOSE, true);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, $agent);
curl_setopt($ch, CURLOPT_URL,...);
die(curl_exec($ch));

einles. Wie kann ich mit PHP auf den Inhalt (wie im Browser) zugreifen / lesen?

Du bekommst schon die gleiche Response, da du das ganze aber im Browser ausgibst, wird auch das JS ausgeführt, welches den Seiteninhalt ändert. Wenn du das im Browser ansehen willst, braucht es:

PHP:
die(htmlspecialchars(curl_exec($ch)));
 
Werbung: