myGully.com

myGully.com (https://mygully.com/index.php)
-   Programmierung (https://mygully.com/forumdisplay.php?f=67)
-   -   Webseite auslesen (https://mygully.com/showthread.php?t=2091503)

kpdkasw 06.08.10 12:36

Webseite auslesen
 
Hi,

ich möchte eine webseite auslesen und bestimmte teile auf meiner webseite wiedergeben.

Soweit bin ich bereits:
PHP-Code:

echo GetBetween(file_get_contents("http://eineurl.de"), '<td><a href="''"><img src');
echo 
GetBetween(file_get_contents("http://eineurl.de"), '</font>''</td>');

function 
GetBetween($content,$start,$end){
    
$r explode($start$content);
    if (isset(
$r[1])){
        
$r explode($end$r[1]);
        return 
$r[0];
    }
    return 
'';


Das problem ist nur das ich alle inhalte der seite auslesen und wiedergeben möchte.

Ich hoffe ihr könnt mir helfen mfg kpdkasw (bin ANFÄNGER)

urga 06.08.10 18:15

a) 2x file_get_contents die die gleiche datei/url aufzurufen ist recht ineffizient...
$html = file_get_contents("http://eineurl.de"); tut's auch.

b) für das was du machen möchtest solltest du dich in reguläre ausdrücke einarbeiten und dann mit
[Link nur für registrierte und freigeschaltete Mitglieder sichtbar. Jetzt registrieren...] arbeiten.
sehr hilfreich dabei:
[Link nur für registrierte und freigeschaltete Mitglieder sichtbar. Jetzt registrieren...] und
[Link nur für registrierte und freigeschaltete Mitglieder sichtbar. Jetzt registrieren...]

c) fang erstmal klein an, per
PHP-Code:

function __debug ($o) {
 echo 
'<pre>';
 
print_r ($o);
 echo 
'</pre>';
}

$html '<td><a href="URL1" class="yy" andere="blabla"><img src="IMG1" class="xx" andere_attribs="xxx"></td><td><a href="URL2"><img src="IMG2" class="xx" andere_attribs="xxx"></td><td><a href="URL3"><img src="IMG3" class="xx" andere_attribs="xxx"></td>';

$regex '/<td><a href="([^"]+)"[^>]*><img src="/im';
$wieviel preg_match_all ($regex$html$gefunden);
echo 
"habe $wieviel gefunden:<br>\n";
__debug ($gefunden[1]); 

und erweitere das $html und die regex, bis es alle fälle abdeckt. dann erst zieh' $html per file_get_contents.

am besten du gönnst dir erstmal 2-3 volle tage reguläre ausdrücke zu erforschen. die brauchst du eh' (fast) immer.


Alle Zeitangaben in WEZ +1. Es ist jetzt 02:05 Uhr.

Powered by vBulletin® (Deutsch)
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.