Proponuję użyć Biblioteki DOM PHP . Jest bardzo potężny i umożliwia parsowanie dowolnej struktury DOM. Zapoznaj się z niektórymi przykładami i możesz je łatwo zaimplementować.
Chodzi o to, abyś przestudiował strukturę HTML strony zwróconej przez Google i odpowiednio wykorzystał bibliotekę DOM do parsowania określonych tagów. Z tego, co widzę, obrazy są zorganizowane jako <ul>
i <li>
tagi, takie jak:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
W każdym <li>
tag istnieją dodatkowe tagi, z których jeden to <a>
. Wydaje się, że ten tag ma 2 atrybuty — „imgrefurl” i „imgurl” — które mogą dać Ci obraz, którego potrzebujesz. Które z tych 2 atrybutów potrzebujesz, aby je odkryć.
Alternatywnie istnieje <img>
tag w <li>
który ma atrybut „src” zawierający rzeczywisty plik binarny obrazu. Więc możesz go również przeanalizować. Pamiętaj, że plik binarny dotyczy obrazu, który widzisz na stronie wyszukiwania, a nie rzeczywistego obrazu.
W przypadku niektórych wskaźników DOM ta metoda może być przydatna — http://www .php.net/manual/en/domelement.getelementsbytagname.php
oraz http://www.php.net/manual/en/domelement. hasattribute.php
- przeczytać wszystkie <li>
tagi, a następnie przeanalizuj je za pomocą klasy „rg_li”.
Mam nadzieję, że powyższe ma sens