Mysql
 sql >> Baza danych >  >> RDS >> Mysql

Zapisz adres URL obrazu z wyszukiwarki Google do MySQL

Proponuję użyć Biblioteki DOM PHP . Jest bardzo potężny i umożliwia parsowanie dowolnej struktury DOM. Zapoznaj się z niektórymi przykładami i możesz je łatwo zaimplementować.

Chodzi o to, abyś przestudiował strukturę HTML strony zwróconej przez Google i odpowiednio wykorzystał bibliotekę DOM do parsowania określonych tagów. Z tego, co widzę, obrazy są zorganizowane jako <ul> i <li> tagi, takie jak:

<ul class="rg_ul" data-pg="1" data-cnt="6">
    <li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:231px;height:162px"></li>
    <li class="rg_li" style="width:218px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:216px;height:162px"></li>
    <li class="rg_li" style="width:217px;height:162px"></li>
</ul>

W każdym <li> tag istnieją dodatkowe tagi, z których jeden to <a> . Wydaje się, że ten tag ma 2 atrybuty — „imgrefurl” i „imgurl” — które mogą dać Ci obraz, którego potrzebujesz. Które z tych 2 atrybutów potrzebujesz, aby je odkryć.

Alternatywnie istnieje <img> tag w <li> który ma atrybut „src” zawierający rzeczywisty plik binarny obrazu. Więc możesz go również przeanalizować. Pamiętaj, że plik binarny dotyczy obrazu, który widzisz na stronie wyszukiwania, a nie rzeczywistego obrazu.

W przypadku niektórych wskaźników DOM ta metoda może być przydatna — http://www .php.net/manual/en/domelement.getelementsbytagname.php oraz http://www.php.net/manual/en/domelement. hasattribute.php - przeczytać wszystkie <li> tagi, a następnie przeanalizuj je za pomocą klasy „rg_li”.

Mam nadzieję, że powyższe ma sens



  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Zapytanie SQL dla łącznej liczby punktów w promieniu lokalizacji

  2. Ogólny błąd zabity w skrypcie PHP

  3. Dane Mysql do stylizowanej tabeli HTML

  4. PHP - Zagnieżdżona lista podzielona na parzyste kolumny (poprawka i aktualizacje)

  5. Kod błędu MySQL:1064. Wystąpił błąd w składni SQL