 sql >> Baza danych >  >> RDS >> Mysql

Jak mogę używać cURL do otwierania wielu adresów URL jednocześnie z PHP?

Konfigurujesz każdy uchwyt cURL w ten sam sposób, a następnie dodajesz je do curl_multi_ uchwyt. Funkcje, na które należy spojrzeć, to curl_multi_* funkcje udokumentowane tutaj . Z mojego doświadczenia wynika jednak, że wystąpiły problemy z próbą załadowania zbyt wielu adresów URL na raz (choć w tej chwili nie mogę znaleźć swoich notatek na ten temat), więc ostatnim razem użyłem curl_mutli_ , ustawiłem go tak, aby robił partie 5 adresów URL naraz.

edytuj :Oto zmniejszona wersja kodu, którego używam, używając curl_multi_ :

edytuj :Lekko przepisany i wiele dodanych komentarzy, które miejmy nadzieję pomogą.

// -- create all the individual cURL handles and set their options
$curl_handles = array();
foreach ($urls as $url) {
    $curl_handles[$url] = curl_init();
    curl_setopt($curl_handles[$url], CURLOPT_URL, $url);
    // set other curl options here

// -- start going through the cURL handles and running them
$curl_multi_handle = curl_multi_init();

$i = 0; // count where we are in the list so we can break up the runs into smaller blocks
$block = array(); // to accumulate the curl_handles for each group we'll run simultaneously

foreach ($curl_handles as $a_curl_handle) {
    $i++; // increment the position-counter

    // add the handle to the curl_multi_handle and to our tracking "block"
    curl_multi_add_handle($curl_multi_handle, $a_curl_handle);
    $block[] = $a_curl_handle;

    // -- check to see if we've got a "full block" to run or if we're at the end of out list of handles
    if (($i % BLOCK_SIZE == 0) or ($i == count($curl_handles))) {
        // -- run the block

        $running = NULL;
        do {
            // track the previous loop's number of handles still running so we can tell if it changes
            $running_before = $running;

            // run the block or check on the running block and get the number of sites still running in $running
            curl_multi_exec($curl_multi_handle, $running);

            // if the number of sites still running changed, print out a message with the number of sites that are still running.
            if ($running != $running_before) {
                echo("Waiting for $running sites to finish...\n");
        } while ($running > 0);

        // -- once the number still running is 0, curl_multi_ is done, so check the results
        foreach ($block as $handle) {
            // HTTP response code
            $code = curl_getinfo($handle,  CURLINFO_HTTP_CODE);

            // cURL error number
            $curl_errno = curl_errno($handle);

            // cURL error message
            $curl_error = curl_error($handle);

            // output if there was an error
            if ($curl_error) {
                echo("    *** cURL error: ($curl_errno) $curl_error\n");

            // remove the (used) handle from the curl_multi_handle
            curl_multi_remove_handle($curl_multi_handle, $handle);

        // reset the block to empty, since we've run its curl_handles
        $block = array();

// close the curl_multi_handle once we're done

Biorąc pod uwagę, że nie potrzebujesz niczego z powrotem z adresów URL, prawdopodobnie nie potrzebujesz dużo tego, co tam jest, ale w ten sposób podzieliłem żądania na bloki BLOCK_SIZE , czekał na uruchomienie każdego bloku przed przejściem dalej i wyłapywał błędy z cURL.

  1. Database
  3. Mysql
  5. Oracle
  7. Sqlserver
  9. PostgreSQL
  11. Access
  13. SQLite
  15. MariaDB
  1. MySQL InnoDB Cluster 8.0 — pełny opis operacji:część druga

  2. Sprawdź połączenie mysql w sequelize

  3. Usuwanie wszystkich rekordów tabeli, do których nie ma odniesień z innej tabeli

  4. MySQL - Jak wyświetlić wszystkie rekordy dni w danym miesiącu?

  5. Żądanie MySQL do łączenia i wyszukiwania w 2 tabelach