Zum Hauptinhalt springen

Octoparse API FAQs

Vor über 2 Jahren aktualisiert

Frage: Kann ich API verwenden, um die Daten aus der lokalen Extraktion zu exportieren?

Antwort: Nein. Aber Sie können zuerst Ihre lokale Daten in die Cloud sichern, dann verwenden Sie API zum Export der Daten.


Frage: Ich habe ein „500 Internal Server Error“, wenn ich ein Token beantrage. Was sollte ich machen?

Antwort: Bitte überprüfen Sie, wenn Sie Ihre E-Mail-Adresse als den Benutzernamen im Request-Body eingegeben haben, benötigen Sie es, sie in Ihren Benutzernamen zu ändern.


Frage: Warum erhaltete ich „403 Not Authorized“ Error?

Antwort: Es erscheint, wenn ein API-Server beantragt hat aber Ihr Konto keine Zulassung davon hatte. Falls Ihr Konto Standard-Plan ist und Sie eine Anfrage gesendet haben, um ein Task zu starten, das ein Professional-Konto anfordert, würden Sie dieses Error akzeptieren. Überprüfen Sie bitte vor der Anfrage die API-Zulassungen.


Frage: Warum erhaltete ich „429 Limit Times“ Error?

Antwort: Octoparse begrenzt die API-Nutzung auf 20 Anfragen pro Sekunde. Reduzieren Sie bitte die Frequenz, wenn Sie den Statuscode „429“ akzeptieren würden.


Frage: Warum bekomme ich während Export von nicht-exportierten Daten in API immer die gleichen Daten?

Antwort: Sie sollten „Mark as exported“ Funktion verwenden, um vor dem nächsten Export zahlreicher Daten Ihre nicht-exportierten Daten zu markieren.


Frage: Warum erhalte ich denselben Datenstapel, wenn ich Daten nach Offset exportiere?

Antwort: Sie sollten das Offset verwenden, das in API zurückgekehrt wird, um die nächsten Datenstapel zu erhalten.

Zum Beispiel, wenn das zurückkehrende Offset 100 ist aber Sie noch Offset=0, Offset=10 verwendet, würden die Datenzeilen dann im gleichen Batch sein, die Sie gescrapt haben.


Frage: Wie kann ich mit der Verwendung von „Export non-exported data API“ die nächsten 1000 Zeilen erhalten? Die Anzahl meiner Daten ist mehr als 1000 Zeilen.

Antwort: Wenn Sie den ersten Batch von nicht-exportierten Daten exportiert haben, verwenden Sie bitte „Mark as exported“, um diesen Batch von Daten zu markieren. Dann können Sie bei der Verwendung von „Export non-exported data“ die nächsten 1000 Zeilen bekommen. Wieder und wieder zum Weiterbekommen...


Frage: Warum lässt es mich nur Export von 1000 Zeilen zu, wenn ich „Get data by offset“ verwende? Wie kann ich alle Zeilen erhalten?

Antwort: Eine API-Anfrage kann nur 1000 Zeilen exportieren. Sie müssten ein paar API-Anfragen benutzen, um alle Daten zu erhalten. Beispielerweise verwenden Sie in der ersten Anfrage offset=0 und dann bekommen Sie die ersten 1000 Zeilen. In der zweiten Anfrage sollten Sie offset=1000 (könnte mehr als 1000 sein, Sie können dieses Offset aus der Antwort von der ersten Anfrage erhalten) verwenden, um die nächsten 1000 Datenzeilen zu bekommen. Und so weiter und so fort.


Frage: Warum ist die Anzahl der Offset-Rückgaben so groß? Ich habe nicht so viele Datenzeilen angefordert.

Antwort: Die Ursache davon ist, dass einige Datenzeilen in den vorhergehenden Ausführungen gelöscht wurden und das gestartete Offset nun 0 ist. Zum Beispiel, wenn Sie während der ersten Ausführung dieses Tasks schon 100 Datenzeilen erhalten haben, werden diese Datenzeilen dann mit offset=0 starten. Falls Sie diesen Batch von 100 Datenzeilen löschen, denselbes Task wieder durchführen und 100 neue Datenzeilen erhalten, würde die 100 Datenzeilen nun mit offset=100 starten, weil die Datenzeilen mit dem Offset von 0-100 bereits gelöscht wurden.


Frage: Kann ich mit API programmatisch die zusätzlichen Crawler erstellen und dann mit API sie extrahieren?

Antwort: Heutzutage lässt Octoparse API Ihnen nur dies zu, die extrahierten Daten zu scrapen, Taskinfomationen zu erhalten und die Tasks/Crawler zu kontrollieren (Extraktion starten/beenden). Sobald Sie einen Crawler mit Octoparse erstellen/konfigurieren brauchen, müssen Sie ihn im Interface zur Aufgabenkonfiguration innerhalb der APP machen.

Hat dies deine Frage beantwortet?