Wie man einen Proxy mit Requests Modul in Python verwenden

Leitfäden, How to's, Proxies, Mar-06-20245 Min. gelesen

Jeder Computer erhält eine eindeutige IP-Adresse (Internet Protocol), die den Computer und seinen geografischen Standort identifiziert, wenn er mit dem Internet verbunden ist. Ihr Computer sendet eine Anfrage, wenn er Informationen aus dem Internet benötigt. Die Anfrage wird an einen Zielcomputer gesendet, der die Art der angeforderten Informationen überprüft. Der Zielcomputer

Jeder Computer erhält eine eindeutige IP-Adresse (Internet Protocol), die den Computer und seinen geografischen Standort identifiziert, wenn er mit dem Internet verbunden ist. Ihr Computer sendet eine Anfrage, wenn er Informationen aus dem Internet benötigt. Die Anfrage wird an einen Zielcomputer gesendet, der die Art der angeforderten Informationen überprüft. Der Zielcomputer sendet die Informationen zurück, wenn er sie an unsere IP-Adresse weitergeben darf. Manchmal möchte der Computer die Informationen aus dem Internet abrufen, ohne identifiziert zu werden. Diese Informationen werden in der Regel blockiert, aber wir können sie mit Hilfe eines Proxys abrufen, der als Vermittler zwischen dem Client- und dem Server-Rechner fungiert.

Jeder Proxyserver hat eine eigene IP-Adresse. Wenn ein Nutzer also über einen Proxy auf eine Website zugreift, sendet die Website die Daten an die IP des Proxyservers, der sie an den Nutzer weiterleitet.

  • Proxies verbergen die Identität von Web-Scrapern und lassen ihren Datenverkehr wie den eines normalen Nutzers aussehen.
  • Proxys bieten zusätzliche Sicherheit für Websites und gleichen den Internetverkehr aus.
  • Proxys schützen die Daten von Internetnutzern oder helfen beim Zugriff auf Websites, die von den Zensurmechanismen eines Landes blockiert werden.

Verwendung eines Proxy mit Requests-Modul in Python

Um Proxys mit den Python-Anfragen zu verwenden, müssen Sie die folgenden Schritte ausführen.

Anfragen importieren

Importieren Sie das Paket requests, bei dem es sich um eine einfache HTTP-Bibliothek handelt. Sie können mit diesem Paket problemlos Anfragen senden, ohne manuell Abfragezeichenfolgen zu Ihren URLs hinzufügen zu müssen. Sie können requests mit dem folgenden Befehl importieren.

Einfuhranträge

Ein Wörterbuch erstellen

Sie müssen ein Proxies-Wörterbuch erstellen, das die HTTP- und HTTPS-Verbindungen definiert. Sie können der Wörterbuchvariable einen beliebigen Namen wie "proxies" geben, der ein Protokoll auf die Proxy-URL abbildet. Außerdem müssen Sie die URL-Variable auf die Website setzen, von der Sie scrapen wollen.

proxies = {
  "http":'http://203.190.46.62:8080',
  "https":'https://111.68.26.237:8080'
}
url = 'https://httpbin.org/ip'

Hier definiert das Wörterbuch die URL des Proxys für zwei verschiedene Protokolle, nämlich HTTP und HTTPS.

Erstellen Sie eine Antwortvariable

Sie müssen eine Antwortvariable erstellen, die eine der Abfragemethoden verwendet. Diese Methode benötigt zwei Argumente:

  • Die von Ihnen erstellte URL
  • Das von Ihnen definierte Wörterbuch
Antwort = requests.get(url,proxies = proxies)
print(response.json())

Die Ausgabe ist wie folgt:

Sie können auch das requests-Modul in Python verwenden, um die IP-Adressen wie unten gezeigt zu drehen.

Sie müssen das Modul requests mit dem folgenden Befehl importieren.

Einfuhranträge

Funktion sending_request erstellen

Sie müssen eine Funktion sending_request erstellen und den http-Proxy vorziehen, da die meisten kostenlosen Proxys das https-Protokoll nicht verwenden. Wir haben try-except block verwendet, weil die meisten kostenlosen Proxys nicht funktionieren.

def sending_request(session, proxy):
    try:
        response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
        print(response.json())
    except:
        pass

Proxies_txt lesen

Sie müssen die Datei list_proxies.txt lesen, die die Liste der freien Proxies enthält, und sie in der Variablen namens proxies speichern.

if __name__ == "__main__":
   with open('list_proxies.txt', 'r') as file:
        proxies = file.readlines()

Sitzung erstellen

Sie müssen eine Sitzung im Anfragemodul erstellen und die folgenden Schritte ausführen.

  • Schleife durch den Proxy
  • Übergeben Sie den Proxy und die Sitzung an die Funktion sending_request
mit requests.Session() as session:
   for proxy in proxies:
        sending_request(session, proxy)

Sie erhalten die unten abgebildete Liste der Proxys.

Dies sind einige Proxys, und die Liste geht weiter mit mehr Proxys, aber alle von ihnen funktionieren nicht.

Bedarf an Bevollmächtigten

Jedes Unternehmen muss die folgenden fünf wichtigen Gründe für den Einsatz von Proxys kennen.

Anonyme Durchführung sensibler Aufgaben

Proxys sind bekannt für ihre Fähigkeit, den Internetverkehr zu anonymisieren. Aber die meisten Menschen verstehen nicht, wie wichtig sie in der Geschäftswelt sind. Proxy-Server ermöglichen es den Sicherheitsbeauftragten und Reportern, sich selbst, Unternehmen, Quellen, Kunden und Partner zu schützen.

Sie können Proxys auch verwenden, um die Entwicklung und die laufende Forschung sowie andere Unternehmensaktivitäten zu schützen. Angenommen, Ihr Unternehmen verwendet einen Proxy und einen potenziellen Spion, um den Internetverkehr zu verfolgen und festzustellen, was Ihr Unternehmen entwickelt. In diesem Fall kann er Ihre Mitarbeiter nicht so leicht aufspüren.

Verbesserung der Sicherheit von Unternehmen und Institutionen

Sie wissen, dass Datenschutzverletzungen sowohl in Bezug auf das öffentliche Image als auch auf den finanziellen Verlust kostspielig sind. Die Unternehmen sind also besorgt über Hacker. Aber Proxys können Ihnen helfen, da sie die Wahrscheinlichkeit von Datenverletzungen verringern. Sie fügen eine zusätzliche Sicherheitsebene zwischen Ihren Servern und dem Datenverkehr von außen hinzu. Die Proxy-Server fungieren auch als Puffer, da sie dem Internet gegenüberstehen und Anfragen von Computern außerhalb des Netzes weiterleiten.

Wenn Hacker Zugang zu Ihren Proxy-Servern haben, werden sie dennoch Schwierigkeiten haben, den Server zu erreichen, auf dem die Web-Software läuft, auf der die Daten gespeichert sind.

Kontrolle der Internet-Nutzung durch Mitarbeiter

Sie wissen, dass Datenschutzverletzungen sowohl in Bezug auf das öffentliche Image als auch auf den finanziellen Verlust kostspielig sind. Die Unternehmen sind also besorgt über Hacker. Aber Proxys können Ihnen helfen, da sie die Wahrscheinlichkeit von Datenverletzungen verringern. Sie fügen eine zusätzliche Sicherheitsebene zwischen Ihren Servern und dem Datenverkehr von außen hinzu. Die Proxy-Server fungieren auch als Puffer, da sie dem Internet gegenüberstehen und Anfragen von Computern außerhalb des Netzes weiterleiten.

Wenn Hacker Zugang zu Ihren Proxy-Servern haben, werden sie dennoch Schwierigkeiten haben, den Server zu erreichen, auf dem die Web-Software läuft, auf der die Daten gespeichert sind.

Bandbreiten einsparen und schnellere Geschwindigkeiten erreichen

Manche Menschen gehen davon aus, dass Proxyserver die Internetgeschwindigkeit verlangsamen, weil sie im Hintergrund viel Arbeit leisten. Aber das ist nicht immer wahr. Die Proxy-Server können verwendet werden, um Bandbreite zu sparen und die Geschwindigkeit zu erhöhen, indem:

  • Zwischenspeicherung von Webseiten und Dateien, auf die mehrere Benutzer zugreifen
  • Komprimierung des Verkehrs
  • Entfernen von Werbung von Websites

Welche Proxys sollten verwendet werden?

Man könnte meinen, es gäbe nur eine Art von Vollmacht, die den Unternehmen alle Vorteile bietet, wie z. B.:

  • Verhinderung von Datenschutzverletzungen
  • Festsetzung wettbewerbsfähiger Preise
  • Sammeln wertvoller Daten über soziale Medien
  • Aufbau einer effektiven SEO-Strategie

In Wirklichkeit gibt es viele Arten von Proxys, und die Wahl hängt von Ihren Anforderungen oder Ihrem Anwendungsfall ab.

Im Folgenden sind die gängigsten Arten von Proxys aufgeführt.

Rechenzentrum-Proxys

Rechenzentrums-Proxys sind die von Unternehmen weltweit am häufigsten verwendeten Proxys. Rechenzentren produzieren und verwalten diese Proxys. Sie können diese Proxys verwenden, wenn Sie die Sicherheit Ihres Systems verbessern müssen, da sie billig und einfach zu erwerben sind. Einige Websites verbieten jedoch ihre Verwendung, da sie sie mit Bot-ähnlichen Aktivitäten in Verbindung bringen.

Vollmachten für Wohnzwecke

Die Wohnsitz-Proxys sind mit physischen Wohnsitzen verbunden und verwenden die IP-Adressen tatsächlicher Personen, die von Internetdienstanbietern (ISPs) bereitgestellt werden. Wenn Sie sie verwenden, um sich mit einer Website zu verbinden, sehen Sie wie ein normaler Nutzer aus. So ist es weniger wahrscheinlich, dass Sie entdeckt und gesperrt werden. Mit Residential Proxies können Sie eine große Menge an Webdaten abrufen und eine bessere Anonymität und Sicherheit erreichen.

Schlussfolgerung

Bisher haben wir besprochen, dass ein Proxy als Relais zwischen dem Client- und dem Server-Rechner fungiert. Immer wenn Sie Informationen anfordern, sendet Ihr Computer diese Anforderung an den Proxy, der die Informationen dann über eine andere IP-Adresse an den Zielcomputer sendet. So bleibt Ihre IP-Adresse vertraulich. Außerdem können Sie Proxys mit dem Modul requests in Python verwenden und je nach Bedarf verschiedene Aktionen durchführen. Wenn Sie eine statische IP mit der Geschwindigkeit von Rechenzentrums-Proxys und der hohen Anonymität von Residential-Proxys benötigen, dann sind statische Proxys die richtige Wahl, da die IP-Adresse bei jeder neuen Anfrage unverändert bleibt. Im Gegensatz dazu bieten rotierende Proxys Vorteile beim Testen und Scraping.