dunkel proxyscrape logo

How To Use A Proxy With Requests Module In Python

Leitfäden, How to's, Proxies, Mar-03-20225 Min. gelesen

Every computer gets a unique Internet Protocol (IP) address that identifies the computer and its geographic location when connected to the Internet. Your computer sends out a request whenever it needs any information from the Internet. The request is sent to a target computer that checks the type of information being asked for. The target

Every computer gets a unique Internet Protocol (IP) address that identifies the computer and its geographic location when connected to the Internet. Your computer sends out a request whenever it needs any information from the Internet. The request is sent to a target computer that checks the type of information being asked for. The target computer sends the information back if it is allowed to give it to our IP address. At times, the computer wants to get the information from the Internet without being identified. That information is usually blocked, but we can get it using a proxy that acts as an intermediary between the client and the server machine.

Each proxy server has its IP address, so when a user requests via a proxy to access a website, the website sends the data to the proxy server IP that forwards it to the user.

  • Proxies verbergen die Identität von Web-Scrapern und lassen ihren Datenverkehr wie den eines normalen Nutzers aussehen.
  • Proxys bieten zusätzliche Sicherheit für Websites und gleichen den Internetverkehr aus.
  • Proxys schützen die Daten von Internetnutzern oder helfen beim Zugriff auf Websites, die von den Zensurmechanismen eines Landes blockiert werden.

Using A Proxy With Requests Module in Python

Um Proxys mit den Python-Anfragen zu verwenden, müssen Sie die folgenden Schritte ausführen.

Anfragen importieren

Importieren Sie das Paket requests, bei dem es sich um eine einfache HTTP-Bibliothek handelt. Mit diesem Paket können Sie problemlos Anfragen senden, ohne manuell Abfragezeichenfolgen zu Ihren URLs hinzufügen zu müssen. Sie können requests mit dem folgenden Befehl importieren.

Einfuhrgesuche

Ein Wörterbuch erstellen

Sie müssen ein Proxies-Wörterbuch erstellen, das die HTTP- und HTTPS-Verbindungen definiert. Sie können der Wörterbuchvariable einen beliebigen Namen wie "proxies" geben, der ein Protokoll auf die Proxy-URL abbildet. Außerdem müssen Sie die URL-Variable auf die Website setzen, von der Sie scrapen wollen.

proxies = {
  "http":'http://203.190.46.62:8080',
  "https":'https://111.68.26.237:8080'
}
url = 'https://httpbin.org/ip'

Hier definiert das Wörterbuch die URL des Proxys für zwei verschiedene Protokolle, nämlich HTTP und HTTPS.

Erstellen Sie eine Antwortvariable

Sie müssen eine Antwortvariable erstellen, die eine der Abfragemethoden verwendet. Diese Methode benötigt zwei Argumente:

  • Die von Ihnen erstellte URL
  • Das von Ihnen definierte Wörterbuch
Antwort = requests.get(url,proxies = proxies)
print(response.json())

Die Ausgabe ist wie folgt:

You can also use the requests module in Python to rotate the IP addresses as shown below.

You have to import the requests module by using the below command.

Einfuhrgesuche

Funktion sending_request erstellen

You have to create a sending_request function and prefer using the http proxy as most free proxies don’t use the https protocol. We used try-except block because most of the free proxies don’t work.

def sending_request(session, proxy):
    try:
        response = session.get('http://httpbin.org/ip', proxies={'http': f"http://{proxy}"})
        print(response.json())
    except:
        pass

Proxies_txt lesen

You have to read the list_proxies.txt file containing the free proxies list and save it to the variable named proxies.

if __name__ == "__main__":
   with open('list_proxies.txt', 'r') as file:
        proxies = file.readlines()

Sitzung erstellen

You have to create a session from the requests module and follow the below steps.

  • Schleife durch den Proxy
  • Übergeben Sie den Proxy und die Sitzung an die Funktion sending_request
mit requests.Session() as session:
   for proxy in proxies:
        sending_request(session, proxy)

Sie erhalten die unten abgebildete Liste der Proxys.

These are some proxies, and the list goes on with more proxies, but all of them don’t work.

Need of Proxies

Jedes Unternehmen muss die folgenden fünf wichtigen Gründe für den Einsatz von Proxys kennen.

Anonyme Durchführung sensibler Aufgaben

Proxys sind bekannt für ihre Fähigkeit, den Internetverkehr zu anonymisieren. Aber die meisten Menschen verstehen nicht, wie wichtig sie in der Geschäftswelt sind. Proxy-Server ermöglichen es den Sicherheitsbeauftragten und Reportern, sich selbst, Unternehmen, Quellen, Kunden und Partner zu schützen.

Sie können Proxys auch verwenden, um die Entwicklung und die laufende Forschung sowie andere Unternehmensaktivitäten zu schützen. Angenommen, Ihr Unternehmen verwendet einen Proxy und einen potenziellen Spion, um den Internetverkehr zu verfolgen und festzustellen, was Ihr Unternehmen entwickelt. In diesem Fall kann er Ihre Mitarbeiter nicht so leicht aufspüren.

Verbesserung der Sicherheit von Unternehmen und Institutionen

Sie wissen, dass Datenschutzverletzungen sowohl in Bezug auf das öffentliche Image als auch auf den finanziellen Verlust kostspielig sind. Die Unternehmen sind also besorgt über Hacker. Aber Proxys können Ihnen helfen, da sie die Wahrscheinlichkeit von Datenverletzungen verringern. Sie fügen eine zusätzliche Sicherheitsebene zwischen Ihren Servern und dem Datenverkehr von außen hinzu. Die Proxy-Server fungieren auch als Puffer, da sie dem Internet gegenüberstehen und Anfragen von Computern außerhalb des Netzes weiterleiten.

Wenn Hacker Zugang zu Ihren Proxy-Servern haben, werden sie dennoch Schwierigkeiten haben, den Server zu erreichen, auf dem die Web-Software läuft, auf der die Daten gespeichert sind.

Kontrolle der Internet-Nutzung durch Mitarbeiter

Sie wissen, dass Datenschutzverletzungen sowohl in Bezug auf das öffentliche Image als auch auf den finanziellen Verlust kostspielig sind. Die Unternehmen sind also besorgt über Hacker. Aber Proxys können Ihnen helfen, da sie die Wahrscheinlichkeit von Datenverletzungen verringern. Sie fügen eine zusätzliche Sicherheitsebene zwischen Ihren Servern und dem Datenverkehr von außen hinzu. Die Proxy-Server fungieren auch als Puffer, da sie dem Internet gegenüberstehen und Anfragen von Computern außerhalb des Netzes weiterleiten.

Wenn Hacker Zugang zu Ihren Proxy-Servern haben, werden sie dennoch Schwierigkeiten haben, den Server zu erreichen, auf dem die Web-Software läuft, auf der die Daten gespeichert sind.

Bandbreiten einsparen und schnellere Geschwindigkeiten erreichen

Manche Menschen gehen davon aus, dass Proxyserver die Internetgeschwindigkeit verlangsamen, weil sie im Hintergrund viel Arbeit leisten. Aber das ist nicht immer wahr. Die Proxy-Server können verwendet werden, um Bandbreite zu sparen und die Geschwindigkeit zu erhöhen, indem:

  • Zwischenspeicherung von Webseiten und Dateien, auf die mehrere Benutzer zugreifen
  • Komprimierung des Verkehrs
  • Entfernen von Werbung von Websites

Welche Proxys sollten verwendet werden?

Man könnte meinen, es gäbe nur eine Art von Vollmacht, die den Unternehmen alle Vorteile bietet, wie z. B.:

  • Verhinderung von Datenschutzverletzungen
  • Festlegung wettbewerbsfähiger Preise
  • Sammeln wertvoller Daten über soziale Medien
  • Aufbau einer effektiven SEO-Strategie

In Wirklichkeit gibt es viele Arten von Proxys, und die Wahl hängt von Ihren Anforderungen oder Ihrem Anwendungsfall ab.

Im Folgenden sind die gängigsten Arten von Proxys aufgeführt.

Rechenzentrum-Proxys

Rechenzentrums-Proxys sind die von Unternehmen weltweit am häufigsten genutzten Proxys. Rechenzentren produzieren und verwalten diese Proxys. Sie können diese Proxys verwenden, wenn Sie die Sicherheit Ihres Systems verbessern müssen, da sie billig und einfach zu erwerben sind. Einige Websites verbieten jedoch ihre Verwendung, da sie sie mit Bot-ähnlichen Aktivitäten in Verbindung bringen.

Vollmachten für Wohnzwecke

Die Wohnsitz-Proxys sind mit physischen Wohnsitzen verbunden und verwenden die IP-Adressen tatsächlicher Personen, die von Internetdienstanbietern (ISPs) bereitgestellt werden. Wenn Sie sie verwenden, um eine Verbindung zu einer Website herzustellen, sehen Sie aus wie ein normaler Nutzer. So ist es weniger wahrscheinlich, dass Sie entdeckt und gesperrt werden. Mit Residential Proxies können Sie eine große Menge an Webdaten abrufen und eine höhere Anonymität und Sicherheit erreichen.

Schlussfolgerung

Bisher haben wir besprochen, dass ein Proxy als Relais zwischen dem Client- und dem Server-Rechner fungiert. Immer wenn Sie Informationen anfordern, sendet Ihr Computer diese Anforderung an den Proxy, der die Informationen dann unter einer anderen IP-Adresse an den Zielcomputer sendet. So bleibt Ihre IP-Adresse vertraulich. Außerdem können Sie Proxys mit dem Modul requests in Python verwenden und je nach Bedarf verschiedene Aktionen durchführen. Wenn Sie eine statische IP mit der Geschwindigkeit von Rechenzentrums-Proxys und der hohen Anonymität von Residential-Proxys benötigen, dann sind statische Proxys die richtige Wahl, da die IP-Adresse bei jeder neuen Anfrage unverändert bleibt. Im Gegensatz dazu bieten rotierende Proxys Vorteile beim Testen und Scraping.