Files
Brancheneinstufung2/ARCHIVE_vor_migration/Fotograf.de/scraper/README.md

33 lines
1.7 KiB
Markdown

# Fotograf.de Scraper (Archiviert)
Dieses Verzeichnis enthält die archivierten Dateien für den "Fotograf.de Scraper".
**Zweck:**
Ein Python-basiertes Tool, das die Website `app.fotograf.de` automatisiert besucht, sich anmeldet und in zwei Modi Daten extrahiert:
1. **E-Mail-Liste erstellen:** Sammelt Kontaktdaten und speichert sie in einer CSV-Datei (`supermailer_fertige_liste.csv`).
2. **Statistik auswerten:** Erstellt eine Statistik-CSV-Datei (`job_statistik.csv`).
**Zugehörige Dateien in diesem Ordner:**
* `scrape_fotograf.py`: Das Hauptskript mit der gesamten Logik.
**Manuell zu erstellende Dateien:**
* `fotograf_credentials.json`: Diese Datei wird vom Skript benötigt und muss die Login-Daten für `app.fotograf.de` im folgenden JSON-Format enthalten:
```json
{
"PROFILNAME": {
"username": "IHR_BENUTZERNAME",
"password": "IHR_PASSWORT"
}
}
```
**Externe Abhängigkeiten (befinden sich im Hauptverzeichnis des Projekts):**
* **Dockerfile:** `Dockerfile.brancheneinstufung` wurde wahrscheinlich verwendet, um ein Docker-Image für dieses Tool zu erstellen. Es installiert Google Chrome und die notwendigen Python-Pakete.
* **Python-Abhängigkeiten:** Die globale `requirements.txt` im Root-Verzeichnis enthält `selenium` und andere benötigte Bibliotheken.
**Beispielhafter `docker run`-Befehl:**
1. Bauen Sie das Image (nur einmalig): `docker build -f Dockerfile.brancheneinstufung -t fotograf-scraper .`
2. Führen Sie den Container aus: `docker run -it --rm -v "$(pwd):/app" fotograf-scraper python3 /app/ARCHIVE_vor_migration/Fotograf.de/scraper/scrape_fotograf.py`
(Pfade müssen ggf. angepasst werden, je nachdem, von wo der Befehl ausgeführt wird.)