33 lines
1.7 KiB
Markdown
33 lines
1.7 KiB
Markdown
# Fotograf.de Scraper (Archiviert)
|
|
|
|
Dieses Verzeichnis enthält die archivierten Dateien für den "Fotograf.de Scraper".
|
|
|
|
**Zweck:**
|
|
Ein Python-basiertes Tool, das die Website `app.fotograf.de` automatisiert besucht, sich anmeldet und in zwei Modi Daten extrahiert:
|
|
1. **E-Mail-Liste erstellen:** Sammelt Kontaktdaten und speichert sie in einer CSV-Datei (`supermailer_fertige_liste.csv`).
|
|
2. **Statistik auswerten:** Erstellt eine Statistik-CSV-Datei (`job_statistik.csv`).
|
|
|
|
**Zugehörige Dateien in diesem Ordner:**
|
|
* `scrape_fotograf.py`: Das Hauptskript mit der gesamten Logik.
|
|
|
|
**Manuell zu erstellende Dateien:**
|
|
* `fotograf_credentials.json`: Diese Datei wird vom Skript benötigt und muss die Login-Daten für `app.fotograf.de` im folgenden JSON-Format enthalten:
|
|
```json
|
|
{
|
|
"PROFILNAME": {
|
|
"username": "IHR_BENUTZERNAME",
|
|
"password": "IHR_PASSWORT"
|
|
}
|
|
}
|
|
```
|
|
|
|
**Externe Abhängigkeiten (befinden sich im Hauptverzeichnis des Projekts):**
|
|
* **Dockerfile:** `Dockerfile.brancheneinstufung` wurde wahrscheinlich verwendet, um ein Docker-Image für dieses Tool zu erstellen. Es installiert Google Chrome und die notwendigen Python-Pakete.
|
|
* **Python-Abhängigkeiten:** Die globale `requirements.txt` im Root-Verzeichnis enthält `selenium` und andere benötigte Bibliotheken.
|
|
|
|
**Beispielhafter `docker run`-Befehl:**
|
|
1. Bauen Sie das Image (nur einmalig): `docker build -f Dockerfile.brancheneinstufung -t fotograf-scraper .`
|
|
2. Führen Sie den Container aus: `docker run -it --rm -v "$(pwd):/app" fotograf-scraper python3 /app/ARCHIVE_vor_migration/Fotograf.de/scraper/scrape_fotograf.py`
|
|
|
|
(Pfade müssen ggf. angepasst werden, je nachdem, von wo der Befehl ausgeführt wird.)
|