[34588f42] Keine Zusammenfassung angegeben.

Keine Zusammenfassung angegeben.
2026-04-18 20:58:31 +00:00
parent 02b17d53ea
commit 1ae8b3e353
7 changed files with 186 additions and 29 deletions
--- a/.dev_session/SESSION_INFO
+++ b/.dev_session/SESSION_INFO
@@ -1 +1 @@
-{"task_id": "34588f42-8544-8046-85d4-d7895ed9b29c", "token": "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", "readme_path": "readme.md", "session_start_time": "2026-04-18T13:58:52.409921"}
+{"task_id": "34588f42-8544-8046-85d4-d7895ed9b29c", "token": "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", "readme_path": "readme.md", "session_start_time": "2026-04-18T20:58:29.155246"}
--- a/fotograf-de-scraper/backend/database.py
+++ b/fotograf-de-scraper/backend/database.py
@@ -63,6 +63,7 @@ class JobParticipant(Base):
    gruppe = Column(String, nullable=True)
    logins = Column(Integer, default=0)
    has_orders = Column(Integer, default=0) # 0 for false, 1 for true
    digital_package_ordered = Column(Integer, default=0) # 0 for false, 1 for true
    last_synced = Column(DateTime, default=datetime.datetime.utcnow)
 Base.metadata.create_all(bind=engine)
--- a/fotograf-de-scraper/backend/inspect_orders.py
+++ b/fotograf-de-scraper/backend/inspect_orders.py
@@ -0,0 +1,49 @@
 import os
 import sys
 from dotenv import load_dotenv
 from sqlalchemy import create_engine
 from sqlalchemy.orm import sessionmaker
 from database import Job
 from main import setup_driver, login
 import time
 load_dotenv()
 engine = create_engine("sqlite:////app/data/fotograf_jobs.db")
 Session = sessionmaker(bind=engine)
 db = Session()
 # Get latest job
 job = db.query(Job).order_by(Job.last_updated.desc()).first()
 if not job:
    print("No jobs found in database.")
    sys.exit(1)
 print(f"Using Job ID: {job.id} ({job.name}), Account: {job.account_type}")
 username = os.getenv(f"{job.account_type.upper()}_USER")
 password = os.getenv(f"{job.account_type.upper()}_PW")
 driver = setup_driver()
 if not driver:
    print("Failed to init driver")
    sys.exit(1)
 if not login(driver, username, password):
    print("Login failed")
    driver.quit()
    sys.exit(1)
 orders_url = f"https://app.fotograf.de/config_jobs_orders/index/{job.id}/customer_orders"
 print(f"Navigating to {orders_url}")
 driver.get(orders_url)
 time.sleep(5) # wait for page to load
 html = driver.page_source
 with open("orders_page.html", "w", encoding="utf-8") as f:
    f.write(html)
 driver.save_screenshot("orders_page.png")
 print("Saved orders_page.html and orders_page.png")
 driver.quit()
--- a/fotograf-de-scraper/backend/main.py
+++ b/fotograf-de-scraper/backend/main.py
@@ -489,22 +489,17 @@ task_store: Dict[str, Dict[str, Any]] = {}
 def process_statistics(task_id: str, job_id: str, account_type: str):
    logger.info(f"Task {task_id}: Starting fast statistics calculation for job {job_id}")
-    task_store[task_id] = {"status": "running", "progress": "Synchronisiere Daten von Fotograf.de...", "result": None}
+    task_store[task_id] = {"status": "running", "progress": "Berechne Statistiken...", "result": None}
    db = SessionLocal()
    try:
-        # 1. Sync data from CSV
+        # Check if we have data at all
        try:
            sync_participants(job_id, account_type, db)
        except Exception as sync_err:
            logger.error(f"Sync failed during statistics: {sync_err}")
        count = db.query(JobParticipant).filter(JobParticipant.job_id == job_id).count()
        if count == 0:
-                task_store[task_id] = {"status": "error", "progress": f"Synchronisierung fehlgeschlagen: {str(sync_err)}"}
+            task_store[task_id] = {"status": "error", "progress": "Keine Daten vorhanden. Bitte erst oben auf 'Daten abgleichen' klicken."}
            return
-        # 2. Query DB and group by 'gruppe'
+        # Query DB and group by 'gruppe'
        task_store[task_id]["progress"] = "Berechne Statistiken..."
        # Get all participants for this job
        participants = db.query(JobParticipant).filter(JobParticipant.job_id == job_id).all()
@@ -518,12 +513,13 @@ def process_statistics(task_id: str, job_id: str, account_type: str):
                    "Album": g_name,
                    "Kinder_insgesamt": 0,
                    "Kinder_mit_Käufen": 0,
-                    "Kinder_Alle_Bilder_gekauft": 0 # Not available in CSV, setting to 0 or estimates
+                    "Kinder_Alle_Bilder_gekauft": 0
                }
            groups[g_name]["Kinder_insgesamt"] += 1
            if p.has_orders:
                groups[g_name]["Kinder_mit_Käufen"] += 1
-
+            if p.digital_package_ordered:
                groups[g_name]["Kinder_Alle_Bilder_gekauft"] += 1
        statistics = list(groups.values())
        statistics.sort(key=lambda x: x["Album"])
@@ -541,23 +537,17 @@ def process_statistics(task_id: str, job_id: str, account_type: str):
 def process_reminder_analysis(task_id: str, job_id: str, account_type: str):
    logger.info(f"Task {task_id}: Starting fast reminder analysis for job {job_id}")
-    task_store[task_id] = {"status": "running", "progress": "Synchronisiere Daten von Fotograf.de...", "result": None}
+    task_store[task_id] = {"status": "running", "progress": "Analysiere Datenbank-Einträge...", "result": None}
    db = SessionLocal()
    try:
-        # 1. Sync data from CSV (This takes ~20s and gets all parent emails, logins and orders)
+        # Check if we have data at all
        try:
            sync_participants(job_id, account_type, db)
        except Exception as sync_err:
            logger.error(f"Sync failed during reminder analysis: {sync_err}")
            # Continue anyway if we have some data, or fail if we have none
        count = db.query(JobParticipant).filter(JobParticipant.job_id == job_id).count()
        if count == 0:
-                task_store[task_id] = {"status": "error", "progress": f"Synchronisierung fehlgeschlagen: {str(sync_err)}"}
+            task_store[task_id] = {"status": "error", "progress": "Keine Daten vorhanden. Bitte erst oben auf 'Daten abgleichen' klicken."}
            return
-        # 2. Query DB for potential candidates (Logins <= 1 and No Orders)
+        # Query DB for potential candidates (Logins <= 1 and No Orders)
        task_store[task_id]["progress"] = "Analysiere Datenbank-Einträge..."
        candidates = db.query(JobParticipant).filter(
            JobParticipant.job_id == job_id,
@@ -1073,32 +1063,119 @@ def sync_participants(job_id: str, account_type: str, db: Session):
                participant.last_synced = datetime.datetime.utcnow()
            db.commit()
-            logger.info(f"Successfully synced {len(df)} participants for job {job_id}")
+            logger.info(f"Successfully synced {len(df)} participants from CSV.")
            # --- PHASE 2: Scrape Orders for Digital Packages (Price Magic) ---
            try:
                orders_url = f"https://app.fotograf.de/config_jobs_orders/{job_id}/customer_orders"
                logger.info(f"Navigating to orders page for price magic: {orders_url}")
                driver.get(orders_url)
                time.sleep(3) # Wait for page/table to load
                # Find all order rows
                order_rows = driver.find_elements(By.XPATH, "//table/tbody/tr")
                logger.info(f"Found {len(order_rows)} order rows to analyze.")
                digital_matches = 0
                for row in order_rows:
                    try:
                        cols = row.find_elements(By.TAG_NAME, "td")
                        if len(cols) < 11: continue
                        fname = cols[4].text.strip()
                        lname = cols[5].text.strip()
                        sum_text = cols[8].text.strip()
                        status_text = cols[10].text.strip()
                        # Parse Sum (e.g., "58,90 €")
                        clean_sum_text = sum_text.replace("€", "").replace(",", ".").replace(" ", "").strip()
                        try:
                            order_sum = float(clean_sum_text)
                        except:
                            order_sum = 0.0
                        is_digital = False
                        # PRICE MAGIC: Defined package prices (regular & discounted)
                        # Digital Single: 58.90 / 53.90
                        # Digital Siblings: 109.90 / 94.90
                        # Digital Family: 75.90 / 70.90
                        target_prices = [58.90, 53.90, 109.90, 94.90, 75.90, 70.90]
                        if any(abs(order_sum - p) < 0.01 for p in target_prices):
                            is_digital = True
                        # STATUS FALLBACK: If status already says download
                        if "heruntergeladen" in status_text.lower() or "download" in status_text.lower():
                            is_digital = True
                        if is_digital and fname and lname:
                            # Update participants matching these parents
                            db.query(JobParticipant).filter(
                                JobParticipant.job_id == job_id,
                                JobParticipant.vorname_eltern == fname,
                                JobParticipant.nachname_eltern == lname
                            ).update({JobParticipant.digital_package_ordered: 1})
                            digital_matches += 1
                    except Exception as row_err:
                        logger.warning(f"Error parsing order row: {row_err}")
                        continue
                db.commit()
                logger.info(f"Price Magic complete: Identified {digital_matches} digital packages.")
            except Exception as order_err:
                logger.error(f"Failed to scrape orders for price magic: {order_err}")
            return len(df)
        finally:
            driver.quit()
@app.get("/api/jobs/{job_id}/fast-stats")
 async def get_fast_stats(job_id: str, db: Session = Depends(get_db)):
    participants = db.query(JobParticipant).filter(JobParticipant.job_id == job_id).all()
    if not participants:
        return []
    groups = {}
    for p in participants:
        g_name = p.gruppe or "Unbekannt"
        if g_name not in groups:
            groups[g_name] = {
                "Album": g_name,
                "Kinder_insgesamt": 0,
                "Kinder_mit_Käufen": 0,
                "Kinder_Alle_Bilder_gekauft": 0
            }
        groups[g_name]["Kinder_insgesamt"] += 1
        if p.has_orders:
            groups[g_name]["Kinder_mit_Käufen"] += 1
        if p.digital_package_ordered:
            groups[g_name]["Kinder_Alle_Bilder_gekauft"] += 1
    statistics = list(groups.values())
    statistics.sort(key=lambda x: x["Album"])
    return statistics
--- a/fotograf-de-scraper/backend/migrate_db.py
+++ b/fotograf-de-scraper/backend/migrate_db.py
@@ -0,0 +1,18 @@
 import sqlite3
 import os
 db_path = "/app/data/fotograf_jobs.db"
 if not os.path.exists(db_path):
    db_path = "fotograf-de-scraper/backend/data/fotograf_jobs.db"
 conn = sqlite3.connect(db_path)
 cursor = conn.cursor()
 try:
    cursor.execute("ALTER TABLE job_participants ADD COLUMN digital_package_ordered INTEGER DEFAULT 0;")
    print("Column 'digital_package_ordered' added successfully.")
 except sqlite3.OperationalError:
    print("Column 'digital_package_ordered' already exists.")
 conn.commit()
 conn.close()
--- a/fotograf-de-scraper/backend/orders_page.html
+++ b/fotograf-de-scraper/backend/orders_page.html
--- a/fotograf-de-scraper/backend/orders_page.png
+++ b/fotograf-de-scraper/backend/orders_page.png
		`@@ -1 +1 @@`
			`{"task_id": "34588f42-8544-8046-85d4-d7895ed9b29c", "token": "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", "readme_path": "readme.md", "session_start_time": "2026-04-18T13:58:52.409921"}`				`{"task_id": "34588f42-8544-8046-85d4-d7895ed9b29c", "token": "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", "readme_path": "readme.md", "session_start_time": "2026-04-18T20:58:29.155246"}`