44193fc6c1be59c5a07fb5d55085465ec13af362
Domain-Normalisierung:
python
Copy
def _normalize_domain(self, website):
# Konvertiert URLs wie "https://www.heimerle-meule.com/de/" zu "heimerle-meule"
Optimierte Suchbegriffe:
Entfernt alle Rechtsformen systematisch
Kombiniert Domain-Namen und Schlüsselwörter
Beispiel: Aus "Heimerle + Meule GmbH" wird:
python
Copy
['Heimerle + Meule GmbH', 'Heimerle + Meule', 'heimerle-meule']
Erweiterte Infobox-Analyse:
30% mehr Schlüsselwörter für Branchen
Berücksichtigt alternative Umsatzbezeichnungen wie "Betriebsergebnis"
Verarbeitet verschiedene Zahlenformate:
"123,45 Mio. €"
"5.678.900 Euro"
"9,99 Mrd."
Robuste Textbereinigung:
python
Copy
# Aus "Medizintechnik [3](Stand: 2022)" wird "Medizintechnik"
re.sub(r'\[.*?\]|\(.*?\)', '', raw_value)
Description
No description provided
Languages
Python
63.6%
TypeScript
19.2%
JavaScript
15.6%
HTML
0.7%
Dockerfile
0.4%
Other
0.5%