# Batch de scraping par marque

Ce batch s'appuie maintenant sur :
- `brands_sources.json` : la liste des marques / sites validés
- `brand_site_rules.json` : les règles génériques et spécifiques par marque/site
- `scrape_brand_sites.js` : le batch principal

## Pourquoi cette V2 est meilleure

On ne se limite plus aux marques du run test.
Le système est pensé pour **toutes les marques validées** via un fichier de règles centralisé.

Le batch :
- essaie plusieurs pages catalogue plausibles
- filtre plus agressivement les pages catégorie
- valide qu'une page ressemble vraiment à un produit
- écrit une sortie par marque

## Commandes utiles

5 marques :

```bash
node scraping/scrape_brand_sites.js --brandOffset=0 --brandLimit=5
```

Une seule marque :

```bash
node scraping/scrape_brand_sites.js --brand=Fender --limit=10
```

Toutes les marques :

```bash
node scraping/scrape_brand_sites.js
```

## Sortie

Dans `scraping/output/brands/<slug-marque>/` :
- `listing.json`
- `products.json`
- `progress.json`

Résumé global :
- `scraping/output/brands/brands_run_summary.json`

## Point honnête

Le batch est maintenant structuré pour toutes les marques, mais il restera normal d'affiner certaines règles au fil des sites réels. Le bon modèle est désormais : améliorer le fichier `brand_site_rules.json`, pas bricoler le script à la main à chaque fois.