# Batch de scraping par marque

## Fichiers
- `brands_sources.json` : sources validées par marque
- `scrape_brand_sites.js` : batch générique par marque / site

## Commandes utiles

Traiter toutes les marques validées :

```bash
node scraping/scrape_brand_sites.js
```

Traiter seulement 5 marques à partir du début :

```bash
node scraping/scrape_brand_sites.js --brandOffset=0 --brandLimit=5
```

Traiter une marque précise :

```bash
node scraping/scrape_brand_sites.js --brand=Fender --limit=10
```

## Paramètres
- `--brandOffset=0` : offset dans la liste des marques
- `--brandLimit=5` : nombre de marques à traiter dans ce run
- `--brand=Fender` : limite à une seule marque
- `--offset=0` : offset dans la liste produit d'une marque
- `--limit=10` : nombre de produits à scraper pour une marque

## Sortie

Dans `scraping/output/brands/<slug-marque>/` :
- `listing.json`
- `products.json`
- `progress.json`

Un résumé global est aussi écrit dans :
- `scraping/output/brands/brands_run_summary.json`

## Limite assumée

Ce batch est volontairement générique.
Il sert à :
- poser une architecture commune par marque
- détecter les pages catalogue
- extraire les URLs produit probables
- extraire les images et quelques specs visibles

Pour une qualité production, il faudra spécialiser les extracteurs site par site.
