Nous contacter Se connecter
Écoutille
Service opérationnel

Extraction de données web
structurée et livrée.

Une URL. Toutes les données.

Donnez-nous une URL. On crawle l'intégralité du contenu — listings, fiches, annonces, articles — et on livre HTML brut + données structurées en 48 h. Que ce soit un catalogue produits, des annonces immobilières, des offres d'emploi ou un fil d'articles.

Tout site qui a un catalogue, on l'écoute.

Le pipeline est agnostique du type de contenu. Si le site a une structure de listing → fiche, on extrait.

🛒

E-commerce

Catalogues produits, prix, promos, stocks. Suivi concurrentiel ou enrichissement de votre propre fiche.

🏠

Annonces immobilières

Biens à vendre / louer, prix, surface, localisation, photos. Marché local ou national.

💼

Offres d'emploi

Postes ouverts par entreprise, secteur, salaire, localisation. Veille recrutement / sourcing.

📰

Articles & médias

Articles de presse, blogs, publications. Pour de la veille thématique ou un corpus d'analyse.

🏛️

Annuaires & registres

Listings d'entreprises, professionnels, institutions. Données publiques structurables.

Et au-delà

Événements, formations, financements, recettes, projets. Tout ce qui se range en pages individuelles.

Un parcours de données logique et exhaustif

Chaque crawl suit la même séquence déterministe. Aucune page n'est oubliée.

01
🌐
Point d'entrée
Vous fournissez l'URL racine du site cible. C'est le seul input nécessaire.
02
🗂
Sections
Détection automatique de la navigation : catégories, rubriques, filtres, taxonomies.
03
📄
Pagination
Parcours intégral de chaque page de listing, quelle que soit la profondeur ou la structure URL.
04
📦
Fiches détaillées
Collecte du HTML brut de chaque page individuelle. Stockage indexé, prêt pour l'extraction.
⏱ livraison 48h

Deux modes d'accès, zéro friction

Une fois le crawl terminé, vos données sont disponibles via API REST et BigQuery.

API REST

Récupérez le HTML brut de n'importe quelle page crawlée via son identifiant unique. Intégration directe dans votre pipeline.

GET /v1/pages/{id}
Authorization: Bearer {token}

{
  "id": "pg_8f3a…",
  "url": "https://…/annonce/4218",
  "html": "<!DOCTYPE html>…"
}
🗄

BigQuery

Vos données structurées (titre, description, URL, image, attributs) dans une table dédiée par type de contenu. Tables jointes pour les attributs riches (prix, surface, salaire, date…).

SELECT
  i.title, i.url, i.image_url,
  a.key, a.value
FROM items i
JOIN attributes a ON i.id = a.item_id
WHERE i.crawl_id = 'crl_x9k2…'

De l'URL aux données en 3 étapes

01

Envoyez votre URL

Contactez-nous avec l'URL du site à crawler. Nous évaluons la faisabilité et confirmons sous 24h.

02

Crawl en 48h

Notre pipeline parcourt le site de façon déterministe. Vous recevez une notification dès que les données sont disponibles.

03

Accédez à vos données

Vos credentials API et BigQuery sont disponibles dans votre espace client. Les données sont en cache, disponibles à tout moment.

Une grille simple. Du sur-mesure si besoin.

Choisissez votre plan en fonction du volume de pages que vous voulez crawler. Domaine custom inclus partout.

Starter
149 € / mois
15 000 crédits / mois

Pour les premiers projets data

  • 15 000 crédits / mois
  • Accès API REST + BigQuery
  • Export XLSX illimité
  • Support standard
Choisir Starter
Scale
966 € / mois
200 000 crédits / mois

Pour les besoins industriels

  • 200 000 crédits / mois
  • Tout ce qu'il y a dans Pro
  • Onboarding dédié
Choisir Scale
🎁
Pack Découverte 149 €

Sans engagement, pour tester

  • 12 000 crédits
  • Valables 6 mois
  • Paiement unique, sans renouvellement
  • Cumulable avec un abonnement
Acheter le pack
🤝
Sur-mesure Devis

Au-delà de 200 000 crédits / mois

  • Volumes adaptés à vos besoins
  • Tarification dégressive
  • Onboarding et intégration sur-mesure
  • SLA et support négociables
Demander un devis
Gratuit — pour découvrir écoutille. Démarrez avec un export CSV gratuit du site de votre choix, sans carte bancaire.
Démarrer gratuitement →

Prêt à extraire vos premières données ?

Donnez-nous une URL. Nous nous occupons du reste.

Démarrer gratuitement →