Entreprise:
Description de l'annonce:
Titre du poste : Développeur Scraping Freelance - Marques, Modèles, Commentaires et Images de Produits (Télétravail)
Lieu : Télétravail (100% à distance)
Type de contrat : Freelance
Description du poste :
Nous recherchons un développeur freelance spécialisé en scraping pour extraire des données relatives aux marques, modèles, commentaires, et images de produits à partir de sites web. Vous travaillerez à distance et serez chargé de développer des scripts efficaces pour collecter et organiser ces informations.
Responsabilités :
- Scraping des marques et modèles : Créer des scripts pour extraire des listes de marques et modèles de produits depuis des sites e-commerce ou des bases de données en ligne.
- Extraction des commentaires : Développer des scripts pour collecter les avis et commentaires des utilisateurs sur les produits.
- Téléchargement des images de produits : Extraire et stocker les images associées aux produits.
- Nettoyage et organisation des données : Assurer la précision, la cohérence, et la structuration des données collectées.
- Adaptation des scripts : Mettre à jour les scripts en fonction des changements sur les sites web cibles.
- Stockage des données : Enregistrer les informations extraites (marques, modèles, commentaires, images) dans des formats utilisables (JSON, CSV, base de données).
- Conformité : S'assurer que les activités de scraping respectent les conditions d'utilisation des sites web et les lois en vigueur.
Compétences requises :
- Programmation : Maîtrise de Python (avec des bibliothèques comme lxml ou BeautifulSoup , Scrapy, Selenium) ou JavaScript.
- Connaissance web : Compréhension des structures HTML(GET, POST et d'autres méthodes pour envoyer et recevoir des données.), des APIs, et des techniques de scraping web.
- Gestion des images : Expérience dans l'extraction et la gestion des images (téléchargement, stockage).
- Bases de données : Expérience avec SQL, MongoDB ou autres systèmes de bases de données pour stocker les données collectées.
- Traitement du Langage Naturel (NLP) : Connaissance de bases en NLP pour analyser les commentaires des utilisateurs, par exemple, en utilisant NLTK ou spaCy pour la classification des sentiments.
- Résolution des captchas : Capacité à contourner les systèmes de protection anti-scraping, comme les captchas.
- Connaissance des Plateformes E-commerce : Connaissance des structures courantes des sites e-commerce comme Amazon, eBay, ou des CMS comme Shopify, WooCommerce.
Profil recherché :
- Expérience : Minimum 2 ans d'expérience en développement de scripts de scraping, avec un focus sur les données de produits, commentaires, et image
- Autonomie : Capable de gérer des projets de manière indépendante avec des résultats précis et fiables.
- Détail : Grande attention aux détails pour garantir la qualité et l'exactitude des données collectées.