• Data Challenge #1

    Prévoir l’attribution d’un marché public au sein de l'Union Européenne

  • Devenez le meilleur datascientist 2018

    Recevez votre trophée
    Management & Data Science Award

    Publiez votre solution
    dans la revue MDS

    Améliorez votre visibilité
    dans les médias

  • Partenaires

    Organisateur

    Partenaire scientifique

    sponsor

    Partenaire média

    Fournisseur des données

    Partenaire technique

    Partenaire technique

  • Challenge

    Résoudre un problème décisionnel

    Les marchés publics représentent entre 8 % et 25 % du Produit Intérieur Brut en fonction des pays. L'attribution des marchés publics - c'est-à-dire à la décision d'un donneur d'ordre (état, collectivités, organisations publiques) de sélectionner des fournisseurs - est un enjeu fondamental, tant pour les acheteurs publics que pour les entreprises.

    Grâce au pilotage par la donnée

    Pour sélectionner le fournisseur le plus efficace, le donneur d'ordre recours généralement à des procédures de mises en concurrences comme l'appel d'offre. L'appel d'offre est un processus d'enchère où seul le gagnant peut récupérer les frais de soumission. Prévoir l'attribution d'un marché public peut permettre à une entreprise de s'engager ou non (go/no go) à répondre à un appel d'offre.

    En relevant un défi

    L'objectif du challenge est de prévoir l'attribution des marchés publics au sein de l'Union Européenne en étant capable, pour un appel d ‘offres donné, de répondre aux 3 questions suivantes :

    • Combien de candidatures d’appel d’offres le donneur d’ordre recevra ?
    • Quel sera le montant du marché attribué ? 
    • Quel sera le profil du gagnant de l’appel d’offres (PME ou grande entreprise) ?
  • A qui s'adresse ce challenge ?

    Chercheur

    Étudiant

    Datascientist

    Startuper

  • Pourquoi participer à ce challenge ?

    Vous êtes un candidat

    • Acquérir une expérience
    • Valoriser des compétences
    • Booster votre visibilité et votre notoriété
    • Gagner des prix

    Vous êtes un partenaire

    • Trouver la meilleure solution à un problème 
    • Identifier les meilleurs talents
    • Améliorer votre image de marque
  • Déroulement

    1

    S'inscrire
    au challenge

    Participez au challenge en vous inscrivant GRATUITEMENT à partir du formulaire. Vous aurez accès aux données, au forum et au datalab.

    2

    Télécharger
    les données

    Jeu de données ouvertes issu de l'attribution des marchés publics de 2009 à 2016 (un million de transactions) et publié au Tender Electronic Daily (TED).

    3

    Construire
    son modèle

    Proposez un modèle économétrique et développez un algorithme qui estime la probabilité d'obtenir un marché public en fonction de la réputation d'une entreprise.

    4

    Tester
    le résultat

    L'application de l'algorithme de prévision sur un jeu de données test permettra d'obtenir un score de performance et une place dans le classement.

    5

    Gagner
    un trophée

    Le candidat qui réalise le meilleur résultat recevra un prix, une publication dans la revue MDS et de la visibilité dans les médias.

  • Données

    Accès aux données

    Le jeu de données utilisé pour ce challenge est issu de la commande publique de l’Union Européenne. Il s’agit des données ouvertes de l’attribution des marchés publics de 2009 à 2017 qui comprend près d’un million de transactions (nombre d’observations) et publié au Tender Electronic Daily (TED). Les données sont au format CSV et couvrent les marchés publics pour l’Espace économique européen, la Suisse et l’ancienne République yougoslave de Macédoine. Ces données incluent les champs les plus importants de l’avis d’attribution de marché. Une notice détaillée (en anglais) des données est fournie avec une description de chaque variable.

    Merci de télécharger les données dans le répertoire d’archive à l’adresse suivante : http://data.challenge-datascience.org/challenge.tar.bz2

    Jeu de données

    Les fichiers suivant sont remis aux candidats :

    • le fichier d'entrainement : dataChallenge_training
    • le fichier de test avec des lignes à prédire, où les 3 colonnes de réponse ont des valeurs fausses (aléatoires) : dataChallenge_test_reponses_fausses
    • le fichier de soumission où les candidats devront remplacer les valeurs fausses par leurs prédictions : dataChallenge_soumission_fausses 
    • une notice de description des variables (en anglais) : Notice des variables - Data Challenge 2018.pdf
  • Évaluation

    Etape d'entraînement et étape d'évaluation

    A la fin de la phase d’entraînement, les candidats soumettent (du 18 au 23 juin) leurs prévisions définitives à l’adresse suivante : soumission@challenge-datascience.org

    Le fichier à poster est le fichier dataChallenge_soumission_fausses où les candidats devront remplacer les valeurs fausses par leurs prédictions. Il s’agit d’un fichier de type CSV qui contient l’identifiant de la transaction (ID_AW) et les 3 variables à prédire (NUMBER_OFFERS ; AWARD_VALUE_EURO ; B_CONTRACTOR_SME).

    Avant de soumettre leurs résultats, les candidats devront renommer le fichier de la façon suivante : NOM_PRENOM.csv

    Métrique

    Les soumissions sont comparées aux valeurs réelles. La métrique d'évaluation pour les variables AWARD_VALUE_EURO et NUMBER_OFFERS est l'erreur quadratique moyenne RMSE. Celui pour B_CONTRACTOR_SME est la précision.

    Une péréquation est ensuite réalisée pour obtenir une évaluation et réaliser le classement. L’évaluation est un score global calculer à partir des 3 variables de réponse. Plus ce score est petit (de 0 à 1+), meilleure est la soumission. Le calcul pénalise les personnes qui commettent des erreurs sur les montants, mais amoindri l'impact des erreurs sur les très gros montants, ou sur les trop grands nombres de propositions.

  • Jury

    Le jury validera les résultats et désignera le vainqueur.

    Stéphane SAUSSIER

    Président du jury

    Professeur des Universités à l'IAE de Paris. Directeur de la Chaire Economie des Partenariats Public-Privé.

    Olivier MAMAVI

    Membre du jury

    Rédacteur en chef de la revue Management & Data Science. Enseignant-chercheur en intelligence économique.

    Henri LAUDE

    Membre du jury

    Chief Data Scientist. Co-fondateur Advanced Research Partners.

    Jean-David BENASSOULI

    Membre du jury

    Associé Responsable Data & Analytics PwC France et Afrique francophone.

  • Calendrier

    1

    Démarrage des inscriptions

    2 janvier 2018

    2

    Clôture des inscriptions

    26 mai 2018

    3

    Démarrage de la compétition

    28 mai 2018

    4

    Réception des livrables

    18 au 24 juin 2018

    5

    Annonce des résultats

    28 juin 2018

  • Contactez-nous

  • F.A.Q.

    Discussions et commentaires sur le challenge

    Cela traduit le fait que les variables observées ne prennent pas en compte des variables latentes...
    ID_AW correspond à un identifiant unique d'attribution de marchés publics. Mais lorsque un marché...
    La métrique d'évaluation pour les variables AWARD_VALUE_EURO et NUMBER_OFFERS est l'erreur...
    All Posts
    ×