Στις 5 Φεβρουαρίου 2022, ο Economist εξηγούσε το μοντέλο για την πρόβλεψη του αποτελέσματος των γαλλικών εκλογών, λέγοντας ότι το προβάδισμα του Γάλλου προέδρου στις δημοσκοπήσεις του δίνει πιθανότητα 79% να κερδίσει. Σημείωνε ωστόσο ότι από εκείνη την ημερομηνία μέχρι τον πρώτο γύρο της 10ης Απριλίου, πολιτικά μιλώντας, μεσολαβεί ένας αιώνας.
Το μοντέλο του Economist ενημερώνεται καθημερινά για να παρακολουθεί την τύχη των υποψηφίων μέχρι την πρώτη κάλπη. Αν ο Μακρόν κερδίσει, θα είναι ο πρώτο πρόεδρος που ανανεώνει τη θητεία του μετά τον Ζακ Σιράκ.
Παρ΄όλες τις πλούσιες παραδόσεις της η Γαλλία δεν έχει ακόμα σύνθετο μοντέλο πρόβλεψης των εκλογών όπως η Αμερική και η Βρετανία. Κι αυτό όχι γιατί είναι αδύνατο. Οι ουσιώδεις καταχωρήσεις – αξιόπιστες δημοσκοπήσεις – υπάρχουν εδώ και δεκαετίες. Από το 1964, όταν ο Economist ξεκίνησε την καταγραφή των στοιχείων για προεκλογικές προβλέψεις, οι δημοσκοπήσεις που γίνονται την τελική εβδομάδα της προεδρικής εκστρατείας και για τους δύο γύρους παρεκκλίνουν από το πραγματικό αποτέλεσμα της κάλπης κατά 2,5 ποσοστιαίες μονάδες. Ο Economist βασίζεται στο πλούσιο αρχείο δημοσκοπήσεων, παλιών και νέων.
Όπως έχουν δείξει πρόσφατες εκλογές, οι δημοσκοπήσεις δεν μπορούν να εξαλείψουν την αβεβαιότητα. Ούτε και το μοντέλο του Economist. Προσπαθεί να υπολογίσει στο μεγαλύτερο δυνατό βαθμό το στατιστικό λάθος στις γαλλικές εκλογικές δημοσκοπήσεις, αλλά το μοντέλο δεν εγγυάται τίποτα. Χρησιμοποιεί τη στατιστική για να καθορίσει τις θέσεις των υποψηφίων στις δημοσκοπήσεις σήμερα μέσα στο πλαίσιο της εξέλιξης προηγούμενων εκστρατειών και τα λάθη προηγούμενων δημοσκοπήσεων. Ο Economist λέει ότι η εκτίμηση για τον Μακρόν, για παράδειγμα, δεν του διασφαλίζει νίκη. Απλά παρατηρεί ότι 4 από τις 5 φορές οι υποψήφιοι που είχαν τέτοιο προβάδισμα 10 εβδομάδες πριν τις εκλογές συνέχιζαν με νίκη. Είναι περίπου το ίδιο με την πιθανότητα ένα επαγγελματίας ποδοσφαιριστής να πετύχει γκολ από τη γραμμή του πέναλτι.
Για πολλούς τα εκλογικά μοντέλα είναι μαύρο κουτί και οι στατιστικές τους μέθοδοι σκοτεινή τέχνη. Δεν συμβαίνει το ίδιο με το μοντέλο του Economist αφού δημοσιεύει τον θεμελιώδη κώδικα στον οποίο βασίζονται οι προβλέψεις τους. Η σκέψη πίσω από τις μεθόδους μας είναι επίσης άμεσα αντιληπτή. Η θεμελιώδης προσέγγιση μπορεί να συνοψιστεί με απλό τρόπο: συνδυάζουμε τις τρέχουσες δημοσκοπήσεις με τα στατιστικά λάθη του παρελθόντος για να δημιουργήσουμε πιθανότητες. Τα υπόλοιπα από τη σύνοψη αυτή συμπληρώνουν τις λεπτομέρειες.
Ξεκινώντας συγκεντρώνουν όλες τις τρέχουσες δημοσκοπήσεις για την προεδρική εκλογή. Μετά φτιάχνουν ένα δημοσκοπικό μέσο όρο για κάθε υποψήφιο, που είναι πιο ακριβής από κάθε ξεχωριστή δημοσκόπηση. Χρησιμοποιείται γι’αυτό ένα μέτρια περίπλοκο στατιστικό εργαλείο, με τη χρήση μιας καμπύλης που λέγεται «λωρίδα» που προσομοιάζει στις γραμμικές παλινδρομήσεις, που είναι γνωστές στους φοιτητές της στατιστικής. Έτσι δεν δίνεται πολύ βάρος στο παρελθόν και την οικοδόμηση υπεραυτάρεσκων μοντέλων, αλλά χρησιμοποιείται τεχνική μηχανικής μάθησης που λέγεται διασταυρούμενη επικύρωση.
Το επόμενο βήμα είναι ο υπολογισμός του ιστορικού λάθους στις δημοσκοπήσεις. Χρησιμοποιείται μέθοδος «χρονικής αλληλουχίας» που έχουν εκλαϊκεύσει οι πολιτικοί επιστήμονες Will Jennings και Christopher Wlezien, στων οποίων την σημαντική βάση δεδομένων δημοσκοπήσεων βασιζόμαστε επίσης. Καθώς πλησιάζει η μέρα των εκλογών, η διαφορά ανάμεσα στην δημοσκοπική εκτίμηση και το τελικό αποτέλεσμα μικραίνει. Για παράδειγμα, έξι μήνες πριν την ημερομηνία των εκλογών οι δημοσκοπήσεις διαφέρουν κατά πέντε ποσοστιαίες μονάδες από το τελικό αποτέλεσμα. Αυτό το μέσο «απόλυτο λάθος» μπορεί να υπολογιστεί σε κάθε σημείο της προεκλογικής διαδικασίας: τρεις μήνες πριν την εκλογή έως, ας πούμε, μέχρι την παραμονή.
Αυτή είναι διαφορετική μέτρηση από το «περιθώριο σφάλματος» που κάποιες φορές αναφέρεται από τους δημοσκόπους, που αντικατοπτρίζουν την πιθανότητα οι άνθρωποι που συμμετείχαν στην έρευνα να μην είναι αντιπροσωπευτικοί του γαλλικού εκλογικού σώματος. Το περιθώριο σφάλματος επίσης δεν αιτιολογεί τις εξίσου ανησυχητικές πιθανές παγίδες, όπως την περίπτωση συγκεκριμένου είδους ψηφοφόρων που συστηματικά αποφεύγουν τους δημοσκόπους, την περίπτωση οι ερωτήσεις να είναι άσχημα διατυπωμένες ή ότι οι δημοσκοπικές μέθοδοι για την διόρθωση γνωστών προκαταλήψεων να είναι λανθασμένες. Η μέθοδος «απόλυτου λάθους» λοιπόν δίνει μια καλύτερη αίσθηση συνολικής ακρίβειας.
Ο Economist σχολιάζει ότι όπως και με την παρασκευή μπογιάς ή ουίσκι, η μέθοδος της ανάμιξης είναι καίριο τελικό βήμα για τα εκλογικά μοντέλα. Με συγκεκριμένη αρχή (η θέση του υποψηφίου στις δημοσκοπήσεις μια συγκεκριμένη μέρα) και έναν οδηγό (το μέγεθος της αβεβαιότητας που συνεπάγεται από την ιστορία) μπορούν να γίνουν εικασίες για τον προορισμό. Η μέθοδος που προτιμά ο Economist όταν τα μαθηματικά γίνονται περίπλοκα, όπως εδώ, είναι να χρησιμοποιήσει προσομοίωση και να αφήσει τον υπολογιστή να απαντήσει στις ερωτήσεις. Το πότε πρέπει να αρχίσει η προσομοίωση καθορίζεται από τις σημερινές δημοσκοπήσεις. Το πόσο πρέπει να απέχουν μεταξύ τους δίνεται από το ιστορικό σφάλμα.
Υπάρχει μια τελευταία ιδιομορφία – ο μεγάλος αριθμός υποψηφίων -. Όταν οι εκλογές γίνονται ανάμεσα σε δύο υποψηφίους, οι στατιστικολόγοι μπορούν βολικά να μιμηθούν σφάλμα παίρνοντας ψήφους από τον ένα υποψήφιο και μεταφέροντας στον άλλο απευθείας (αυτή είναι η φύση του συστήματος μηδενικού αθροίσματος). Αλλά σε μια μάχη με πολλούς υποψήφιους, αυτή η διαδικασία δεν είναι τόσο απλή. Οι χαμένοι ψηφοφόροι ενός υποψηφίου δεν μοιράζονται εξίσου στους υπόλοιπους. Για παράδειγμα, το ποσοστό του Μακρόν τείνει να πέφτει καθώς ανεβαίνει το ποσοστό υπέρ της Βαλερί Πεκρές, της κεντρο-δεξιάς υποψηφίου των Ρεπουμπλικάνων. Αυτό λύνεται με την παρακολουθήσει των ανταλλαγών στους δημοσκοπικούς μέσους όρους στη διάρκεια της προεκλογικής εκστρατείας και τον υπολογισμό ενός πίνακα συνδιακυμάνσεων – ενός πίνακα που ορίζει πώς οι ψήφοι κάθε υποψηφίου κινούνται σε σχέση με τις ψήφους όλων των υπόλοιπων.
Τέλος, αυτές οι διασυνδέσεις μπορούν να ποσοστικοποιηθούν ανάμεσα σε όλα τα ζεύγη υποψηφίων και να προσομοιωθούν 10.000 πιθανά αποτελέσματα πρώτου γύρου με βάση τους εξής σημαντικούς παράγοντες: η τρέχουσα υπολογιζόμενη θέση των υποψηφίων, οι παρατηρηθείσες διακυμάνσεις μεταξύ των ζευγών υποψηφίων και η ιστορική αβεβαιότητα των δημοσκοπήσεων. Με αυτές τις προσομοιώσεις στον πρώτο γύρο, επαναλαμβάνεται η διαδικασία για τον απλούστερο δεύτερο γύρο. Για κάθε προσομοίωση πρώτου γύρου, παράγονται 1.000 προσομοιώσεις δεύτερου γύρου χρησιμοποιώντας τα μοτίβα για τις δημοσκοπήσεις του δεύτερου γύρου για τους δύο πρώτους υποψήφιους. Ο Economist έτσι κάνει συνολικά 10 εκατ. προσομοιώσεις για τις γαλλικές εκλογές – που ανανεώνονται καθημερινά.
“Bonne chance”
Στην αρχή των υπολογισμών του Economist, o Εμμανουέλ Μακρόν κέρδισε περίπου 7.9 εκατ. από αυτές τις προσομοιώσεις – κάτι που του δίνει σημαντική (αλλά όχι βέβαιη) πιθανότητα να επανεκλεγεί με ποσοστό 79%. Η Πεκρές είναι η δεύτερη επικρατέστερη να κερδίσει, με αρκετά μικρότερο ποσοστό 13%. Η ακροδεξιά υποψήφια Λε Πεν έρχεται Τρίτη με πιθανότητα 6%. Σύμφωνα με τις σημερινές (05/02) δημοσκοπήσεις οι άλλοι υποψήφιοι είναι εξαιρετικά απίθανο να κερδίσουν μοιραζόμενοι το υπόλοιπο 2%.
Ο εξέχων στατιστικός George Box κάποτε είπε ότι «όλα τα μοντέλα είναι λάθος αλλά κάποια είναι χρήσιμα». Για μια άσκηση τόσο περίπλοκη, ένα μοντέλο όπως του Economist πρέπει να απλοποιηθεί. Αλλά θα αποδειχθεί χρήσιμο αν μετρήσει σωστά την αβεβαιότητα. Μπορεί τον Μακρόν να τον ευνοούν οι αρχικές πιθανότητες, αλλά δεν πρέπει να επαναπαυθεί. Πόσοι από μας δεν έχουμε δει ποδοσφαιριστές να χάνουν το γκολ από τη γραμμή του πέναλτι;