Δημοσκοπήσεις από το μηδέν

Γιάννηs Κωνσταντινίδηs 18 Σεπ 2015

Αριθμοί παντού. Υπολογισμοί συνεχώς. Εκτιμήσεις από τον καθένα και στον αέρα. Σε κάθε προεκλογική περίοδο, το μιντιακό κοινό γίνεται δέκτης δεκάδων μετρήσεων της πρόθεσης ψήφου στην επικείμενη αναμέτρηση. Όσο έντονα και να τις αναζητούν όμως, οι εκλογείς τις αντιμετωπίζουν πλέον από επιφυλακτικά έως σκωπτικά, κυρίως λόγω της καλλιεργούμενης από τα πολιτικά κόμματα εντύπωσης περί αποτυχίας τους σε προηγούμενες προβλέψεις και της συχνά σημαντικής ανομοιομορφίας των εκτιμήσεων διαφορετικών φορέων. Δίκαιη ή άδικη, η κριτική σε βάρος των δημοσκοπήσεων γίνεται σε λανθασμένη βάση και ίσως θα πρέπει να επιχειρηθεί η διαλεύκανση ορισμένων σημείων που συστηματικά απουσιάζουν από τη σχετική δημόσια συζήτηση.

Κατά πρώτον, οι δημοσκοπήσεις εφαρμόζουν μια συγκεκριμένη τεχνική πρόβλεψης μιας τιμής του πληθυσμού (για παράδειγμα, ποσοστό ενός κόμματος) βασιζόμενη σε ένα δείγμα του πληθυσμού. Κάθε τέτοια πρόβλεψη, σύμφωνα με τη στατιστική, καταλήγει σε ένα διάστημα ποσοστών, και όχι σε ένα συγκεκριμένο ποσοστό. Για τα ποσοστά του μεγέθους των δύο μεγαλύτερων σήμερα κομμάτων (π.χ. 25%-28%) και για μεγέθη δείγματος της τάξης των 1000 ατόμων, το εύρος του διαστήματος αυτού ξεπερνά το 5%. Αυτό σημαίνει ότι, βάσει του δείγματος, όλες οι τιμές εντός αυτού του εύρους είναι πιθανές για την πραγματική τιμή-ποσοστό του κόμματος στον πληθυσμό. Με άλλα λόγια, σε μία δημοσκόπηση θα πρέπει να δίνεται το διάστημα μέσα στο οποίο εκτιμάται ότι θα βρεθεί το τελικό ποσοστό ενός κόμματος και όχι μόνο μία τιμή.

Για παράδειγμα, μία δημοσκόπηση που παρουσιάζεται ότι δίνει 28% στον ΣΥΡΙΖΑ και 23% στη ΝΔ, στην πραγματικότητα εκτιμά ότι το ποσοστό του ΣΥΡΙΖΑ θα κινηθεί μεταξύ 25.5% και 30.5% και το ποσοστό της ΝΔ θα κινηθεί μεταξύ 20.5% και 25.5%. Καθώς το κάτω άκρο του ενός διαστήματος εφάπτεται με το άνω άκρο του άλλου διαστήματος, μια τέτοια δημοσκόπηση στην πραγματικότητα δεν μπορεί να εκτιμήσει ποιος θα είναι ο νικητής. Ακόμα λοιπόν και αν οι δειγματικοί μέσοι των δύο πρώτων κομμάτων απέχουν 5%, η διαφορά αυτή δεν είναι επαρκής για την πρόβλεψη του πρώτου και του δεύτερου κόμματος. Εξυπακούεται ότι τα λεγόμενα «προβαδίσματα» του 0.2% και του 0.4% στερούνται οποιασδήποτε επιστημονικής λογικής. Το ίδιο ισχύει και για την περίπτωση των κομμάτων που κινούνται περί του ορίου του 3% και για τα οποία το εύρος του ανάλογου διαστήματος φτάνει στο 1%. Εκτιμήσεις με δειγματικούς μέσους στο 2.5% σημαίνουν ότι το τελικό ποσοστό του κόμματος θα κινηθεί μεταξύ 1.5% και 3.5% και συνεπώς είναι εντελώς αβέβαιη η εκτίμηση ότι το κόμμα αυτό δε θα πετύχει την είσοδό του στη Βουλή. Ο βαθμός επιτυχίας των δημοσκοπήσεων λοιπόν πρέπει να κρίνεται στη βάση της σύγκρισης αυτών των διαστημάτων με το τελικό αποτέλεσμα, αν και πάλι η στατιστική επιστήμη αφήνει ένα μικρό περιθώριο μη συμπερίληψης του ποσοστού και στο διάστημα αυτό.

Κατά δεύτερον, οι εκτιμήσεις πρόθεσης ψήφου διαφορετικών φορέων βασίζονται, όπως η διεθνής πρακτική επιβεβαιώνει, σε διαφορετικές τεχνικές στάθμισης των δεδομένων. Η πιο διαδεδομένη από αυτές είναι η στάθμιση βάσει δημογραφικών χαρακτηριστικών (ηλικία και φύλο) με στόχο την κάλυψη, πιο συχνά, πιθανών κενών ανδρών ηλικίας έως 34 ετών για παράδειγμα. Η εφαρμογή της τεχνικής αυτής πιθανώς επιφέρει μια διαφοροποίηση στην εκτίμηση στις περιπτώσεις που οι νέοι άνδρες έχουν μια συγκεκριμένη, και διαφορετική από το υπόλοιπο εκλογικό σώμα, προτίμηση. Σε κάθε περίπτωση, η στάθμιση βάσει ηλικίας και φύλου είναι λογική, καθώς πρόκειται για ένα σταθερό χαρακτηριστικό του πληθυσμού το οποίο θα πρέπει όντως να χρησιμοποιείται ως σημείο αναφοράς. Συχνά ωστόσο χρησιμοποιείται και η στάθμιση βάσει προηγούμενης ψήφου με στόχο την κάλυψη κενών στο δείγμα μας σε ψηφοφόρους συγκεκριμένων κομμάτων. Για παράδειγμα, αν το δείγμα καταγράψει μόνο 21% ψηφοφόρους της ΝΔ του Ιανουαρίου 2015, επιλέγεται η στάθμιση του δείγματος με τρόπο που οι ψηφοφόροι αυτοί θα αποκτήσουν μεγαλύτερη βαρύτητα στο δείγμα μας βάσει της λογικής ότι είναι λιγότεροι από το 28% που έλαβε η ΝΔ τον Ιανουάριο και συνεπώς πρέπει να δοθεί μεγαλύτερη βαρύτητα σε αυτούς. Η τεχνική αυτή επιφέρει με βεβαιότητα μια διαφοροποίηση στην εκτίμηση, καθώς ενισχύεται μέσω της στάθμισης η παρουσία ψηφοφόρων συγκεκριμένου κόμματος και στην πρόθεση ψήφου. Η τεχνική αυτή μπορεί να δώσει σημαντικές διαφοροποιήσεις στις εκτιμήσεις ακόμα και με το ίδιο δείγμα! Στην προκειμένη χρονική στιγμή, η χρήση αυτής της τεχνικής στάθμισης μπορεί να μεταβάλει μια διαφορά 5% υπέρ του ΣΥΡΙΖΑ στην απόλυτη ισοπαλία. Συνεπώς, είναι η χρήση αυτής της τεχνικής που δύναται να εξηγήσει διαφορές στις εκτιμήσεις διαφορετικών φορέων υλοποίησης δημοσκοπήσεων και φυσικά όχι οποιαδήποτε λαθροχειρία επί των δεδομένων. Η επιστημονική συζήτηση για τη χρήση ή μη της τεχνικής της στάθμισης βάσει προηγούμενης ψήφου είναι ανοιχτή, αν και θα πρέπει να επισημανθεί ότι η εφαρμογή της σε περιβάλλοντα έντονης ρευστότητας της ψήφου δεν ενδείκνυται λόγω της δυσκολίας να καταγραφεί ορθά η, κατά δήλωση του ψηφοφόρου, προηγούμενη ψήφος, δηλαδή ένα μη σταθερό χαρακτηριστικό (μη ανάλογο του φύλου και της ηλικίας).

Δεδομένης της μεταβλητότητας των επιλογών ψήφου σε ένα κατακερματισμένο και υπό επαναδιαμόρφωση κομματικό σύστημα και της συνεπαγόμενης επίδρασης των μετρήσεων στις επιλογές της κοινής γνώμης, η συζήτηση επί των ευρημάτων δημοσκοπήσεων πρέπει να γίνεται με εξαιρετική προσοχή από όλες τις πλευρές: την επιστημονική κοινότητα, πρώτα από όλα, αλλά και τις εταιρείες δημοσκοπήσεων, τα πολιτικά κόμματα και τα μίντια. Μετά από την παροχή των αναγκαίων διευκρινίσεων, οποιαδήποτε προσπάθεια παρερμηνείας θα πρέπει να θεωρείται βάσιμα πλέον εκ του πονηρού.