Η κατάρα της διαστατικότητας: η αιτία ανακρίβειας των μαθηματικών μοντέλων

Είναι γνωστό ότι κάθε επιστημονική έρευνα της εποχής μας ξεκινά με κάποιου είδους μοντελοποίηση. Ένα μοντέλο παίρνει τις διαφορετικές παραμέτρους που εξετάζουμε και τις χρησιμοποιεί για να εξάγει συμπεράσματα σχετικά με το πώς λειτουργεί ο κόσμος μας. Είναι μία απλοποίηση της πραγματικότητας, που έχει σκοπό να ανακατασκευάσει μία αληθινή εικόνα, είτε πρόκειται για την εξάπλωση μίας επιδημίας, για τον πληθυσμό ενός είδους βατράχων ή για τον αριθμό των ανθρώπων που θα μετακομίσουν το 2020.

Όσο, όμως, αυξάνεται ο αριθμός των παραμέτρων που προσπαθούμε να εξετάσουμε, τόσο εξαλείφεται η πιθανότητα να φτάσουμε όσο το δυνατόν πλησιέστερα στον στόχο μας, την πραγματικότητα. Η αιτία αυτής της ανταλλαγής είναι η “κατάρα της διαστατικότητας” (curse of dimensionality). Δεν πρόκειται απλώς για έναν κανόνα ή έναν περιορισμό λόγω σφαλμάτων στις μετρήσεις, αλλά έχει την ισχύ μαθηματικής αλήθειας, όπως το Πυθαγόρειο Θεώρημα, και θέτει θεμελιώδη όρια στο τι μπορούν να περιγράψουν οι οικονομικές και άλλες κοινωνικές επιστήμες. Η κατάρα της διαστατικότητας είναι ο λόγος που οι εκτιμήσεις μας για το πώς εξελίσσεται μία επιδημία θα είναι πάντα ανακριβείς.

Ο όρος διαστάσεις αναφέρεται συνήθως στον χώρο και τον χρόνο που καταλαμβάνουμε, ωστόσο μπορεί κάλλιστα να περιλαμβάνει οποιοδήποτε σύνολο μετρήσιμων πραγμάτων, που είναι ανεξάρτητα μεταξύ τους. Για παράδειγμα, ας υποθέσουμε ότι θέλουμε ένα μοντέλο του πώς μία εκστρατεία για τη δημόσια υγεία μπορεί να επηρεάσει την εξάπλωση του ιού COVID-19. Θα χρησιμοποιήσουμε παράγοντες, όπως η εκτιμώμενη περίοδος επώασης της νόσου κάτω από συγκεκριμένες συνθήκες (έστω X), το ποσοστό των ανθρώπων που φορούν μάσκα σε δημόσιο χώρο έπειτα από την εκστρατεία (έστω Y), μία εκτίμηση της πιθανότητας μετάδοσης από άτομο σε άτομο (έστω Z), και ούτω καθεξής, για να εκτιμήσουμε τα μοτίβα διάδοσης. Για να κάνουμε προβλέψεις σχετικά με την επίδραση της καμπάνιας μας, θα χρειαστεί να βρούμε αριθμητικές τιμές για τα X, Y και Z (δηλαδή, να κάνουμε “Προσαρμογή του μοντέλου στα δεδομένα”).

Το μοντέλο μας έχει τρεις ανεξάρτητες διαστάσεις, οπότε οι παράμετροι X, Y και Z μπορούν να θεωρηθούν σημεία στον τρισδιάστατο χώρο. Άραγε, εάν βρούμε τις καλύτερες δυνατές τιμές των X, Y και Z χρησιμοποιώντας πραγματικά δεδομένα και τεχνικές μοντελοποίησης, θα είναι η εκτίμησή μας κοντά στην αληθινή τιμή (την οποία θα μπορούσαμε να παρατηρήσουμε απευθείας αν ήμασταν παντογνώστες);

Για να απαντήσουμε σε αυτή την ερώτηση, πρέπει να σκεφτούμε πώς συμπεριφέρονται τα σχήματα σε διαφορετικές διαστάσεις.

Εάν έχουμε ένα στερεό σώμα με ένα λεπτό κέλυφος γύρω του, το κέλυφος καταλαμβάνει μία απρόσμενα μεγάλη ποσότητα του όγκου του σώματος. Πάρτε για παράδειγμα ένα πορτοκάλι από το σούπερ μάρκετ, με διάμετρο εννέα εκατοστά και φλούδα με πάχος μόνο 0,45 εκατοστά. Περίπου το 25% του όγκου του πορτοκαλιού βρίσκεται στη φλούδα.

Τι θα γίνει εάν το πορτοκάλι βρίσκεται σε συσκευασία δώρου, τόσο μεγάλη ώστε το φρούτο να αγγίζει όλες τις πλευρές της; Επιστρέφοντας προσωρινά στις δύο διαστάσεις, ο κύκλος καταλαμβάνει το 78,5% της επιφάνειας του τετραγώνου στο οποίο είναι εγγεγραμμένος. Στις τρεις διαστάσεις, το πορτοκάλι καταλαμβάνει το 47,6% του κουτιού, ενώ το υπόλοιπο είναι αέρας. Όσο αυξάνονται οι διαστάσεις, το ποσοστό του όγκου του κουτιού που καταλαμβάνει το φρούτο ολοένα και μικραίνει. Μία σφαίρα τεσσάρων διαστάσεων καταλαμβάνει το 30,8% του όγκου του κουτιού. Στις εννέα διαστάσεις, το κουτί θα είναι κατά 99,54% άδειο, ή, αν είστε οπτιμιστής, το κουτί είναι κατά 0,46% γεμάτο.

Τώρα, ας σκεφτούμε το μοντέλο του ιού COVID-19 σαν να ήταν ένα σχήμα του τρισδιάστατου χώρου. Φανταστείτε το κέντρο του κουτιού να είναι η πραγματική τιμή των X, Y και Z και το εφαρμοστό κουτί να είναι το εύρος των καλύτερων προβλέψεών μας, αφορώντας την κάθε παράμετρο ξεχωριστά. Ορίζουμε το “κοντά” σαν να είμαστε μέσα στη σφαίρα, στο κέντρο του κελύφους ή του εφαρμοστού κουτιού. Η λέξη “κοντά” έχει την προφανή φυσική ερμηνεία, αλλά έχει νόημα και στον χώρο της πληροφορίας, όπου χρειάζεται η εκτίμησή μας για τα X, Y και Z να βρίσκεται σε μικρή απόσταση από την πραγματική τιμή. Το γεγονός ότι ένα σημείο που επιλέχθηκε τυχαία στο κουτί ανώτερης διάστασης έχει τόσο μικρή πιθανότητα να βρίσκεται κοντά στο κέντρο είναι ένα παράδειγμα της κατάρας της διαστατικότητας.

Έστω ότι θέλουμε το μοντέλο μας να είναι πιο περιγραφικό. Μία εκστρατεία για τη δημόσια υγεία θα έκανε τους ανθρώπους να πηγαίνουν στο σούπερ μάρκετ A% λιγότερο συχνά, θα ωθούσε το B% να εργάζεται από το σπίτι και το C% να σταματήσει να χρησιμοποιεί μέσα μαζικής μεταφοράς. Προσθέτοντας αυτές τις παραμέτρους, οδηγούμαστε σε ένα μοντέλο έξι διαστάσεων (A, B, C, X, Y, Z), ενώ μπορούμε εύκολα να σκεφτούμε τρεις ή τέσσερις παράγοντες ακόμα. Εάν μπορούσαμε να θέσουμε σαφή όρια στο αριθμητικό εύρος της κάθε μεταβλητής, τότε θα τοποθετούσαμε την εκτίμησή μας σε ένα εφαρμοστό κουτί γύρω από την πραγματική τιμή της εννεα-διάστατης παραμέτρου – πράγμα που μας δίνει 0,46% πιθανότητα να είναι το πλήρες μοντέλο μας με τις εννέα παραμέτρους κοντά στην πραγματικότητα.

Αυτή είναι η ισορροπία της μοντελοποίησης. Θέλουμε να κάνουμε τα μοντέλα μας πιο περιγραφικά προσθέτοντας περισσότερα στοιχεία, αλλά η κατάρα της διαστατικότητας μάς εγγυάται ότι αν προσπαθήσουμε να χρησιμοποιήσουμε ένα μοντέλο με πολλές παραμέτρους, η εκτίμησή μας δεν θα είναι καλή. Μπορούμε να κάνουμε ικανοποιητικές προβλέψεις για την επίδραση μιας εκστρατείας για τη δημόσια υγεία σε ένα ευρύ πλαίσιο με λίγες λεπτομέρειες, ή μπορούμε να κάνουμε ανακριβείς προβλέψεις σε ένα λεπτομερές πλαίσιο· ωστόσο, μεγάλη λεπτομέρεια και ακριβές αποτέλεσμα για όλες τις παραμέτρους είναι σχεδόν αδύνατο.

Οι λύσεις για έναν ερευνητή είναι η αποφυγή της εκτίμησης πολλών παραμέτρων ταυτόχρονα, η αποδοχή μοντέλων περιορισμένου εύρους και λίγων μεταβλητών, η κατασκευή μοντέλων με περισσότερες υποθέσεις, ώστε να ελαχιστοποιηθούν οι πληροφοριακές διαστάσεις, ή η καταβολή εξαιρετικά μεγάλου κόπου για την εξάλειψη της κάθε παραμέτρου με μεγάλη ακρίβεια. Εν ολίγοις, πρέπει να αντιστέκονται στην επιθυμία να ταιριάξουν τα τελευταία δεδομένα σε ένα ολιστικό μοντέλο. Οι αναγνώστες της έρευνας θα πρέπει από τη μεριά τους να αποδέχονται τους περιορισμούς των μοντέλων που δεν υπόσχονται να είναι η θεωρία των πάντων, και να παραμένουν σκεπτικοί ενάντια σε μοντέλο που δείχνουν ότι αψηφούν την κατάρα.

Γράφει ο: Ben Clemens

Μετάφραση: Χρήστος Κατσανδρής

Πηγή: scientificamerican.com

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s