Όλοι γνωρίζουμε ότι υπάρχει ένα όριο 140 χαρακτήρων στα tweets που στέλνουμε στο δημοφιλές κοινωνικό δίκτυο Twitter και εύλογα γεννάται η απορία του πόσα διαφορετικά tweets είναι εφικτό να υπάρξουν. Πρακτικά, αμέτρητα αλλά χρησιμοποιώντας μαθηματικά μπορούμε να έχουμε μια πολύ καλή προσέγγιση:
Λαμβάνοντας υπόψιν, λοιπόν, το όριο των 140 χαρακτήρων και την ύπαρξη 26 γραμμάτων στην αγγλική αλφάβητο (27 αν μετρήσουμε και το κενό) υπάρχουν 27140≈10200 πιθανοί συνδυασμoί. Επειδή, βέβαια, το Twitter δεν σε περιορίζει σε αυτούς τους χαρακτήρες αλλά υποστηρίζει και το Unicode ο πιθανός αριθμός διαφορετικών συνδυασμών ανεβαίνει στο 10800. Όλα ωραία μέχρι εδώ αλλά αυτός ο αριθμός μας δίνει έναν συνδυασμό γραμμάτων που δεν δημιουργούν απαραίτητα λέξεις και προτάσεις με νόημα!
Ο Claude Shannon καθόρισε ότι το περιεχόμενο πληροφοριών της καθομιλουμένης στα Αγγλικά είναι περίπου 1.0 με 1.2 bits ανά γράμμα. Αυτό σημαίνει ότι ένας καλός αλγόριθμος μπορεί να συμπιέσει κείμενο ASCII στα Αγγλικά που είναι 8 bits ανά γράμμα σε περίπου το ένα όγδοο του αρχικού μεγέθους. Οπότε εάν ένα κομμάτι κειμένου περιέχει χ bits πληροφοριών, τότε υπάρχουν 2χ διαφορετικά μηνύματα που μπορεί να μεταφέρει. Με λίγη μαθηματική μαγεία συμπεραίνουμε ότι υπάρχουν χοντρικά 2140×1.1≈2×1046 διαφορετικοί συνδυασμοί αγγλικών προτάσεων σε tweets. Αυτό θα απαιτούσε περίπου 1047 δευτερόλεπτα για να διαβαστούν όλα τα tweets!
Πηγη
Λαμβάνοντας υπόψιν, λοιπόν, το όριο των 140 χαρακτήρων και την ύπαρξη 26 γραμμάτων στην αγγλική αλφάβητο (27 αν μετρήσουμε και το κενό) υπάρχουν 27140≈10200 πιθανοί συνδυασμoί. Επειδή, βέβαια, το Twitter δεν σε περιορίζει σε αυτούς τους χαρακτήρες αλλά υποστηρίζει και το Unicode ο πιθανός αριθμός διαφορετικών συνδυασμών ανεβαίνει στο 10800. Όλα ωραία μέχρι εδώ αλλά αυτός ο αριθμός μας δίνει έναν συνδυασμό γραμμάτων που δεν δημιουργούν απαραίτητα λέξεις και προτάσεις με νόημα!
Ο Claude Shannon καθόρισε ότι το περιεχόμενο πληροφοριών της καθομιλουμένης στα Αγγλικά είναι περίπου 1.0 με 1.2 bits ανά γράμμα. Αυτό σημαίνει ότι ένας καλός αλγόριθμος μπορεί να συμπιέσει κείμενο ASCII στα Αγγλικά που είναι 8 bits ανά γράμμα σε περίπου το ένα όγδοο του αρχικού μεγέθους. Οπότε εάν ένα κομμάτι κειμένου περιέχει χ bits πληροφοριών, τότε υπάρχουν 2χ διαφορετικά μηνύματα που μπορεί να μεταφέρει. Με λίγη μαθηματική μαγεία συμπεραίνουμε ότι υπάρχουν χοντρικά 2140×1.1≈2×1046 διαφορετικοί συνδυασμοί αγγλικών προτάσεων σε tweets. Αυτό θα απαιτούσε περίπου 1047 δευτερόλεπτα για να διαβαστούν όλα τα tweets!
Πηγη
0 σχόλια:
Δημοσίευση σχολίου