Ακούγωντας ένα τραγούδι που μας αρέσει, μας έσπαγε τα νεύρα όταν ρωτούσαμε δεξιά και αριστερά και δεν το ήξερε κανείς, ώστε να το βάλουμε στο σπίτι μέχρι να το βαρεθούμε. Και αν το άκουγες σε club, θα ήταν αδύνατο κάθε φορά να διασχίζεις το μισό μαγαζί που είναι γεμάτο από κόσμο, για να ρωτήσεις τον Dj. Εκτός κι αν κάθε φορά φρόντιζες να κάτσεις δίπλα του.
Εδώ και αρκετά χρόνια, το πρόβλημα αυτό έχει λυθεί, με την εφαρμογή που έφτιαξαν οι Avery Wang, Chris Barton, Philip Inghelbrecht και Dhiraj Mukherjee. Το Shazam χρησιμοποιώντας το μικρόφωνο του κινητού σου, ηχογραφεί ένα μέρος του τραγουδιού και με εκπληκτική ταχύτητα σου επαναφέρει το αποτέλεσμα που τόσο επιθυμούσες. Όμως είναι σχεδόν αδύνατο να υπάρχει μια τόσο μεγάλη βάση δεδομένων, όπου θα είναι αποθηκευμένα όλα τα τραγούδια και να γίνεται έτσι η αναγνώριση. Θα έπαιρνε πολύ περισσότερο χρόνο για να γίνει κάτι τέτοιο. Πως λειτουργεί λοιπόν το Shazam;
Η λογική του Shazam βασίζεται σε ακουστικά αποτυπώματα του κάθε τραγουδιού, δηλαδή στο φασματογράφημα καθενός από αυτά. Στην προκειμένη περίπτωση, το φασματογράφημα είναι ένα τρισδιάστατο γράφημα χρόνου, συχνότητας και έντασης. Κάθε άξονας του γραφήματος αντιστοιχεί σε ένα από αυτά τα τρία στοιχεία. Από εκεί και περά, σε κάθε σημείο του γραφήματος αντιστοιχεί η ένταση μιας συγκεκριμένης συχνότητας σε μια συγκεκριμένη χρονική στιγμή.
Με έναν αλγόριθμο, το Shazam χρησιμοποιεί και συγκρίνει την συχνότητα του ήχου την χρονική στιγμή που η ένταση είναι η μέγιστη. Χρησιμοποιώντας λοιπόν το ακουστικό αποτύπωμα των 10 δευτερολέπτων, ανατρέχει σε μια βάση δεδομένων όπου δεν βρίσκονται τα τραγούδια, αλλά τα φασματογραφήματά τους! Το μέγεθός του φασματογραφήματος, συγκριτικά με εκείνο ενός τραγουδιού, είναι πάρα πολύ μικρότερο, δίνοντας έτσι τον τρόπο στην εφαρμογή να κάνει την δουλειά της με ταχύτητα.
Το κλειδί στον πίνακα ακουστικών αποτυπωμάτων του Shazam είναι η συχνότητα. Η αναζητήσεις που θα κάνει όταν το λάβει θα είναι αλλεπάλληλες και πιο γρήγορες, ώστε να σου δώσει ένα γρήγορο αποτέλεσμα. Κάποιες φορές, με την ύπαρξη δυνατών θορύβων, το Shazam δεν μπορεί να επιστρέψει αποτέλεσμα. Ωστόσο, αν η σύγκριση των δυο ακουστικών αποτυπωμάτων, εκείνου που ηχογράφησε ο χρήστης και αυτού που υπάρχει στην βάση δεδομένων, είναι επιτυχής, τότε οι πληροφορίες εμφανίζονται στον χρήστη μέσα σε λίγα δευτερόλεπτα.