Ακριβώς αυτή την εβδομάδα, ο Spotify άρχισε να δοκιμάζει αρχεία ήχου χωρίς απώλειες. Αλλά τι είναι "χωρίς απώλειες" ήχος, ακριβώς, και πώς λειτουργεί η ψηφιακή συμπίεση ήχου;

Πώς λειτουργεί η συμπίεση ήχου;

Ο στόχος στη συμπίεση ήχου είναι να μειωθεί ο αριθμός των bits που απαιτούνται για την ακριβή αναπαραγωγή ενός αναλογικού ήχου. Η πρώτη διαδικασία που θα εξετάσουμε ονομάζεται "lossy". Η απώλεια συμπίεσης είναι μια μονόδρομη τεχνική που απορρίπτει μη κρίσιμα δεδομένα για εξοικονόμηση χώρου. Αυτές οι τεχνικές είναι οι πιο συνηθισμένες μέθοδοι που χρησιμοποιούνται για τη συμπίεση αρχείων ήχου, που εμφανίζονται σε αρχεία MP3, AAC και WMA. Υπάρχουν δύο θέσεις που οι κωδικοποιητές lossy φαίνονται να αποθηκεύουν bits: ρυθμό bit και ψυχοακουστική.

Bit Rate

Ο ρυθμός bit μετράει την ποσότητα των bits που χρησιμοποιούνται για την κωδικοποίηση ενός δευτερολέπτου ήχου. Για παράδειγμα, αν χρησιμοποιούμε κωδικοποίηση χαμηλής ποιότητας, 8 kilobit-ανά δευτερόλεπτο (kbps), ο αλγόριθμός μας περιορίζεται στη χρήση μόνο 8 kilobits δεδομένων για να περιγράψει κάθε δευτερόλεπτο του ήχου. Αυτό είναι σαν να προσπαθείς να περιγράψεις μια έγχρωμη φωτογραφία με μερικές εκατοντάδες pixels. Μπορεί να έχετε τα ευρεία εγκεφαλικά επεισόδια σωστά, αλλά συνολικά θα κοιτάξετε μια σοβαρά υποβαθμισμένη εικόνα. Αν χρησιμοποιούμε ρυθμό bit υψηλότερης ποιότητας, όπως 192 kbps, διαθέτουμε αρκετό χώρο για να καλύψουμε τις λεπτομέρειες. Για να επιστρέψουμε στο φωτογραφικό μας παράδειγμα, έχουμε τώρα αρκετά εικονοστοιχεία για να περιγράψουμε τα διάφορα φώτα, τα σκούρα και τα χρώματα σε μια εικόνα. Ο υψηλός ρυθμός δυαδικών ψηφίων δεν καθορίζει από μόνο του την ποιότητα μίας εγγραφής, αλλά ένας χαμηλός ρυθμός bit μπορεί να περιορίσει σημαντικά την ποιότητα της εξόδου.

Ψυχοακουστική

Η ψυχοακουστική είναι η επιστήμη του πώς ο εγκέφαλος καταλαβαίνει τους ήχους. Με το χειρισμό γνωστών ιδιοτροπιών στον τρόπο με τον οποίο οι άνθρωποι αντιλαμβάνονται τους ήχους, οι αλγόριθμοι συμπίεσης μπορούν να αφαιρέσουν έξυπνα στοιχεία που τα περισσότερα ανθρώπινα αυτιά δεν θα χάσουν. Ο στόχος είναι να "στρογγυλοποιήσουν" τις πληροφορίες που δεν θα αλλάξουν την αντιληπτή ποιότητα ήχου ενός κομματιού, απομακρύνοντας με σύνεση μόνο τις ασήμαντες πληροφορίες.

Για παράδειγμα, μπορεί να γνωρίζετε ότι το τυπικό εύρος της ανθρώπινης ακοής είναι μεταξύ 20Hz και 20kHz. Προφανώς, οι ήχοι έξω από αυτό το εύρος μπορούν να αφαιρεθούν. Επιπλέον, το πιο λεπτομερές εύρος της ανθρώπινης ακοής είναι μεταξύ 100Hz και 4kHz, και η απομάκρυνση των ήσυχων ήχων εκτός αυτών των περιοχών συχνότητας προκαλεί ελάχιστη ζημιά στην ποιότητα μιας εγγραφής. Μπορούμε να κάνουμε ένα παρόμοιο τέχνασμα με εξαιρετικά αντίθεση ήχους. Εάν ένας πολύ δυνατός ήχος και πολύ ήσυχος ήχος παίζουν ταυτόχρονα, ο ήχος ήχος είναι πολύ πιο δύσκολος από ό, τι θα ήταν από μόνος του. Οι κωδικοποιητές εκμεταλλεύονται αυτήν την "ηχητική μάσκα" για να αφαιρέσουν τον ήχο, εξοικονομώντας κομμάτια στη διαδικασία.

Η συχνότητα μπορεί επίσης να επηρεάσει πόσο καλά αντιλαμβανόμαστε τους ήχους. Για παράδειγμα, μια επίμονη, χαμηλής συχνότητας τύμπανο τυμπάνου τείνει να πνίξει τις πιο ευαίσθητες, υψηλότερης συχνότητας αρμονικές των μελωδικών οργάνων. Και η κάλυψη ήχου είναι ιδιαίτερα αποτελεσματική πάνω από 15kHz, όπου η ανθρώπινη ακοή είναι συνήθως λιγότερο ευαίσθητη από την αρχή.

Τα κοινά προγράμματα συμπίεσης ήχου όπως το MP3 εκμεταλλεύονται το πλήρες φάσμα των δυνατοτήτων συμπίεσης ενώ προσπαθούν να παραμείνουν όσο το δυνατόν πιστότερα στην αρχική εγγραφή. Φυσικά, μερικοί λαοί αισθάνονται ότι η αφαίρεση αυτών των συχνοτήτων προκαλεί σοβαρή ζημιά στην ηχογράφηση. Αυτός είναι ο λόγος που υπάρχουν πρότυπα απώλειας συμπίεσης.

Τι είναι ο ήχος χωρίς απώλειες;

Ο στόχος της συμπίεσης ήχου χωρίς απώλειες είναι να μειώσει το μέγεθος του αρχείου ενώ αφήνει ανέγγιχτο τον αρχικό ήχο. Αυτοί οι κωδικοποιητές δεν χρησιμοποιούν καμία από τις παραπάνω τεχνικές μόνιμης συμπίεσης, εστιάζοντας αντ 'αυτού σε πλήρως αναστρέψιμες μεθόδους συμπίεσης δεδομένων. Χρησιμοποιούν τεχνικές συμπίεσης χωρίς απώλειες που δανείστηκαν από αλγόριθμους συμπίεσης αρχείων όπως ZIP για να αφαιρέσουν πλεονάζοντα δεδομένα διατηρώντας παράλληλα την ακεραιότητα των υποκείμενων πληροφοριών. Δύο δημοφιλείς κωδικοποιητές ήχου χωρίς απώλειες - FLAC και Apple Lossless (ALAC) - και τα δύο χρησιμοποιούν προγράμματα βασισμένα στη συμπίεση ZIP.

Η εστίαση στη συμπίεση δεδομένων σημαίνει μόνο τη διατήρηση πολλών από τις λεπτομέρειες που θα καταστρέψουν τα αρχεία MP3 και άλλα πρότυπα απώλειας. Εάν έχετε αιχμηρά αυτιά και μια ρύθμιση ακρόασης υψηλής ποιότητας, η διαφορά μπορεί να είναι ψηλαφητή.

Η χωρίς απώλειες συμπίεση δεν είναι μόνο καλό για ακρόαση: είναι επίσης ένα εξαιρετικό εργαλείο αποθήκευσης. Ακριβώς όπως δεν θα θέλατε να είναι το 72dpi JPG για να είναι το μοναδικό ψηφιακό αντίγραφο των φωτογραφιών του Ansel Adam, δεν θέλουμε μόνο 128kbps MP3s "Kind of Blue." Τα Lossless πρότυπα όπως το FLAC μας επιτρέπουν να αποθηκεύουμε τον ήχο αποτελεσματικά χωρίς να πετάμε δυνητικά πολύτιμα δεδομένα. Κάνουν επίσης την επαναφορά και την αναδιανομή του ήχου ευκολότερα, αφού ξεκινώντας με τους ασυμβίβαστους πλοιάρχους σημαίνει ένα τελικό προϊόν υψηλότερης ποιότητας.

Συμπέρασμα: Μπορείτε να πείτε τη διαφορά;

Οι μορφές ήχου χωρίς απώλειες επιτρέπουν καλύτερες ηχογραφήσεις. Αλλά μερικές φορές οι διαφορές ανάμεσα σε ένα MP3 υψηλής ποιότητας και ένα αρχείο χωρίς απώλειες είναι σχεδόν ανεπαίσθητες, ειδικά στο μη εκπαιδευμένο αυτί. Εάν θέλετε να δείτε αν τα ακουστικά (και τα αυτιά σας) είναι αρκετά έντονα για να πείτε τη διαφορά, το NPR έχει μια δοκιμασία διασκέδασης. μην ξεχνάτε ότι τα φτηνά ακουστικά και τα ηχεία φορητών υπολογιστών δεν θα είναι σε θέση να αναπαράγουν τις λεπτές διαφορές μεταξύ του ήχου χωρίς MP3 και των MP3. Για μια πιο σοβαρή ανάλυση των κωδικοποιητών, ελέγξτε τις βαθμολογίες κωδικοποιητή SoundExpert.