Σε ποια μορφή είναι καλύτερο να ακούτε μουσική. Τρεις φάλαινες χαμένες
Σε ποια μορφή είναι καλύτερο να ακούτε μουσική. Τρεις φάλαινες χαμένες
Anonim

Η κατανόηση των μορφών ψηφιακού ήχου δεν είναι καθόλου εύκολη. Είναι ακόμη πιο δύσκολο να βγάλουμε ένα ξεκάθαρο συμπέρασμα σε ποια μορφή είναι καλύτερο να ακούτε μουσική. Αν κοιτάξετε τον συγκριτικό πίνακα των μορφών ήχου στη Wikipedia, τα μάτια σας θα αρχίσουν να κυματίζουν με στήλες σιωπηλών αριθμών. Ας προσπαθήσουμε να καταλάβουμε τι κρύβεται πίσω από αυτό.

Σε ποια μορφή είναι καλύτερο να ακούτε μουσική. Τρεις φάλαινες χαμένες
Σε ποια μορφή είναι καλύτερο να ακούτε μουσική. Τρεις φάλαινες χαμένες

Ας κάνουμε αμέσως επιφύλαξη ότι το άρθρο μιλάει ΜΟΝΟ για γενικά χαρακτηριστικά και δεν θα περιλαμβάνει κάποιες λεπτομέρειες. Στο μέλλον, η Lifehacker θα διεξάγει τη δική της αμερόληπτη έρευνα. Και σήμερα θα προσπαθήσουμε να γενικεύσουμε την ήδη γνωστή εμπειρία με τον ένα ή τον άλλο τρόπο.

Υπάρχει ένα ανάλογο και ένα σχήμα.

Το αναλογικό είναι καλό, αλλά βραχύβιο και άβολο. Επομένως, τα αναλογικά μέσα, παρά τις υψηλές πωλήσεις βινυλίου, δεν θα επιστρέψουν.

Ο ψηφιακός ήχος μπορεί να είναι τριών κύριων τύπων:

  • σε μορφή που δεν χρησιμοποιεί συμπίεση.
  • σε μορφή που χρησιμοποιεί συμπίεση χωρίς απώλειες.
  • σε μορφή που χρησιμοποιεί συμπίεση με απώλειες.

Με την πρώτη ματιά, οι μορφές χωρίς απώλειες είναι πιο ελπιδοφόρες. Αυτό δεν συμβαίνει πάντα, καθώς θα συζητήσουμε λεπτομερέστερα σε ένα από τα ακόλουθα υλικά. Οι ασυμπίεστες μορφές δεν έχουν κανένα νόημα εκτός από την αποθήκευση των βασικών εγγραφών που απαιτούνται για τη δημιουργία περιεχομένου ήχου. Είναι πιο εύκολο να αποκατασταθούν. Η αποθήκευση και η ακρόαση εγγραφών στο σπίτι είναι περιττές.

Από τις πολλές παραμέτρους του ψηφιακού ήχου, ο χρήστης θα πρέπει πρώτα απ' όλα να ενδιαφέρεται για τη συχνότητα δειγματοληψίας (την ακρίβεια ψηφιοποίησης ενός αναλογικού σήματος στο χρόνο), το βάθος bit (την ακρίβεια της ψηφιοποίησης σε πλάτος - ένταση), το ρυθμό μετάδοσης bit (το ποσό πληροφορίες που περιέχονται στο αρχείο ανά δευτερόλεπτο).

Σήμερα θα μιλήσουμε για απώλειες.

Για τον συμπιεσμένο ήχο, η έννοια του ψυχοακουστικού μοντέλου είναι πολύ σημαντική - οι ιδέες των επιστημόνων και των μηχανικών σχετικά με το πώς ένα άτομο αντιλαμβάνεται τον ήχο. Το αυτί αντιλαμβάνεται όλο το φάσμα των ακουστικών κυμάτων που φτάνουν σε αυτό. Ωστόσο, ο εγκέφαλος επεξεργάζεται τα σήματα.

Η τιμή αναφοράς του εύρους που ακούγεται από τον άνθρωπο είναι από 16 Hz έως 20 kHz, αλλά δεν είναι σε θέση να ακούει και να γνωρίζει ταυτόχρονα όλους τους εισερχόμενους ήχους.

Η ακοή είναι διακριτή και η ακουστική της ευαισθησία μη γραμμική.

Τα σύγχρονα ψυχοακουστικά μοντέλα αξιολογούν με ακρίβεια την ανθρώπινη ακοή και βελτιώνονται συνεχώς. Μάλιστα, παρά τις διαβεβαιώσεις μουσικόφιλων, μουσικών και ακουστικών, για το μέσο ανεκπαίδευτο αυτί, η αρχική εμφάνιση του MP3 σε μέγιστη ποιότητα έχει γίνει εξαιρετικά αισθητή. Υπάρχουν εξαιρέσεις, δεν μπορούν να μην υπάρχουν. Αλλά δεν γίνονται πάντα εύκολα αντιληπτά με τυφλή ακρόαση.

Μορφοποιήσεις που χρησιμοποιούν μοντέλα ψυχοακουστικής συμπίεσης

Υπάρχουν πολλές τέτοιες μορφές για συμπίεση ήχου με απώλειες. Τα πιο συνηθισμένα σήμερα είναι τα ακόλουθα.

OGG (Vorbis)

Γενικά, ένα αρχείο με την επέκταση *.ogg είναι ένα "κοντέινερ": μπορεί να περιέχει πολλές ηχογραφήσεις με τις δικές του ετικέτες και χαρακτηριστικά. Τις περισσότερες φορές, τα αρχεία που είναι αποθηκευμένα σε αυτό συμπιέζονται με τον κωδικοποιητή Ogg Vorbis, αν και μπορούν να χρησιμοποιηθούν άλλα, όπως MP3 ή FLAC.

Τα κύρια πλεονεκτήματά του περιλαμβάνουν ένα ευρύ φάσμα πιθανών παραμέτρων κατά την κωδικοποίηση: ο ρυθμός δειγματοληψίας ήχου μπορεί να φτάσει τα 192 kHz, το βάθος bit είναι 32 bit. Από προεπιλογή, το OGG χρησιμοποιεί μεταβλητό ρυθμό μετάδοσης bit (αν και αυτό δεν εμφανίζεται στην οθόνη ιδιοτήτων), ο οποίος μπορεί να φτάσει τα 1.000 kbps.

MP3

Σε αντίθεση με το δωρεάν OGG, το MP3 αναπτύχθηκε από την Fraunhofer Society, μια ένωση γερμανικών ινστιτούτων εφαρμοσμένης έρευνας, η οποία είναι πολύ σημαντική για τη σύγχρονη ακουστική. Μεταξύ των audiophile, παρεμπιπτόντως, αυτό είναι ένα εξαιρετικά σεβαστό γραφείο, ωστόσο, δεν τους αρέσει να το παραδέχονται. Όμως οι εξελίξεις τους παρακολουθούνται στενά.

Σε αντίθεση με το OGG, μπορεί να έχει τόσο μεταβλητό (VBR) όσο και σταθερό bitrate (CBR). Παρεμπιπτόντως, χάρη στο MP3 ανακαλύφθηκε ότι δεν μπορεί να κωδικοποιηθεί κάθε εγγραφή με υψηλή ποιότητα με μεταβλητό ρυθμό μετάδοσης δεδομένων (δείτε τους λόγους παραπάνω, οι αλγόριθμοι κωδικοποίησης και τα αποτελέσματά τους σε αυτήν την περίπτωση μπορεί να διαφέρουν κατά την κωδικοποίηση της ίδιας πηγής).

Λόγω της προχωρημένης ηλικίας του, το MP3 έχει σημαντικούς περιορισμούς: το βάθος bit μπορεί να είναι 16-24 bit, η συχνότητα δειγματοληψίας εκφράζεται μόνο σε διακριτές τιμές (8, 11, 025, 12, 16, 22, 05, 24, 32, 44, 1, 48), ο ρυθμός μετάδοσης bit περιορίζεται στα 320 kbps. Επιπλέον, στην κανονική έκδοση του MP3, ο αριθμός των καναλιών περιορίζεται σε δύο.

AAC

Η ίδια τσουγκράνα, μόνο στο προφίλ. Αναπτύχθηκε επίσης από την Fraunhofer Society. Αργότερα και χρησιμοποιεί ένα διαφορετικό ψυχοακουστικό μοντέλο, πιο σύγχρονο. Οι διαθέσιμες στο κοινό πληροφορίες μας επιτρέπουν να συμπεράνουμε: ναι, κατάφεραν να βελτιώσουν τη δική τους δημιουργία.

Ακόμη και με τους πιο βασικούς αριθμούς, το AAC είναι μια πιο ευέλικτη μορφή. Το βάθος bit των αρχείων που λαμβάνονται με τη βοήθεια αυτής της ανάπτυξης κυμαίνεται από 16 έως 24, η συχνότητα δειγματοληψίας, εάν είναι επιθυμητό, θα επιτρέψει επίσης να μην χαθεί η εικόνα ήχου και βρίσκεται στην περιοχή 8-192 kHz. Η ροή δεδομένων γενικά προσεγγίζει αυτές των μορφών χωρίς απώλειες (έως 512 kbps), ενώ ο μέγιστος αριθμός καναλιών αρχείων AAC φτάνει τα 48.

Ποια μορφή είναι σίγουρα η καλύτερη

Λαμβάνοντας υπόψη ότι το AAC είναι MP3 επανασχεδιασμένο μετά από μια ντουζίνα χρόνια, τότε η επιλογή είναι υπέρ του. Εάν θέλετε, είναι λογικό να συγκρίνετε μόνο MP3 και OGG. Ας ρίξουμε μια ματιά στις φωτογραφίες που έκανε ο αξιοσέβαστος Andrey Aspidov από το ixbt.com:

1
1

Στα γραφήματα - καλό AudioCD, OGG συμπιεσμένο με μεταβλητό bitrate 350 kbps και MP3 χρησιμοποιώντας Lame. Όσο χαμηλότερο είναι το γράφημα, τόσο πιο κοντά είναι ο ήχος στο πρωτότυπο. Αποδεικνύεται μια πολύ ενδιαφέρουσα εικόνα. Παρά το γεγονός ότι το MP3 έχει καθαρά κόψει τις υψηλές συχνότητες, σε αντίθεση με το OGG, στο οποίο μπορείτε να δείτε το μπλοκάρισμα κάτω από τα 2 kHz.

2
2

Η κατανομή συχνότητας-χρόνου του ήχου μιλά για όχι λιγότερο ενδιαφέροντα πράγματα. Με σταθερό bitrate 320 kbps, το MP3 είναι σχεδόν πανομοιότυπο με την αρχική εγγραφή. Όλα δείχνουν να μπαίνουν στη θέση τους τώρα. Αλλά … Στην πραγματικότητα, όλα είναι ακόμη πιο μπερδεμένα.

Γιατί να χρησιμοποιήσετε καθόλου το lossy όταν υπάρχει διαθέσιμο χωρίς απώλειες

ΚΟΙΝΗ ΛΟΓΙΚΗ.

Το γεγονός είναι ότι οι περισσότερες από τις αναλογικές εγγραφές δεν περιέχουν τον όγκο των πληροφοριών που θα έπρεπε να αποθηκευτούν σε μορφές υψηλής ποιότητας. Μην ξεχνάτε ότι ο εγγενής ρυθμός δειγματοληψίας για CD είναι 44,1 kHz, ο κβαντισμός είναι μόνο 16 bit.

Τα προηγούμενα γραφήματα δείχνουν την υψηλή πιστότητα της μετάδοσης MP3. Αλλά για μια κασέτα ήχου, μαγνητική ταινία (εκτός φυσικά εάν πρόκειται για κύρια ταινία), τα χαρακτηριστικά ενός AudioCD είναι ανέφικτα. Και για μαζικό εξοπλισμό στούντιο, η δυνατότητα εγγραφής αναλογικού ήχου που αντιστοιχεί στο AudioCD εμφανίστηκε σχετικά πρόσφατα. Δεν έχει νόημα η ψηφιοποίηση σε FLAC (και ακόμη περισσότερο σε WAV) μιας ηχογράφησης συναυλίας ή ενός δίσκου από την προ-ψηφιακή εποχή, ειδικά εκείνων που κατασκευάζονται από μαγνητικά μέσα. Δεν περιέχουν αυτά τα φάσματα και την ποσότητα των πληροφοριών που μπορούν να αποθηκευτούν από δοχεία χωρίς συμπίεση.

Τι έχει αλλάξει σήμερα

Ένας σπάνιος μηχανικός ήχου πραγματοποιεί μια ψηφιακή κύρια εγγραφή (η οποία στη συνέχεια αναπαράγεται σε φυσικά μέσα), χρησιμοποιώντας στο έπακρο τις σύγχρονες τεχνολογίες. Επομένως, η πιθανότητα ένα κομμάτι 24-bit να είναι στην πραγματικότητα μόνο 16-bit είναι εξαιρετικά υψηλή.

Η αναλογική εγγραφή υψηλής ποιότητας σε εξοπλισμό υψηλής ποιότητας είναι ακόμη πιο δύσκολο να βρεθεί σήμερα - έστω και μόνο για τους λάτρεις αυτού του ήχου. Τέτοιος, για παράδειγμα, είναι ο Jack White, ο πρώην αρχηγός των White Stripes. Ταυτόχρονα, ορισμένες από τις ηχογραφήσεις του αναφέρονται σε παραλλαγές του lo-fi και η αναζήτηση των εξωφρενικών ηχητικών χαρακτηριστικών του κομματιού γίνεται ένα είδος απόλαυσης για τους καλοφαγάδες.

Αν φαντάζεστε την ιδανική πηγή, τότε μόνο το εκπαιδευμένο αυτί ή η ακρόαση σε εξοπλισμό ήχου υψηλής ποιότητας θα σας επιτρέψει να βρείτε ένα συμπιεσμένο αρχείο. Και ήδη με βάση αυτό (και χωρίς να ξεχνάμε την αντίληψη), αξίζει να κάνουμε το ακόλουθο συμπέρασμα:

Το AAC είναι απαραίτητο και επαρκές για εξοπλισμό μεσαίας τιμής, ελλείψει του οποίου (και ελλείψει πηγών που μπορούν να κωδικοποιηθούν σε AAC) - MP3 με σταθερό bitrate 320 kbps, που δημιουργήθηκε με χρήση του κωδικοποιητή Lame 3.93 (συνιστώμενα κλειδιά για αποκωδικοποίηση: -cbr -b320 -q0 -k -ms).

Οι εξαιρέσεις είναι εγγραφές που είχαν αρχικά εγγραφεί σε υψηλή ποιότητα, ας πούμε, εγγεγραμμένες σε DVD-Audio, SACD ή εγγραφές που είχαν συλλεχθεί αρχικά σε DSD (ή παρόμοια μορφή) με υψηλό ρυθμό μετάδοσης bit.

Αν και το lossless έχει κάποια χαρακτηριστικά. Και θα τα πούμε την επόμενη φορά.

Συνιστάται: