Η τεχνολογική πρόοδος στον τομέα των υπολογιστών, τη δεκαετία του '90, επέτρεψε τη ψηφιοποίηση εικόνας και ήχου. Η ψηφιοποίηση δεδομένων εικόνας και ήχου παράγει ένα τεράστιο όγκο δεδομένων, που πρέπει με κάποιο τρόπο να περιοριστεί, μιας και τα αποθηκευτικά μέσα που διαθέτουμε σήμερα (1999) έχουν πολύ μικρότερη χωρητικότητα. Για παράδειγμα, για 1 λεπτό κινούμενης εικόνας διαστάσεων 768x576 pixels στα 24 bits χρώματος και με 25 καρέ ανά δευτερόλεπτο, παράγονται δεδομένα της τάξεως των 4.67 GB, ενώ για την αποθήκευση ενός λεπτού ψηφιακού ήχου υψηλής ποιότητας (συχνότητα δειγματοληψίας 44.1 KHz, κωδικοποίηση στα 16 bits και 2 κανάλια) απαιτούνται 10 MB.
Συμπίεση στατικής εικόνας
|
Συμπίεση κινούμενης εικόνας
|
Συμπίεση ήχουΤα ηχητικά δεδομένα μιας ταινίας έχουν σαφώς μικρότερο όγκο από τα οπτικά δεδομένα. Ωστόσο, είναι καλό να συμπιεστούν και τα ηχητικά δεδομένα, κυρίως για οικονομία χώρου. Η βασικότερη μέθοδος συμπίεσης στηρίζεται στο γεγονός, ότι όταν υπάρχει ένας ήχος συγκεκριμένης συνχνότητας και έντασης, άλλοι ήχοι σε γειτονικές συχνότητες δεν διακρίνονται από το ανθρώπινο αυτί, αν δεν ξεπερνούν ένα ελάχιστο όριο, το οποίο είναι λίγο μεγαλύτερο από το όριο ακουστικότητας για τις συχνότητες αυτές και συναρτώμενο από τις υπόλοιπες ηχητικές συνιστώσες. Το παραπάνω φαινόμενο είναι γνωστό ως ηχητική σκίαση (auditory masking). Κατά τη συμπίεση των ηχητικών δεδομένων, απορρίπτονται οι συχνότητες που το ανθρώπινο αυτί δε μπορεί να ξεχωρίσει μέσα σε ένα συγκεκριμένο διάστημα συχνοτήτων. Αν και χάνονται ηχητικές πληροφορίες, εντούτοις η ποιότητα του ήχου παραμένει σε υψηλά επίπεδα
Αρχικά οι προδιαγραφές DVDs μιλούσαν για δυο διαφορετικά πρωτόκολλα συμπίεσης ηχητικών δεδομένων. Για τις ΗΠΑ, ο ήχος θα ήταν συμπιεσμένος με βάση το πρωτόκολλο AC-3 Dolby Digital, ενώ η Ευρώπη θα χρησιμοποιούσε το πρωτόκολλο MPEG-2. Η συμπίεση και στις δυο παραπάνω τεχνολογίες επιτυγχάνεται εξαιτίας του φαινομένου της ηχητικής σκίασης, ενώ οι διαφορές τους έχουν να κάνουν με τον τρόπο υλοποίηση τους. Πάντως και οι δυο δουλεύουν χωρίζοντας το φάσμα των ακουστών συχνοτήτων σε υπό-μπάντες και χρησιμοποιούν περίπλοκους αλγόριθμους και ψυχοακουστικά μέσα για να απορρίψουν τις μη ακουστικές από το ανθρώπινο αυτί συχνότητες. Ο ανταγωνισμός μεταξύ των πρωτοκόλλων AC-3 και MPEG-2 φαίνεται να ευνοεί το μοντέλο AC-3, που εκτός σημαντικού απροόπτου, θα γίνει το διεθνές πρότυπο, για τη συμπίεση ηχητικών δεδομένων.
- AC-3 Dolby Digital
Στο ψηφιακό σύστημα ήχου AC-3 ο ήχος κωδικωποιείται σε 6 συνολικά κανάλια με την μέθοδο 5.1. Συγκεκριμένα υπάρχουν 3 βασικά κανάλια (αριστερό, κεντρικό και δεξί), τα οποία "φέρουν" τη βασική ηχητική πληροφορία, 2 συνοδευτικά κανάλια περιβάλλοντος ήχου (αριστερό και δεξί) και 1 κανάλι για τις υπόλοιπες συχνότητες(σύστημα 3/2/.1). Τα 5 πρώτα κανάλια χειρίζονται συχνότητες ήχου στο διάστημα 3-20000 Hz, ενώ το έκτο κανάλι συχνότητες 3-120 Hz. Ο ρυθμός δειγματοληψίας είναι 48 KHz (μεγαλύτερος από τον ρυθμό των 44.1 KHz που χρησιμοποιείται στα CDs Audio), ενώ η συπίεση των ηχητικών δεδομένων φτάνει στην αναλογία 10 : 1.