ΙΕΚ - Συμπίεση δεδομένων

Εισαγωγή
Η τεχνολογική πρόοδος στον τομέα των υπολογιστών, τη δεκαετία του '90, επέτρεψε τη ψηφιοποίηση εικόνας και ήχου. Η ψηφιοποίηση δεδομένων εικόνας και ήχου παράγει ένα τεράστιο όγκο δεδομένων, που πρέπει με κάποιο τρόπο να περιοριστεί, μιας και τα αποθηκευτικά μέσα που διαθέτουμε σήμερα (1999) έχουν πολύ μικρότερη χωρητικότητα. Για παράδειγμα, για 1 λεπτό κινούμενης εικόνας διαστάσεων 768x576 pixels στα 24 bits χρώματος και με 25 καρέ ανά δευτερόλεπτο, παράγονται δεδομένα της τάξεως των 4.67 GB, ενώ για την αποθήκευση ενός λεπτού ψηφιακού ήχου υψηλής ποιότητας (συχνότητα δειγματοληψίας 44.1 KHz, κωδικοποίηση στα 16 bits και 2 κανάλια) απαιτούνται 10 MB.



Συμπίεση στατικής εικόνας
  • JPEG
    Οι εικόνες ψηφιοποιούνται και αποθηκεύονται με βάση τον αλγόριθμο συμπίεσης JPEG (Joint Photographic Expert Group). Ο αλγόριθμος βασίζεται πάνω σε μερικές παρατηρήσεις που έχουν σχέση με τις ιδιαιτερότητες του ανθρώπινου ματιού και διάφορες μαθηματικές και φυσικές αναλύσεις. Το ανθρώπινο μάτι είναι περισσότερο ευαίσθητο στη φωτεινότητα μιας εικόνας και λιγότερο στις χρωματικές αποχρώσεις που περιέχει, ενώ το πράσινο χρώμα "ερεθίζει" περισσότερο το μάτι από τα άλλα χρώματα. Λαμβάνοντας υπόψη όλα τα παραπάνω, ο αλγόριθμος συμπίεσης δεδομένων JPEG επιτυγχάνει αναλογία συπμίεσης 10 : 1. Πάντως πρέπει να σημειωθεί ότι ο JPEG όπως και οι περισσότεροι αλγόριθμοι συμπίεσης "χάνουν" ένα ποσοστό δεδομένων, σε τέτοιο βαθμό όμως, που να μην αλλοιώνεται αισθητά η ποιότητα της εικόνας.



Συμπίεση κινούμενης εικόνας
  • Μ-JPEG
    Μια ταινία είναι στην ουσία ένα σύνολο από διαφορετικές εικόνες (καρέ) που εναλλάσονται διαδοχικά με μια συγκεκριμένη ταχύτητα εναλλαγής. Αρχικά, είχε προταθεί η ιδέα να συμπιέζεται ξεχωριστά κάθε καρέ της ταινίας βάσει του αλγόρθμο JPEG και το μοντέλο που προέκυψε ονομάστηκε M-JEPG (Motion JPEG). Το μοντέλο M-JPEG δεν κατάφερε να γίνει το πρότυπο, αφού οι σχεδιαστές στράφηκαν στο μοντέλο συμπίεσης H.261, που χρησιμοποιούνταν σε εφαρμογές τηλεδιάσκεψης με εικόνα μέσω υπολογιστή.
  • H.261
    Όταν το πλαίσιο μιας κινούμενης εικόνας παραμένει σχεδόν το ίδιο, τα διαδοχικά καρέ στην ουσία δείχνουν τα αντικείμενα που αλλάζουν θέση, ενώ το βασικό οπτικό περιεχόμενο (αντικείμενα που δεν αλλάζουν θέση) παραμένει το ίδιο. Αν στηριχθούμε σε αυτή την παρατήρηση, μπορούμε να κωδικοποιήσουμε αρχικά το σχεδόν αναλλοίωτο πλάνο και μέχρι να αλλάξει σημαντικά να κωδικοποιήσουμε σε κάθε καρέ μόνο τα αντικείμενα που αλλάζουν. Στην συνέχεια, ο μειωμένος όγκος δεδομένων σε σχέση με το μοντέλο M-JPEG, μπορεί να συμπιεστεί με τον αλγόριθμο JPEG.
  • MPEG
    Στο μοντέλο MPEG μερικά καρέ κωδικοποιούνται ολόκληρα (I-frame), μερικά με βάση τις διαφορές τους από τα προηγούμενα (P-frame) και μερικά άλλα με βάση τις διαφορές από το προηγούμενο, αλλά και το επόμενο (B-frame). Το αποτέλεσμα αυτής της κωδικοποίησης είναι μια μέση συμπίεση των δεδομένων σε αναλογία 25 : 1. Η φιλοσοφία του αλγορίθμου MPEG στηρίζεται στη παρατήρηση, ότι όταν τα διαδοχικά καρέ δεν διαφέρουν σημαντικά μεταξύ τους δεν παράγεται σημαντικός αριθμός νέων δεδομένων και το αντίθετο.

Συμπίεση ήχουΤα ηχητικά δεδομένα μιας ταινίας έχουν σαφώς μικρότερο όγκο από τα οπτικά δεδομένα. Ωστόσο, είναι καλό να συμπιεστούν και τα ηχητικά δεδομένα, κυρίως για οικονομία χώρου. Η βασικότερη μέθοδος συμπίεσης στηρίζεται στο γεγονός, ότι όταν υπάρχει ένας ήχος συγκεκριμένης συνχνότητας και έντασης, άλλοι ήχοι σε γειτονικές συχνότητες δεν διακρίνονται από το ανθρώπινο αυτί, αν δεν ξεπερνούν ένα ελάχιστο όριο, το οποίο είναι λίγο μεγαλύτερο από το όριο ακουστικότητας για τις συχνότητες αυτές και συναρτώμενο από τις υπόλοιπες ηχητικές συνιστώσες. Το παραπάνω φαινόμενο είναι γνωστό ως ηχητική σκίαση (auditory masking). Κατά τη συμπίεση των ηχητικών δεδομένων, απορρίπτονται οι συχνότητες που το ανθρώπινο αυτί δε μπορεί να ξεχωρίσει μέσα σε ένα συγκεκριμένο διάστημα συχνοτήτων. Αν και χάνονται ηχητικές πληροφορίες, εντούτοις η ποιότητα του ήχου παραμένει σε υψηλά επίπεδα
Αρχικά οι προδιαγραφές DVDs μιλούσαν για δυο διαφορετικά πρωτόκολλα συμπίεσης ηχητικών δεδομένων. Για τις ΗΠΑ, ο ήχος θα ήταν συμπιεσμένος με βάση το πρωτόκολλο AC-3 Dolby Digital, ενώ η Ευρώπη θα χρησιμοποιούσε το πρωτόκολλο MPEG-2. Η συμπίεση και στις δυο παραπάνω τεχνολογίες επιτυγχάνεται εξαιτίας του φαινομένου της ηχητικής σκίασης, ενώ οι διαφορές τους έχουν να κάνουν με τον τρόπο υλοποίηση τους. Πάντως και οι δυο δουλεύουν χωρίζοντας το φάσμα των ακουστών συχνοτήτων σε υπό-μπάντες και χρησιμοποιούν περίπλοκους αλγόριθμους και ψυχοακουστικά μέσα για να απορρίψουν τις μη ακουστικές από το ανθρώπινο αυτί συχνότητες. Ο ανταγωνισμός μεταξύ των πρωτοκόλλων AC-3 και MPEG-2 φαίνεται να ευνοεί το μοντέλο AC-3, που εκτός σημαντικού απροόπτου, θα γίνει το διεθνές πρότυπο, για τη συμπίεση ηχητικών δεδομένων.
  • AC-3 Dolby Digital
    Στο ψηφιακό σύστημα ήχου AC-3 ο ήχος κωδικωποιείται σε 6 συνολικά κανάλια με την μέθοδο 5.1. Συγκεκριμένα υπάρχουν 3 βασικά κανάλια (αριστερό, κεντρικό και δεξί), τα οποία "φέρουν" τη βασική ηχητική πληροφορία, 2 συνοδευτικά κανάλια περιβάλλοντος ήχου (αριστερό και δεξί) και 1 κανάλι για τις υπόλοιπες συχνότητες(σύστημα 3/2/.1). Τα 5 πρώτα κανάλια χειρίζονται συχνότητες ήχου στο διάστημα 3-20000 Hz, ενώ το έκτο κανάλι συχνότητες 3-120 Hz. Ο ρυθμός δειγματοληψίας είναι 48 KHz (μεγαλύτερος από τον ρυθμό των 44.1 KHz που χρησιμοποιείται στα CDs Audio), ενώ η συπίεση των ηχητικών δεδομένων φτάνει στην αναλογία 10 : 1.

Επειδή κάποια πράγματα καλό είναι να τα κάνουμε μόνοι μας δείτε αυτό http://www.ftiaxno.gr/