Μαθήματα Επεξεργασίας

Σημάτων

Ε.Μ.Π. | ΗΜΜΥ
Προπτυχιακά | Μεταπτυχιακά | Διπλωματικές
Εγγραφή | Αποστολή | Συμπεριφορά | Συντομογραφίες | Παράδειγμα
Ομάδα Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων
Vision | Speech
2003 | 2002 | 2001 | 2000 | 1999 | pre-1999
Undergraduate | Postgraduate | Diploma Projects | Mailing Lists
subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link | subglobal7 link

Διεπιστημονικό – Διαπανεπιστημιακό Πρόγραμμα Μεταπτυχιακών Σπουδών

«Τεχνογλωσσία VIΙΙ» - Επεξεργασία Σημάτων Φωνής

Πληροφορίες
«Τεχνογλωσσία VIΙΙ» - Επεξεργασία Σημάτων Φωνής
Α' Εξάμηνο
Διδάσκοντες: Πέτρος Μαραγκός (http://cvsp.cs.ntua.gr/maragos)
Αλέξανδρος Ποταμιάνος (Αν. Καθ. Πολ. Κρήτης) (potam@telecom.tuc.gr)
Σπύρος Ράπτης (Ερευνητής Α' ΙΕΛ/ Ε.Κ. «Αθηνά») (spy@ilsp.gr)

Χρόνος/Τόπος: Τρίτη 12.00-15.00
ΕΜΠ: Νέα Κτήρια Σχολής ΗΜ&ΜΥ, Αίθουσα 010
Έναρξη: Τρίτη 09-04-2013
 
Στόχοι
Εισαγωγή στην θεωρία των θεμελιωδών εννοιών και προβλημάτων της επεξεργασίας σημάτων φωνής από άνθρωπο και Η/Υ, καθώς και σε επιλεγμένες εφαρμογές όπως κωδικοποίηση, αναγνώριση και σύνθεση φωνής από Η/Υ.
 
Περιεχόμενα
Τα θέματα του μαθήματος θα καλυφθούν από δέκα (10) τρίωρες διαλέξεις. Θέματα-Διαλέξεις:
 • Εισαγωγή στην Επεξεργασία Φωνής+ Νόηση/ Αντίληψη
 • Φυσικοί Νόμοι της Παραγωγής Φωνής + Φωνητική/Φωνολογία
 • Ανάλυση και Μοντελοποίηση Φωνής
 • Μοντελοποίηση (συνέχεια) και Κωδικοποίηση Φωνής
 • Αναγνώριση Φωνής Ι
 • Αναγνώριση Φωνής ΙΙ
 • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής Ι
 • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής ΙΙ
 • Σύνθεση φωνής από κείμενο και Σύνθεση Φωνής ΙΙΙ
 • Συστήματα Φωνητικού Διαλόγου και άλλες Εφαρμογές Φωνής.
 
Εκπαιδευτικό Υλικό
Επιπρόσθετο εκπαιδευτικό υλικό θα διατίθεται από την ηλεκτρονική ιστοσελίδα του μαθήματος.

Βιβλιογραφία
 • P.B. Denes and E.N. Pinson,
  The Speech Chain: The Physics and Biology of Spoken Language,
  Anchor Press, Doubleday, Garden City, N.Y., 1973

 • G. Fant,
  Acoustic Theory of Speech Production,
  Mouton, the Hague, 1960, 1970

 • J.L. Flanagan,
  Speech Analysis, Synthesis and Perception,
  Springer-Verlag, Berlin, 1965, 1972

 • K.N. Stevens,
  Acoustic Phonetics,
  MIT Press, Massachusetts, 1998

 • L. R. Rabiner and R.W. Schafer,
  Digital Processing of Speech Signals,
  Prentice-Hall, 1978 (Νέα έκδοση: 2010)

 • L.R. Rabiner and Β.Η. Juang,
  Fundamentals of Speech Recognition,
  Prentice-Hall, Englewood Cliffs, NJ, 1993

 • D. Jurafsky and J.H. Martin,
  Speech and Language Processing: An introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition,
  Prentice-Hall, Upper Saddle River, NJ, 2000

 • B. Gold and N. Morgan,
  Speech and Audio Signal Processing,
  Wiley, 2000.

 • D. O'Shaughnessy,
  Speech Communication: Human and Machine,
  Addison-Wesley, Reading, Massachusetts, 1987

 • T. F. Quatieri,
  Discrete-time Speech Signal Processing,
  Pentice-Hall, Upper Saddle River, NJ, 2002

 • Γ. Καραγιάννης και Μ. Ραγκούση,
  Ψηφιακή Επεξεργασία Σήματος,
  Ε.Μ.Π., Εκδόσεις Συμεών

Τελευταία Αλλαγή:  Monday, 15 April 2013 | Δημιουργοί: Νάσος Κατσαμάνης, Γιώργος Παπανδρέου | Search is powered by