Tabellarische Übersicht über Videokassette Nr. 8
"Sprachein-und -ausgabe"
Nr. |
Titel |
Kontakt |
Inhalt |
Start |
Länge |
1 | Spoken Language Interfaces: The OM System | Alexander Rudnicky Carnegie Mellon University School of Computer Science Pittsburgh, PA 15213 phone: 412-268-2622 |
Der Office Manager (OM) stellt eine komplette, interaktive Arbeitsoberfläche (Shell) zur Entwicklung und Benutzung sprachgesteuerter Applikationen zur Verfügung. Dieses können z.B. Terminplaner, Datenbanken, Voice-Mail- oder Rechenprogramme sein. Der OM kann Steuerbefehle erkennen sowie eine reine Texterfassung vornehmen, bei der die erkannten Worte automatisch als geschriebener Text gespeichert werden. | 0:00 | 11 |
2 | A Human Factors Guide to Computer Speech | C.K. Cowley University of Wales P.O. Box 901 Cardiff, CFI 3YG Wales, U.K. phone: (0222) 874 000 |
Neben Werbung für digital(tm)-Computerequipment werden Spracherkennung sowie -ausgabe behandelt und Designempfehlungen für Entwickler von sprachbasierten Systemen gegeben. Neben dem Computer wird auch der Mensch in die Guidelines miteinbezogen, so werden z.B. Vor- und Nachteile des Einsatzes digitalisierter vs. synthetisierter Sprache betrachtet. | 0:11 | 16 |
3 | Speech and Natural Language: A Multi-Modal Natural Dialogue | Kristinn R. Thorisson Media Laboratory Massachusetts Institute of Technology Cambridge,MA 02139 617-258-6579 kris@media-lab.media.mit.edu |
An einem Beispiel wird erklärt, wie Computer neben Sprache auch Mimik und Gestik erfassen und auswerten. Ziel ist es, den Computer wie einen menschlichen Zuhörer agieren zu lassen. So werden z.B. Finger-, Hand-, Pupillen- und Kopfbewegung erfaßt und ausgewertet. | 0:27 | 7 |
4 | Wordspot-ting in Voice Editing and Audio Indexing | Lynn Wilcox Xerox PARC 333 Coyote Hill Road Palo Alto, CA 94304 415-812-4217 wilcox.parc@xerox.com |
Das vorgestellte System bietet die Möglichkeit, Sprache mittels eines Editors wie Text zu manipulieren (Cut&Paste; markieren, abspeichern und abspielen einzelner Sequenzen; Suche nach Schlagwörtern; nachträgliches Einfügen von Effekten etc. ). Wörter werden dabei nicht lexikalisch erfaßt, sondern nur "Muster" ausgewertet. | 0:35 | 8 |
5 | Talking to Machines | Christopher Cowley School of Psychology University of Wales P.O.Box 901 Cardiff CFI 3YG Wales, U.K. +44 222 874000 COWLEY@UK.AC.CARDIFF.TAFF |
Vorgestellt wird ein Sprachverarbeitungssystem von digital(tm) (s.a. Nr.2). Betrachtet wird vor allem die theoretische Seite der Spracherkennung mit besonderem Focus auf die Mensch-Maschine-Schnittstelle. Probleme und Problemlösungsstrategien werden vorgestellt und Entwicklungsrichtlinien gegeben. | 0:43 | 13 |
6 | Hyperspeech | Barry Arons Speech Research Group MIT Media Lab 20 Ames Street, E-15-353 Cambridge, MA 02139 barons@media-lab.mit.edu |
Gezeigt wird der Einsatz eines reinen Sprachein-/ausgabe(dialog)systems mit angeschlossener Datenbank. Interessant gelöst sind die Navigation durch Sprache und die Benutzung von Sprache als Daten. Bemerkenswert ist die kurze Antwortzeit des Systems. | 0:56 | 3 |
7 | SCREAM: Screen-based Navigation in Voice Messages | Norwegian Telecom Research Lie: howcome@nta.com Dybvik: perc@nta.com Rygh: janrygh@nta.com |
Ziel des SCREAM-Projekts ist es, die Schnittstelle zu Voice-mail Systems durch Einsatz visueller Technik zu verbessern. Auf einem Bildschirm werden dabei eingegangene Anrufe durch Icons angezeigt, die je nach Geschlecht, Alter, Emotionen und behandeltem Thema des Anrufenden variieren. | 0:59 | 4 |
8 | Speech Dialogue with Facial Displays | Sony Computer Science Laboratory,
Inc. Akikazu Takeuchi & Katashi Nagao |
In dem hier gezeigten Dialogsystem erfolgt neben der Sprachausgabe auch die Darstellung eines Gesichts inklusive seiner Mimik. Schwerpunkte des Films sind die Erstellung der Sprachausgabe und der Gesichtsdarstellung sowie die Zusammenführung dieser beiden Komponenten. | 1:03 | 10 |
9 | Voice Systems - An Inventors Guide | C.K. Cowley University of Wales P.O. Box 901 Cardiff, CFI 3YG Wales, U.K. phone: (0222) 874 000 |
Ebenso wie in Video 2 und 5 wird der Einsatz von digital(tm) DECtalk vorgestellt. Augenmerk des theoretischen Teils sind hier Kriterien, um die Verstädlichkeit synthetisierter Stimmen zu bewerten und zu gestalten. Darüber hinaus werden Programme rund um das Thema Sprachverarbeitung vorgestellt sowie ein kurzes Beispiel für den zukünftigen Einsatz derartiger Systeme gegeben. | 1:14 | 16 |