Direkt zum Inhalt Direkt zur Suche Direkt zur Navigation

Humboldt-Universität zu Berlin - Lebenswissenschaftliche Fakultät - Institut für Psychologie

Institut für Psychologie | Tabellarische Übersicht über Videokassette Nr. 8

Tabellarische Übersicht über Videokassette Nr. 8

"Sprachein-und -ausgabe"

Nr.	Titel	Kontakt	Inhalt	Start	Länge [min]
1	Spoken Language Interfaces: The OM System	Alexander Rudnicky Carnegie Mellon University School of Computer Science Pittsburgh, PA 15213 phone: 412-268-2622	Der Office Manager (OM) stellt eine komplette, interaktive Arbeitsoberfläche (Shell) zur Entwicklung und Benutzung sprachgesteuerter Applikationen zur Verfügung. Dieses können z.B. Terminplaner, Datenbanken, Voice-Mail- oder Rechenprogramme sein. Der OM kann Steuerbefehle erkennen sowie eine reine Texterfassung vornehmen, bei der die erkannten Worte automatisch als geschriebener Text gespeichert werden.	0:00	11
2	A Human Factors Guide to Computer Speech	C.K. Cowley University of Wales P.O. Box 901 Cardiff, CFI 3YG Wales, U.K. phone: (0222) 874 000	Neben Werbung für digital(tm)-Computerequipment werden Spracherkennung sowie -ausgabe behandelt und Designempfehlungen für Entwickler von sprachbasierten Systemen gegeben. Neben dem Computer wird auch der Mensch in die Guidelines miteinbezogen, so werden z.B. Vor- und Nachteile des Einsatzes digitalisierter vs. synthetisierter Sprache betrachtet.	0:11	16
3	Speech and Natural Language: A Multi-Modal Natural Dialogue	Kristinn R. Thorisson Media Laboratory Massachusetts Institute of Technology Cambridge,MA 02139 617-258-6579 kris@media-lab.media.mit.edu	An einem Beispiel wird erklärt, wie Computer neben Sprache auch Mimik und Gestik erfassen und auswerten. Ziel ist es, den Computer wie einen menschlichen Zuhörer agieren zu lassen. So werden z.B. Finger-, Hand-, Pupillen- und Kopfbewegung erfaßt und ausgewertet.	0:27	7
4	Wordspot-ting in Voice Editing and Audio Indexing	Lynn Wilcox Xerox PARC 333 Coyote Hill Road Palo Alto, CA 94304 415-812-4217 wilcox.parc@xerox.com	Das vorgestellte System bietet die Möglichkeit, Sprache mittels eines Editors wie Text zu manipulieren (Cut&Paste; markieren, abspeichern und abspielen einzelner Sequenzen; Suche nach Schlagwörtern; nachträgliches Einfügen von Effekten etc. ). Wörter werden dabei nicht lexikalisch erfaßt, sondern nur "Muster" ausgewertet.	0:35	8
5	Talking to Machines	Christopher Cowley School of Psychology University of Wales P.O.Box 901 Cardiff CFI 3YG Wales, U.K. +44 222 874000 COWLEY@UK.AC.CARDIFF.TAFF	Vorgestellt wird ein Sprachverarbeitungssystem von digital(tm) (s.a. Nr.2). Betrachtet wird vor allem die theoretische Seite der Spracherkennung mit besonderem Focus auf die Mensch-Maschine-Schnittstelle. Probleme und Problemlösungsstrategien werden vorgestellt und Entwicklungsrichtlinien gegeben.	0:43	13
6	Hyperspeech	Barry Arons Speech Research Group MIT Media Lab 20 Ames Street, E-15-353 Cambridge, MA 02139 barons@media-lab.mit.edu	Gezeigt wird der Einsatz eines reinen Sprachein-/ausgabe(dialog)systems mit angeschlossener Datenbank. Interessant gelöst sind die Navigation durch Sprache und die Benutzung von Sprache als Daten. Bemerkenswert ist die kurze Antwortzeit des Systems.	0:56	3
7	SCREAM: Screen-based Navigation in Voice Messages	Norwegian Telecom Research Lie: howcome@nta.com Dybvik: perc@nta.com Rygh: janrygh@nta.com	Ziel des SCREAM-Projekts ist es, die Schnittstelle zu Voice-mail Systems durch Einsatz visueller Technik zu verbessern. Auf einem Bildschirm werden dabei eingegangene Anrufe durch Icons angezeigt, die je nach Geschlecht, Alter, Emotionen und behandeltem Thema des Anrufenden variieren.	0:59	4
8	Speech Dialogue with Facial Displays	Sony Computer Science Laboratory, Inc. Akikazu Takeuchi & Katashi Nagao	In dem hier gezeigten Dialogsystem erfolgt neben der Sprachausgabe auch die Darstellung eines Gesichts inklusive seiner Mimik. Schwerpunkte des Films sind die Erstellung der Sprachausgabe und der Gesichtsdarstellung sowie die Zusammenführung dieser beiden Komponenten.	1:03	10
9	Voice Systems - An Inventors Guide	C.K. Cowley University of Wales P.O. Box 901 Cardiff, CFI 3YG Wales, U.K. phone: (0222) 874 000	Ebenso wie in Video 2 und 5 wird der Einsatz von digital(tm) DECtalk vorgestellt. Augenmerk des theoretischen Teils sind hier Kriterien, um die Verstädlichkeit synthetisierter Stimmen zu bewerten und zu gestalten. Darüber hinaus werden Programme rund um das Thema Sprachverarbeitung vorgestellt sowie ein kurzes Beispiel für den zukünftigen Einsatz derartiger Systeme gegeben.	1:14	16