Definitionen durchsuchen :
Definition

Amazon Transcribe

Mitarbeiter: Tim Culverhouse

Amazon Transcribe ist ein Spracherkennungsdienst, der Audiodateien in Text transkribiert. Der Dienst, der Machine-Learning-Technologie nutzt, ermöglicht es einem Entwickler daneben, einer Anwendung Sprache-zu-Text-Funktinen hinzuzufügen.

Ein Entwickler kann zum Beispiel eine Anwendung mit Amazon Transcribe erstellen, um Transkriptionen von Kundendienstanrufen in einem Contact Center zu erstellen oder Untertitel für Audio- oder Videoinhalte in Echtzeit generieren.

Wie man Amazon Transcribe verwendet

Um Amazon Transcribe verwenden zu können, muss ein Entwickler zunächst ein AWS-Konto haben und einen Benutzer in AWS Identity and Access Management erzeugen. Anschließend kann man über die AWS Management Console, AWS Command Line Interface (CLI) oder die Transcribe-API auf den Service zugreifen.

Audiodateien, die ein Entwickler hochlädt und in S3 speichert, können im MP3-, MP4-, WAV- oder FLAC-Format vorliegen, sollten aber nicht länger als zwei Stunden sein. Der Dienst unterstützt sowohl 16-Kilohertz- (kHz) als auch 8-kHz-Audio-Streams.

Ein Entwickler muss die Sprache und das Format der Audiodatei angeben, die er mit dem Dienst transkribieren möchte. Amazon Transcribe unterstützt die schriftliche Erfassung von Sprach- und Toninhalten in folgenden Sprachen: Deutsch, US-amerikanisches Englisch, Britisches Englisch, Australisches Englisch, US-amerikanisches Spanisch, Kanadisches Französisch, Französisch, Italienisch, Brasilianisches Portugiesisch und Koreanisch.

Weitere Amazon Transcribe-Funktionen

Transcribe verwendet Deep Learning, um Interpunktion und Formatierung in die Textausgabe zu integrieren und den Umfang der erforderlichen Bearbeitung nach Abschluss der Transkription zu begrenzen. Während jeder Transkription erzeugt der Dienst einen Zeitstempel für jedes Wort, falls ein Benutzer zur Klärung zu einem Zeitpunkt in der Original-Audiodatei zurückkehren muss.

Transcribe kann zwischen zwei und zehn verschiedene Sprecher innerhalb einer Audiodatei identifizieren und dann Segmente der Textdatei kennzeichnen, um anzuzeigen, welcher Sprecher welche Worte gesprochen hat. Der Service ermöglicht einem Entwickler auch die Eingabe von benutzerdefiniertem Vokabular, zum Beispiel Jargon oder Eigennamen, die für eine bestimmte Branche oder einen bestimmten Anwendungsfall relevant sind, um eine genauere Textausgabe zu gewährleisten.

Transcribe lässt sich mit einer Reihe anderer Amazon-Dienste integrieren, darunter Amazon Comprehend, ein Dienst zur Verarbeitung natürlicher Sprache (Natural Language Processing, NLP); Amazon Translate, ein Sprachübersetzungsdienst; und Amazon Polly, ein Dienst, der Textdateien in Sprache umwandelt.

Preise und Verfügbarkeit von Amazon Transcribe

Amazon erhebt für den Service Gebühren nach dem Pay-as-you-go-Modell, die auf den Sekunden der pro Monat transkribierten Audiodaten basieren. Es gibt eine kostenlose Servicestufe, die es einem Entwickler ermöglicht, ein Jahr lang bis zu 60 Minuten Audiodaten pro Monat zu analysieren.

Wenn die kostenlose Stufe ausläuft oder wenn ein Entwickler das Limit der kostenlosen Stufe überschreitet, stellt Amazon verschiedene Preisoptionen zur Verfügung. Die Transcribe-API wird monatlich mit einer Rate von 0,0004 USD pro Sekunde berechnet. Die Abrechnung erfolgt in Schritten von einer Sekunde, mit einer Mindestlaufzeit von 15 Sekunden pro Anfrage. Amazon Transcribe ist zahlreichen Regionen verfügbar, zum Beispiel auch (EU) Frankfurt.

Diese Definition wurde zuletzt im Februar 2020 aktualisiert

ComputerWeekly.de

Close