Lade Login-Box.
Topthemen: Südthüringen kocht 2020Freies Wort hilftFolgen Sie uns auf InstagramSport-Tabellen

Computer

Mozilla macht Datensatz menschlicher Stimmen verfügbar

Mozilla, der Hersteller des Firefox-Browsers, hat den größten Datensatz menschlicher Stimmen verfügbar gemacht, der komplett von Freiwilligen eingesprochen wurde.



Mozilla-Zentrale in San Francisco
Der Datensatz von Mozilla umfasst nach Angaben des Unternehmens 18 verschiedene Sprachen, darunter Englisch, Französisch, Deutsch und Mandarin (traditionell).   Foto: Andrej Sokolow

Mit dem Projekt «Common Voice» soll der weltweit vielfältigste Sprachdatensatz erstellt werden, der für die Entwicklung von Sprachtechnologien optimiert ist.

Das Unternehmen in San Francisco will damit vor allem kleineren Herstellern und Crowdfunding-Projekten ohne Lizenzgebühren ermöglichen, eigene Spracherkennungssysteme zu entwickeln.

Bislang dominieren die großen Internetkonzerne wie Google, Microsoft, IBM, Amazon und Apple den Markt für Spracherkennung. Wichtiger Player ist außerdem das Unternehmen Nuance, dessen Technik hinter der Spracherkennung von Apples Siri steckt.

Der Datensatz von Mozilla umfasst nach Angaben des Unternehmens 18 verschiedene Sprachen, darunter Englisch, Französisch, Deutsch und Mandarin (traditionell), aber auch beispielsweise Walisisch und Kabyle, eine algerische Berbersprache. Der Datensatz summiert sich zu fast 1.400 Stunden aufgezeichneter Sprachdaten von mehr als 42.000 Mitwirkenden.

Die von Mozilla eingesammelten Daten stehen unter der «CC0»-Lizenz zur Verfügung. Das ist die freizügigste Variante der Creative-Commons-Lizenzen («No rights reserved»). Die Projekt-Teilnehmer haben dabei freiwillig auch Metadaten wie Alter, Geschlecht und Akzent angeben.

«Damit werden gemeinsam mit ihren Aufzeichnungen weitere Informationen gespeichert, mit denen Sprach-Engines noch besser trainiert werden können», heißt es in dem Blog-Eintrag von Mozilla. Man wolle «zu einem vielfältigen und innovativen Ökosystem an Sprachtechnologien» beitragen. Ziel sei es, eigene sprachgesteuerte Produkte auf den Markt zu bringen, aber auch Forscher und kleinere Akteure zu unterstützen.

Autor
dpa

dpa

Kontakt zum Autor

Autor zu »Meine Themen« hinzufügen

Veröffentlicht am:
28. 02. 2019
16:15 Uhr

Für »Meine Themen« verfügbare Schlagworte

zu Meine Themen hinzufügen

Hinzufügen

Schlagwort zu
Meine Themen

zu Meine Themen hinzufügen

Hinzufügen

Sie haben bereits von 15 Themen gewählt

Bearbeiten

Sie verfolgen dieses Thema bereits

Entfernen

Für die Nutzung von "Meine Themen" ist ihr Einverständnis zur Datenspeicherung nötig.

Weiter
Amazon Apple Google IBM Internetkonzerne Lizenzgebühren Metadaten Microsoft Mozilla Produktionsunternehmen und Zulieferer Spracherkennung Spracherkennungssysteme Ökosysteme
Diesen Artikel teilen / ausdrucken


 
Mehr zum Thema
Amazon Echo mit Sprachassistent Alexa

30.09.2019

Amazon verteidigt Auswertung von Alexa-Mitschnitten

Die Erkenntnis, dass Mitschnitte von Gesprächen mit Assistenten wie Alexa und Siri auch von Mitarbeitern gehört werden können, löste viel Kritik aus. Doch Amazons Geräte-Chef Dave Limp gibt zu bedenken, dass dies die Spr... » mehr

Smart Home

18.12.2019

Amazon, Apple und Google arbeiten an Smarthome-Standard

Die Smarthome-Rivalen Amazon, Apple und Google tun sich zusammen, um mit einem neuen offenen Standard die Verbindung verschiedener Geräte im vernetzten Zuhause zu vereinfachen. » mehr

Google

15.01.2020

Google torpediert Datensammlung über Cookies

Für die Werbewirtschaft wird es in Zukunft schwieriger, Informationen über das Verhalten von Nutzern beim Surfen im Web zu sammeln. » mehr

Alexa soll schlauer werden

26.09.2019

Amazon macht Sprachassistentin Alexa schlauer

Amazons Sprachassistentin Alexa wird nützlicher, und die vernetzten Geräte sollen noch besser zusammenspielen. Eine Brille und ein Ring mit Alexa-Mikrofonen zeigen zudem als Experimente, wohin die Reise gehen soll. » mehr

Google

10.09.2019

Kartellverstöße? US-Bundesstaaten nehmen Google ins Visier

Nach Facebook gerät nun auch die Alphabet-Tochter Google ins Visier einer Wettbewerbsprüfung von US-Bundesstaaten. Doch nicht nur wegen ihrer großen Marktmacht steigt der Druck auf die Internetkonzerne - sie geraten auch... » mehr

Maria Ressa

18.01.2020

Viel Kritik an Tech-Riesen auf der DLD-Konferenz

Bei der Digitalisierung ist oft von Chancen die Rede. Doch die globalen Herausforderungen sind riesig. Hass, Fake News und Radikale in der Politik verdanken ihren Aufstieg auch neuer Technik. Bei der DLD-Konferenz gibt e... » mehr

Bildergalerie » zur Übersicht

Platz 8: Abendstimmung von Maik Weiland

Blende 2020 "In Bewegung" |
» 10 Bilder ansehen

Polizeieinsatz Asylheim Suhl Suhl

Polizeieinsatz Suhl | 20.01.2020 Suhl
» 13 Bilder ansehen

Max Raabe in der Erfurter Messehalle Erfurt

Max Raabe in Erfurt | 19.01.2020 Erfurt
» 18 Bilder ansehen

Autor
dpa

dpa

Kontakt zum Autor

Autor zu »Meine Themen« hinzufügen

Veröffentlicht am:
28. 02. 2019
16:15 Uhr



^