Leading-Edge Spracherkennungstechnologie aus Sachsen (Neural Speech)
Drittmittelprojekt mit Industriebeteiligung

Prof. Dr.-Ing. Gudrun Flach

M.Sc. Christian Gaida

Ziel im Forschungs- und Entwicklungsvorhaben Neural Speech ist die Entwicklung eines initialen automatischen Spracherkennungssystems (ASR-Systems) sowie ASR-Technologien, die eine automatisierte Anpassung des
ASR-Systems an verschiedene Nutzeranforderungen und Plattformen ermöglichen. Konkret erforschen die Linguwerk GmbH (Linguwerk} und die Hochschule für Technik und Wirtschaft in Dresden (HTW) folgende ASR-Technologien:

• Algorithmische ASR-Basistechnologie: Bibliothek von Basisalgorithmen, die ASR-spezifisch sind und die algorithmische Grundlage für das gesamte ASR-System und seine zugehörigen Module bilden.
• ASR-Engine-Technologie: State-of-the-Art-Erkennungstechnologie, die sprach-, plattform- und domainspezifische Anpassungen ermöglicht und somit hohe Flexibilität bietet.
• ASR-Toolset: Eine komplexe Sammlung von Tools (Toolchain ), mit der ASR-Modelle flexibel erzeugt und ASR-Systeme optimal sprach-, plattform- und domainspezifisch konfiguriert und adaptiert werden können. Bei der notwendigen Automatisierung der Einzeltools werden in erhöhtem Maße Machine-Learning-Technologien verwendet.
• ASR-Korpusmanagement: ASR-Datenmanagement-Technologien, die akquirierte Rohdaten in normalisierte Daten für Modelltraining, -entwicklung und -evaluation Machine-Learning-basiert umwandeln.
• ASR-Customization -Technologie: Interface auf Basis von ASR-Technologie, die es Anwendern ohne ASR-Expertise ermöglicht, Anpassungen des ASR-Systems selbst vorzunehmen.

Letztlich entsteht eine weltweit einzigartige ASR-Technologie, die es auch Anwendern ohne ASR-Expertise ermöglicht, ein an die eigenen Bedürfnisse angepasstes ASR-System selbst zu entwickeln.
Forschungsschwerpunkte Neural Speech HTW sind:

• Erforschung neuartiger algorithmischer und Machine-Learning-gestützer Ansätze zur Feature-Extraktion, geeignet für LVCSR
• Erforschung neuartiger Ansätze ASR-Modellierung und -Training (Machine-Learning-Ansätze)- Schwerpunkt akustische Modellierung
• Erforschung neuartiger Ansätze zur Automatisierung von Machine-Learning-basierten Trainings- und Modellierungsverfahren - Schwerpunkt akustische Modellierung sowie zusammen mit Linguwerk den Schwerpunkt lexikalische Modellierung
• Erforschung der Möglichkeiten der automatisierten domainspezifischen Anpassung der Decoder Engine


EFRE

Linguwerk GmbH Dresden

29.04.2019 bis 31.12.2021