In „Looking to Listen at the Cocktail Party“ zeigt Google wir ein lernendes audio-visuelles Modell zur Isolierung eines einzelnen Sprachsignals aus einer Mischung von Klängen wie anderen Stimmen und Hintergrundgeräuschen funktionieren kann. Erstaunlich.
Google trennt Stimmen per KI
Weitere Themen
Hinterlasse deine Meinung
