MacWhisper: Lokale Audiotranskription unterscheidet Sprecher

Software zum Transkribieren von Gesprächen, Videocalls und Interviews kam in den vergangenen Jahren deutlich voran. Eine Neuerung ist, dass dies auch lokal auf dem Rechner möglich ist – dank quelloffener Modelle unter anderem von OpenAI. Die auf dem Mac dafür wohl beliebteste Software nennt sich MacWhisper und stammt vom niederländischen Entwickler Jordi Bruin. Der hat nun seinen Nutzern einen lange erwarteten Feature-Wunsch erfüllt: Endlich ist es möglich, automatisch zwischen Sprechern zu unterscheiden. Das Feature ist seit Version 12.0.1 verfügbar, die diesen Monat erschienen ist.Wer spricht gerade?“Wenn Sie jetzt ein Interview, eine Besprechung oder ein Gespräch transkribieren, erkennt MacWhisper automatisch verschiedene Sprecher, gruppiert ihre Aussagen und beschriftet sie – so werden Ihre Transkripte übersichtlicher und sind einfacher zu navigieren“, schreibt Bruin dazu im Beipackzettel. Die Funktion hatte zu den nachgefragtesten Features innerhalb der Nutzerschaft gezählt. An der Tatsache, dass die Transkribierung weiterhin auf dem eigenen Mac läuft, Daten also nicht (etwa zum Training) in der Cloud landen, ändert sich nichts.“Die gesamte Verarbeitung passiert privat auf Ihrem Mac, es wird nichts an einen Server geschickt und es arbeitet auch offline.“ Umgesetzt wurde dies in Zusammenarbeit mit ArgMax und dessen Modellen WhisperKit Pro und SpeakerKit. Entsprechend muss man diese auch auswählen. Möglich ist weiterhin, vorab eine Sprache zu selektieren oder diese automatisch erkennen zu lassen. In der Praxis funktioniert das insbesondere dann gut, wenn die Konversation nur eine Sprache verwendet. Gibt es gleich mehrere, kommt manchmal noch Wortsalat heraus.Auch Server-Modelle verfügbarDie Sprechererkennung ist Teil von MacWhisper Pro, ist also nicht gratis nutzbar – für die Freischaltung werden nicht ganz günstige 59 Euro fällig. Dafür gibt es zusätzlich auch noch eine Text- und Grammatikkorrektur über Server-Modelle, Batch-Transkribierung und die Unterstützung für Distilled-Modelle. Die Pro-Version kann zudem YouTube-Videos transkribieren und unterstützt diverse weitere Cloud-Modelle von OpenAI, Anthropic, X.ai und via Ollama. Eine Feature-Übersicht findet sich hier. Bruin gibt Studenten, Non-Profits sowie Journalisten 30 Prozent Rabatt, wenn sich diese per E-Mail bei ihm melden. Zuletzt kam auch noch Unterstützung für ElevenLabs Scribe und Deepgram Nova hinzu.MacWhisper beherrscht über 100 Sprachen. Die App kann zudem Audio von diversen Mac-Apps direkt erfassen, so dass man nichts umständlich abspeichern muss. Hardware-Voraussetzung ist ein Mac mit M-Chip, also Apple Silicon. Im Preis sind Updates integriert, ein Abo gibt es nicht.Empfohlener redaktioneller InhaltMit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden.
Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden.
Mehr dazu in unserer
Datenschutzerklärung.(bsc)

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert