Arbeiten mit noScribe
Nutzung von noScribe zur automatisierten Transkription im Hochschulkontext
1. Allgemeine Informationen
noScribe ist eine Software, die mithilfe der KI-Technologie Whisper automatisch Audioaufnahmen in geschriebenen Text umwandelt.
Die Anwendung kann vollständig lokal auf einem Desktop-Computer ausgeführt werden.
Für eine zügige Transkription ist ein leistungsfähiger Rechner empfehlenswert; der Einsatz einer NVIDIA-Grafikkarte kann den Prozess deutlich beschleunigen, ist jedoch nicht zwingend erforderlich.
2. Bedeutung und Grenzen automatisierter Transkription
Automatisierte Transkriptionen stellen ein wichtiges Werkzeug in der wissenschaftlichen Arbeit dar, insbesondere bei der Auswertung qualitativer Daten (z.B. Interviews oder Gesprächsverläufe).
Es ist zu beachten, dass Transkriptionen nicht rein mechanisch, sondern stets interpretativ sind: Je nach Methode können etwa Tonfall, Lautstärke, Pausen, Verzögerungslaute oder Versprecher berücksichtigt werden.
Daher gilt:
- Verwenden Sie automatisierte Transkriptionsverfahren nicht unreflektiert.
- Überprüfen und bearbeiten Sie die generierten Texte manuell.
3. Datenschutz und ethische Aspekte
Da noScribe vollständig lokal auf Ihrem Computer ausgeführt wird, werden keine Daten an externe Server oder Cloud-Dienste übertragen.
Daraus ergibt sich, dass keine datenschutzrechtlichen Vereinbarungen mit externen Dienstleistern notwendig sind.
Trotzdem gilt:
- Holen Sie Einwilligungen der beteiligten Personen für die Aufnahme und ggf. KI-gestützte Auswertung ein.
- Beachten Sie die Datenschutzrichtlinien Ihrer Hochschule sowie geltende rechtliche Vorgaben zur Forschungsethik.
4. Merkmale von noScribe
noScribe ist:
- eine kostenlose, Open-Source-Software (Lizenz: GPL-3.0),
- KI-basiert, zur Transkription insbesondere für qualitative Sozialforschung oder journalistische Zwecke,
- vollständig offline nutzbar (keine Internetverbindung erforderlich),
- in der Lage, mehrere Sprecher zu unterscheiden,
- auf rund 60 Sprachen anwendbar,
- mit einem integrierten Editor ausgestattet, der das Überprüfen, Anhören und Korrigieren von Transkripten ermöglicht.
Download und weitere Informationen finden Sie auf GitHub (externer Link, außerhalb des Webangebots der TH Rosenheim):
https://github.com/kaixxx/noScribe
Im Abschnitt „Download and Installation“ sind Installationsdateien für verschiedene Betriebssysteme (Windows, macOS etc.) verfügbar. Bitte beachten Sie, dass die Installationsdateien etwa 4 GB groß sind und eine stabile Internetverbindung erfordern.
5. Installation (Beispiel: Windows-PC ohne NVIDIA-Grafikkarte)
- Laden Sie die Installationsdatei
„noScribe_setup__cuda.exe“ über den folgenden Link herunter (externer Link):
https://drive.switch.ch/index.php/s/EIVup04qkSHb54j - Führen Sie die heruntergeladene Datei aus und folgen Sie den Installationsanweisungen.
- Nach Abschluss der Installation kann noScribe gestartet werden.
6. Nutzung und Arbeitsweise
- Öffnen Sie noScribe.
- Wählen Sie oben links die zu transkribierende Audio- oder Videodatei aus.
- Geben Sie den Dateinamen für das zu speichernde Transkript an.
- Starten Sie die Transkription mit dem „Start“-Button.
- Nach Abschluss öffnet sich ein Editor-Fenster, in dem der erzeugte Text angezeigt, nachgehört und bearbeitet werden kann.
TIPP: Da die Transkription auf einem Standard-PC mehr Zeit als die Originaldauer der Aufnahme benötigt, empfiehlt es sich, zunächst mit kurzen Ausschnitten (z. B. 00:00:00 bis 00:02:00) zu testen.
7. Weiterführende Ressourcen
- Offizielle Anleitung (englisch):
https://github.com/kaixxx/noScribe?tab=readme-ov-file#usage - Video-Tutorial von Forge Ideas (YouTube):
https://www.youtube.com/watch?v=dNvBrLb4CDs - Erfahrungsbericht zur Nutzung von noScribe:
https://sozmethode.hypotheses.org/2315
8. Empfehlungen für die Nutzung von KI-basierter Transkription
- Überprüfung der Genauigkeit
KI-generierte Transkripte sind nicht fehlerfrei. Insbesondere bei Fachterminologie, Dialekten, Mehrsprachigkeit, Hintergrundgeräuschen oder sich überschneidender Rede treten häufig Erkennungsfehler auf.
→ Prüfen und korrigieren Sie die Transkripte sorgfältig, bevor Sie diese für wissenschaftliche Analysen, Zitate oder Veröffentlichungen verwenden. - Transkriptionsethik und Kontextbewusstsein
Eine KI „versteht“ den Gesprächskontext nicht. Sie verschriftlicht lediglich akustische Signale.
→ Bewerten Sie die erzeugten Texte daher im Kontext Ihrer Forschung und berücksichtigen Sie, dass Nuancen (Ironie, Emotion, soziale Dynamik) nicht automatisch erkannt oder korrekt wiedergegeben werden. - Transparenz in der wissenschaftlichen Dokumentation
Wenn KI-gestützte Transkriptionen in Forschungsprojekten eingesetzt werden, sollte dies transparent dokumentiert werden.
→ Geben Sie in Methodenabschnitten oder Forschungsberichten an, welches Tool (z. B. noScribe / Whisper), welches Modell und welche Nachbearbeitungsschritte verwendet wurden. - Datenschutz und Vertraulichkeit
Auch bei lokaler Verarbeitung gilt:
→ Schützen Sie sensible Audiodaten durch sichere Speicherung, Passwortschutz und ggf. Anonymisierung vor der Transkription.
→ Löschen Sie nicht mehr benötigte Dateien datenschutzkonform. - Nachbearbeitung und Qualitätskontrolle
→ Definieren Sie intern Qualitätsstandards (z. B. stichprobenartige Kontrolle oder manuelle Nachbearbeitung durch eine zweite Person).
→ Notieren Sie Abweichungen oder Unsicherheiten im Transkript. - Verantwortung für die Endfassung
Auch wenn eine KI die Transkription erstellt, liegt die wissenschaftliche Verantwortung für die Richtigkeit, Vollständigkeit und Interpretation immer bei der forschenden Person.