Skip to content

GuideGlare AI Audio

AI Audio: aus Text eine Stimme, aus der Aufnahme ein Transkript. Alles an einem Ort.

Diktieren Sie ein Skript und hören Sie es in einer natürlichen Stimme. Fügen Sie einen Podcast-Link ein und haben Sie binnen einer Minute das Transkript. AI Audio vereint Sounderzeugung und Sprachtranskription in einem einzigen Werkzeug.

  • Stimmen und Dialoge aus Text – natürliches Deutsch
  • Musik und Soundeffekte auf Zuruf
  • Transkription von Audio und Video bis 3 GB
  • Untertitel als SRT und VTT mit einem Klick

porada-q2.mp3

Transkript · 42:18

Text SRT VTT

Was AI Audio kann

Fünf Audio-Werkzeuge, ein Konto.

Statt zwischen Abos für Stimme, Musik und Transkription zu wechseln, erledigen Sie alles an einem Ort.

Stimmenerzeugung

Ihren Text liest eine natürliche deutsche Stimme

Schreiben oder fügen Sie Text ein, wählen Sie eine Stimme und die KI liest ihn natürlich vor — mit Interpunktion, Pausen und Intonation. Kein roboterhafter Akzent.

Setzen Sie auch Dialoge mehrerer Figuren zusammen, jede mit eigener Stimme. Für Video, Podcast, E-Learning oder das Einsprechen eines Buchs.

  • Dutzende deutsche Stimmen
  • Männlich und weiblich, verschiedene Charaktere
  • 70+ Sprachen in einem Konto
  • Dialoge mit mehreren Figuren
Konto erstellen

Wählen Sie eine Sprache und spielen Sie ab:

MK

Marek

tiefe männliche Stimme

0:00

Musik

KI-Musik nach Maß — instrumental und mit Gesang

Beschreiben Sie die Stimmung oder das Genre und die KI komponiert einen Track, der zu Ihrem Video, Podcast oder Spiel passt — bis zu zwei Minuten lang, rein instrumental oder auch mit Gesang.

  • Musik aus einer Texteingabe
  • Länge bis 2 Minuten
  • Instrumental und mit Gesang
  • Für Video, Podcast und Spiele
Konto erstellen

Instrumental

Ruhiges Piano „langsame, emotionale Klaviermelodie“
0:00
Werbejingle „flotter Jingle für einen Werbespot“
0:00

Mit Gesang

Rock über die Zukunft „energiegeladener Rock mit Gesang“
0:00
Popsong „eingängiger Pop-Track mit Gesang“
0:00

Dialoge

Dialoge mehrerer Figuren, jede mit eigener Stimme

Setzen Sie Gespräche, Szenen oder einen Podcast mit mehreren Figuren zusammen. Jeder weisen Sie eine andere Stimme zu und die KI fügt die Repliken zu einer flüssigen Konversation zusammen.

  • Mehrere Figuren in einer Spur
  • Eigene Stimme für jede Figur
  • Für Szenen, Hörbücher und Podcasts
Konto erstellen
A

Moderatorin

B

Gast

Dialog-Beispiel 6 Stimmen · 1 Spur
0:00

Sprachtranskription

Transkription aus YouTube, TikTok und Vimeo

Fügen Sie einen Link ein oder laden Sie eine Datei bis 3 GB hoch und die KI liefert ein präzises Transkript mit Interpunktion — sogar mit Unterscheidung der einzelnen Sprecher.

Aus dem Transkript erstellen Sie mit einem Klick Untertitel für Video, soziale Netzwerke oder E-Learning.

  • Link von YouTube/TikTok/Vimeo
  • Dateien bis 3 GB
  • 90+ Sprachen
  • Export als Text, SRT und VTT
Konto erstellen
youtube.com/watch?v=…
Text SRT VTT

Soundeffekte

Soundeffekte nach Maß

Brauchen Sie Regen, Applaus oder Schritte im Flur? Beschreiben Sie den Klang mit Worten und die KI erzeugt ihn — ohne Durchsuchen von Bibliotheken und ohne Lizenzsorgen.

  • Effekt aus einer Wortbeschreibung
  • Für Video, Spiele und Podcast
  • Ohne Lizenzgebühren
Konto erstellen
Applaus
0:00
Vogelgesang
0:00
Regen aufs Dach
0:00
Straßenlärm
0:00

So funktioniert es

Von der Eingabe zum fertigen Sound.

Wählen Sie ein Werkzeug und sehen Sie, wie man darin arbeitet.

  1. 01

    Track beschreiben

    Geben Sie Genre, Stimmung oder Tempo ein — etwa „epische Filmmusik“ oder „ruhiges Piano“.

  2. 02

    Stil wählen

    Wählen Sie einen rein instrumentalen Track oder beschreiben Sie den Gesang und die Sprache, in der die KI singen soll.

  3. 03

    Länge wählen

    Von einigen Sekunden bis zu 2 Minuten originaler, von der KI erstellter Musik.

  4. 04

    Herunterladen

    Die KI komponiert einen originalen Track, den Sie abspielen oder als MP3 herunterladen können.

Häufige Fragen zu AI Audio

Was ist AI Audio?

AI Audio ist ein Werkzeug von GuideGlare, das in einer Oberfläche aus Text Stimmen, Dialoge, KI-Musik und Soundeffekte erzeugt und gleichzeitig Audio und Video in Text transkribiert. So ersetzt es mehrere eigenständige Werkzeuge in einem Konto.

Kann ich ein YouTube-Video oder einen Podcast transkribieren?

Ja. Sie fügen einen Link von YouTube, TikTok oder Vimeo ein und AI Audio liefert das Transkript als Text, SRT- oder VTT-Untertitel. Das Limit pro Datei beträgt 3 GB, und das Transkript unterscheidet auch die einzelnen Sprecher.

Kann die KI auf Deutsch sprechen und schreiben?

Ja. Sowohl die Stimmenerzeugung als auch die Sprachtranskription sind für Deutsch optimiert. Die Stimmen beherrschen über 70 Sprachen, die Sprachtranskription über 90 Sprachen.

Wie entsteht KI-Musik?

KI-Musik erstellen Sie aus einer Wortbeschreibung — Sie geben Genre, Stimmung oder Tempo ein und die KI komponiert bis zu zwei Minuten eines originalen Tracks. Das funktioniert rein instrumental und mit Gesang.

Welche Musikgenres unterstützt die KI-Musik?

Praktisch alle. Von Pop, Rock und Elektronik über Hip-Hop und Jazz bis hin zu Film-, Klassik- oder Ambient-Musik — beschreiben Sie einfach Genre und Stimmung mit Worten und die KI passt sich daran an.

In welchen Sprachen kann die KI-Musik singen?

Den Gesang beherrscht sie in 29+ Sprachen, einschließlich Deutsch. Am natürlichsten klingt sie in den verbreitetsten Sprachen wie Englisch oder Spanisch; bei selteneren Sprachen kann das Ergebnis etwas schwächer ausfallen.

Kann AI Audio auch Soundeffekte?

Ja. Sie beschreiben den Klang mit Worten — etwa Regen, Applaus oder Straßenlärm — und die KI erzeugt ihn. Sie müssen keine Bibliotheken durchsuchen und sich nicht um Lizenzen kümmern.

Darf ich die generierte Stimme und Musik kommerziell nutzen?

Den generierten Sound, die Musik und den eingesprochenen Text dürfen Sie in eigenen Projekten verwenden, auch in kommerziellen. Den konkreten Umfang regeln die Geschäftsbedingungen von GuideGlare.

In welchen Formaten erhalte ich die Untertitel?

Die Untertitel exportieren Sie im Format SRT und VTT – bereit zum Hochladen auf YouTube oder in einen Video-Editor.

Ist AI Audio Teil des Abos?

Transkription und Stimmenerzeugung sind in den kostenpflichtigen Plänen verfügbar. Die Erzeugung von KI-Musik und Soundeffekten finden Sie im Plan Advanced. Details finden Sie auf der Preisseite.

Sind meine Aufnahmen sicher?

Ja. Wir verarbeiten die Dateien DSGVO-konform auf Servern in der EU. Ihre Aufnahmen geben wir nicht an Dritte weiter und verwenden sie nicht zum Training von Modellen.

Fehlt etwas? Schreiben Sie uns.