AI Artificial Intelligence

Viele Teile ergeben ein Ganzes! Die Kunst unwichtige Details zu vermeiden!

Visualisierung von Audiosignalen

Dies ist der erste Schritt beim bauen einer Spracherkennungs - Software. Damit gelingt es, die Struktur von Audiosignalen zu verstehen.

Im folgenden Beispiel wird ein Audiosignal analysiert. Die Herkunft ist eine Audiodatei.

Beispiel - VisualisierungAudio.py

# Visualisierung eines Audiosignals
# 2022 Ehrenfried Stuhlpfarrer

# Import der erforderlichen Bibliotheken
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile

# Das Audiofile einlesen - TestAudio.wav
# Rückgabe Frequenz und Audiosignal
freq_sampling, audio_sig = wavfile.read("TestAudio.wav")

# Einige Parameter des Audiosignal anzeigen
print("\n Signalform - Shape:", audio_sig.shape)
print("\n Signal Datentyp: ", audio_sig.dtype)
print("\n Signaldauer: ", round(audio_sig.shape[0] / float(freq_sampling), 2), "seconds")

# Das Audiosignal normalisieren
audio_sig = audio_sig / np.power(2, 15)

# Das Signal visualisieren - die ersten Werte extrahieren
audio_sig = audio_sig[:200000]
time_axis = 1000 * np.arange(0, len(audio_sig), 1) / float(freq_sampling)

# Engültig anzeigen
plt.plot(time_axis, audio_sig, color="red")
plt.xlabel("Time(ms)")
plt.ylabel("Amlitude")
plt.title("Audio Signal")
plt.show()

Signalform - Shape: (11793844, 2)

 Signal Datentyp:  int16

 Signaldauer:  267.43 seconds

KI

Copyright © 2022. All Rights Reserved. Ehrenfried Stuhlpfarrer