Visualisierung von Audiosignalen
Dies ist der erste Schritt beim bauen einer Spracherkennungs - Software. Damit gelingt es, die Struktur von Audiosignalen zu verstehen.
Im folgenden Beispiel wird ein Audiosignal analysiert. Die Herkunft ist eine Audiodatei.
Beispiel - VisualisierungAudio.py
# Visualisierung eines Audiosignals
# 2022 Ehrenfried Stuhlpfarrer
# Import der erforderlichen Bibliotheken
import numpy as np
import matplotlib.pyplot as plt
from scipy.io import wavfile
# Das Audiofile einlesen - TestAudio.wav
# Rückgabe Frequenz und Audiosignal
freq_sampling, audio_sig = wavfile.read("TestAudio.wav")
# Einige Parameter des Audiosignal anzeigen
print("\n Signalform - Shape:", audio_sig.shape)
print("\n Signal Datentyp: ", audio_sig.dtype)
print("\n Signaldauer: ", round(audio_sig.shape[0] / float(freq_sampling), 2), "seconds")
# Das Audiosignal normalisieren
audio_sig = audio_sig / np.power(2, 15)
# Das Signal visualisieren - die ersten Werte extrahieren
audio_sig = audio_sig[:200000]
time_axis = 1000 * np.arange(0, len(audio_sig), 1) / float(freq_sampling)
# Engültig anzeigen
plt.plot(time_axis, audio_sig, color="red")
plt.xlabel("Time(ms)")
plt.ylabel("Amlitude")
plt.title("Audio Signal")
plt.show()
Signalform - Shape: (11793844, 2) Signal Datentyp: int16 Signaldauer: 267.43 seconds