Как создать pydub AudioSegment, используя массив numpy?

У меня есть следующий код в python

from scipy.io.wavfile import read
rate, signal = read('./data/input.wav')
# get only one channel
signal = signal[:,0] 
# do a bunch of processing here

Теперь я хочу создать сегмент pydub, используя «сигнал» и «скорость».

audio_segment = pydub.AudioSegment()

Итак, как я могу создать этот аудиосегмент, и как после этого я могу вернуть свой сигнал в виде массива numpy?


person Dayvid Oliveira    schedule 01.03.2016    source источник


Ответы (1)


Я смог запустить этот код на своей машине:

from scipy.io.wavfile import read
from pydub import AudioSegment

rate, signal = read("./test/data/test1.wav")
channel1 = signal[:,0]

audio_segment = pydub.AudioSegment(
    channel1.tobytes(), 
    frame_rate=rate,
    sample_width=channel1.dtype.itemsize, 
    channels=1
)

# test that it sounds right (requires ffplay, or pyaudio):
from pydub.playback import play
play(audio_segment)
person Jiaaro    schedule 02.03.2016
comment
Когда я пытаюсь это сделать, я получаю IndexError: слишком много индексов в строке channel1 = signal[:,0] - person hubatish; 30.05.2016
comment
Но э... это потому, что в моем файле был только один канал. Проверено с помощью простого оператора печати singal.shape. Кроме того, до версии 1.9 numpy мне приходилось использовать tostring вместо tobytes. - person hubatish; 30.05.2016