Я пытаюсь обнаружить голосовой ввод с микрофона в режиме реального времени.
Я уже получаю ввод, выполняю алгоритм БПФ и получаю результат в дБ. У меня есть частотная область, временная область и спектрограмма.
Как получить основную частоту? Если я получу основную частоту, могу ли я указать, что если частота находится между определенными значениями, то мы говорим голосом? Есть ли другой способ сделать это с вещами, которые у меня уже есть?
Спасибо заранее