из аудиофайла нельзя вырезать только голос и оставить музыку. Голос вырезается частотно. Но на тех частотах, что находится голос, также находится музыка, соответственно голос вырезается вместе с музыкой. Это всё равно, что попросить отрезать руку, а пальцы оставить