Здоровье/Анализ высоты тона и частоты голоса трансгендеров

Анализ высоты тона и частоты голоса трансгендеров

Аннотация: В статье рассматривается преобразование мужского голоса трансгендера в женский голос. Это преобразование голоса осуществляется путем манипулирования двумя основными акустическими характеристиками речевого сигнала. Двумя акустическими характеристиками здесь являются частота и высота звука. Частота - это физическая величина, которая дает количество колебаний в секунду, тогда как высота звука - это величина восприятия, которая зависит от слушателя. На самом деле наши уши улавливают высоту звука, а не частоту. На этапе 1 статьи выполнение программного обеспечения выполнялось в программном обеспечении MATLAB. Первым шагом будет получение входных сигналов. Входной сигнал представляет собой записанный аудиосигнал в формат wav. Следующим шагом является анализ и определение высоты входного речевого сигнала. Анализ высоты тона выполняется методом автокорреляции. Фильтр нижних частот используется для удаления высокочастотного шумового сигнала в виде импульса. Затем входной сигнал разлагается на количество окон в зависимости от общей длины сигнала. Разложение и наложение сигнала - это метод PSOLA. Используя метод PSOLA, мы увеличиваем частоту входного сигнала, чтобы получить желаемый выходной сигнал. Перекрытие сигнала увеличивает частоту речевого сигнала. Таким образом, желаемый выходной сигнал генерируется путем манипулирования записанным входным сигналом. Аппаратная часть выполнения имеет много общего с реализацией документа в реальном времени. Аппаратное обеспечение требуется для получения входного сигнала в режиме реального времени и выдачи выходного сигнала в режиме реального времени с небольшой задержкой. Здесь, в этой статье, входной сигнал raspberry pi 4 model B используется для получения входного сигнала через микрофон и выдачи выходного сигнала через динамик Bluetooth. Raspberry pi 4 model B следует автономному исполнению, чтобы выдавать желаемый результат в режиме реального времени.

Ключевые слова: МАБЛАБ, модификация голоса, трансгендер, автокорреляция, методика PSOLA.

1. ВВЕДЕНИЕ

Основная цель статьи - разработать реализацию, которая может анализировать высоту и частоту трансгендерного голоса, чтобы преобразовать мужской голос трансгендерного человека в женский голос. Одна из главных проблем, с которыми они сталкиваются, связана с их голосом. Людей этого сообщества можно узнать по их мужскому голосу. Они также подвергаются издевательствам и обращению по-разному из-за их голоса во многих ситуациях. Таким образом, основная цель статьи - найти средства для изменения их голоса в режиме реального времени и сделать их голос более пронзительным, как у других женщин. В данной статье рассматриваются две основные акустические особенности речевого сигнала. Двумя акустическими характеристиками являются высота тона и частота речевого сигнала. Частота - это физическая величина, которая дает количество колебаний в секунду, тогда как высота звука - это величина восприятия, которая зависит от слушателя, на самом деле наши уши улавливают высоту звука, а не частоту. В целом, частота тона у женщин выше, чем у мужчин. Это происходит из-за строения мужской и женской голосовых связок. Голосовые связки - это две полосы гладкой мышечной ткани, расположенные в гортани (голосовой ящик). Длина мужских голосовых связок больше, в то время как голосовые связки женщин короче. Поскольку длина женских голосовых связок короче, частота речевого сигнала выше, чем частота речевого сигнала, передаваемого мужчиной. При осуществлении анализа входной трансгендерный голосовой сигнал обрабатывается на основе акустических характеристик, и генерируется выходной сигнал, который является женским голосом. Первый этап был посвящен программному моделированию статьи в программном обеспечении MATLAB. В части выполнения программного обеспечения получают входной сигнал и определяют высоту тона с помощью метода автоматической корреляции. Импульсный шум во входном сигнале устраняется с помощью фильтра нижних частот. Позже, используя технику PSOLA, сигнал разбивается на окна, и окна перекрываются для получения высокочастотного выходного сигнала. Наконец, генерируется желаемый выходной сигнал. Аппаратная часть выполнения имеет много общего с реализацией документа в реальном времени. Аппаратное обеспечение требуется для получения входного сигнала в режиме реального времени и выдачи выходного сигнала в режиме реального времени с небольшой задержкой. Raspberry pi 4 model B используется для получения входного сигнала через микрофон и выдачи выходного сигнала через динамик Bluetooth.

2. МЕТОДОЛОГИЯ

Для реализации преобразования голоса необходимо изменить акустические характеристики голосового сигнала. В этой статье рассматриваются основные выбранные акустические характеристики, высота звука и частота. Эта процедура модификации выполняется в четыре основных этапа

i. Получение входного сигнала и фильтрация

ii. Анализ и обнаружение

iii. Декомпозиция для создания окон

iv. Перекрытие и генерация выходных данных.

2.1 Получение входного сигнала

Первым шагом будет получение входных сигналов. Голос трансгендерного человека записывается и сохраняется в системе. Отмечается формат записанного аудиофайла. Звук записывается в бесшумной среде, и мы считаем, что это сигнал без шума или с незначительным шумом. Здесь для этого приложения частоты сигналов выше 900 Гц устраняются с помощью фильтра нижних частот. Таким образом, записанный входной сигнал освобождается от шумов.

2.2 Анализ и обнаружение

Входной сигнал анализируется, и обнаруживаются акустические характеристики. Поскольку анализируется частота основного тона. Период высоты тона определяется с помощью метода автокорреляции. Сигнал нормализуется. Процесс нормализации адаптирован для сглаживания входного сигнала.

2.3 Декомпозиция для создания окон

Обнаруженный сигнал с шагом частоты затем разлагается для создания окон. Количество окон зависит от общей длины входного сигнала. Созданные окна - это окно ханнинга.

2.4 Дублирование и формирование выходных данных

Окна в форме разложены, сигнал перекрывается. Наложение выполняется внахлест, следуя технике ПСОЛА. Перекрытие сигнала увеличивает частоту подачи сигнала. Желаемый преобразованный сигнал получается путем выполнения всех вышеуказанных шагов. Наконец, сгенерированный выходной сигнал сохраняется в системе. Генерируемый выходной сигнал находится в .формат wav. Команда run выполнит все шаги и воспроизведет сгенерированный вывод.

Таким образом, следуя описанным выше шагам, цель достигнута. То есть низкочастотный входной сигнал преобразуется в высокочастотный выходной сигнал для достижения поставленной цели. На рисунке 2.1 показан процесс обработки сигнала

3. ДЕТАЛИ РЕАЛИЗАЦИИ

3.1 Метод автокорреляции

Метод автокорреляции используется для определения периода шага входного сигнала. Частота речевого сигнала обычно варьируется от 40 Гц для низкочастотного речевого сигнала до 600 Гц для высокочастотного сигнала. Этот метод автокорреляции требует двух периодов высоты тона для определения высоты тона сигнала. Это не что иное, как если нам нужно обнаружить низкочастотный сигнал, нам нужно будет проанализировать по крайней мере 50 мс (миллисекунд) речевого сигнала. Таким образом, в течение этого периода времени в 50 мс речевой сигнал высокой частоты не обязательно должен иметь одинаковую высокую частоту по всему окну.

3.2 Технология добавления синхронного перекрытия высоты тона (PSOLA)

Технология добавления синхронного перекрытия высоты тона используется для увеличения частоты входного сигнала. Метод PSOLA обычно используется в приложениях для обработки речи, особенно при синтезе речевого сигнала при цифровой обработке сигналов. Этот метод обычно адаптируется для изменения продолжительности и высоты тона речи signal.in в технике PSOLA речевой сигнал разлагается на окна. Изменение высоты тона и изменение длительности достигается различными стилями перекрытия сигналов. То есть для увеличения высоты тона речевого сигнала

, окна сведены вместе, тогда как для уменьшения высоты тона окна отодвинуты далеко друг от друга. Аналогично, чтобы изменить продолжительность, сегменты повторяются несколько раз, чтобы увеличить продолжительность, и несколько сегментов удаляются, чтобы уменьшить продолжительность. Здесь, в этой статье, мы объединяем окна вместе, чтобы увеличить частоту. Позже сегменты объединяются вместе с помощью метода добавления перекрытия. Вот как работает техника ПСОЛА для увеличения частоты.

4. РЕЗУЛЬТАТ

Желаемый выходной сигнал - это высокочастотный выходной сигнал. Рисунок 5.1 - это рисунок, полученный в качестве выходных данных после выполнения кода MATLAB.

На рисунке у нас есть три разных графика. Первый вверху - это график амплитуды входного речевого сигнала. Для демонстрации метода автокорреляции мы использовали 1000 выборок из входного сигнала. Последний график на рисунке внизу представляет собой график амплитуды выходного речевого сигнала. Здесь мы можем заметить, что частота выходного сигнала выше, чем частота входного речевого сигнала. Мы можем внимательно наблюдать за первым и последним графиками на рисунке, чтобы точно определить изменение частоты. Частота увеличилась в результате перекрытия окон.

Заключение

К концу первой фазы работы записанный сигнал успешно преобразуется путем анализа частоты тона низкочастотного входного сигнала и манипулирования акустическими характеристиками для получения высокочастотного выходного сигнала. Работа по решению одной из главных непризнанных проблем в обществе наполовину завершена. Для того, чтобы реализовать бумагу в режиме реального времени, потребуется входной порт. Входной порт должен быть подключен с помощью микроконтроллера. Будущая работа на этапе II заключалась в реализации работы на аппаратном устройстве с использованием микроконтроллера Raspberry pi. Эта цель достигнута на данном этапе-II статьи. Через USB-порт микроконтроллера Raspberry pi 4 model B подключается микрофон, а динамик Bluetooth подключается к микроконтроллеру по беспроводной сети. входной сигнал поступает с микрофона в режиме реального времени, а преобразование голоса выполняется в модуле raspberry pi с помощью кода MATLAB. Вывод в режиме реального времени осуществляется на динамик Bluetooth.Цель статьи достигается путем преобразования высоты и частоты мужского трансгендерного голоса в женский.

REFERENCES

[1]    Mark Tse, “Voice Transformation”, Columbia University,EE6820 Speech and Audio Processing Paper Report, Spring, 2003

[2]    Liliana, Resmana Lim, Elizabeth Kwan, “Voice Conversion Application (VOCAL)” , Informatics Department, Industrial Technology aculty Petra Christian University Surabaya, 2011 International Conference on Uncertainty Reasoning and Knowledge Engineering

[3]    Hirokazu Kameoka, Wen-Chin Huang, Kou Tanaka, Takuhiro Kaneko, Nobukatsu Hojo, and Tomoki Toda,” Many-to-Many Voice Transformer Network”, IEEE/ACM TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 29, 2021

[4]    Allam Mousa, “Voice Conversion Using Pitch Shifting Algorithm By Time Stretchingwith PSOLA And Re–sampling”, Journal of ELECTRICAL ENGINEERING, VOL. 61, NO. 1

[5]    Ali Akbar Shah, Zulfiqar Ali Zaidi , Dr. Bhawani Shankar Chowdhry, Dr. Jawaid Daudpoto, “Real time ace Detection/Monitor using Raspberry pi and MATLAB IEEE 10th International Conference on Application of Information and Communication Technologies (AICT) , 2016

[6]    K. Horak and L. Zalud , “Image Processing on Raspberry Pi or Mobile Robotics , International Journal of Signal Processing Systems Vol. 4, No. 6, December 2016

[7]    https://in.mathworks.com/products/matlab.html

[8]    https://www.youtube.com

[9]    https://in.mathworks.com/products/matlab.html

[10]  https://en.wikipedia.org/wiki/


Keerthana A, Veena S, Electronics and Communication Engineering Dept. PES University, Bangalore, India

Electronics and Communication Engineering Dept. PES University, Bangalore, India

Ниже Вы можете высказаться по теме или оставить свои вопросы - узнайте больше информации!
Альтернативная правда: историческая фантастика: имеет ли значение, что мы правильно истолковываем факты?

Альтернативная правда: историческая фантастика: имеет ли значение, что мы правильно истолковываем факты?
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

В эти темные дни фальшивых новостей и альтернативной правды, возможно, самое время обратить внимание на вопрос достоверн...
Сергей Островский
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Джастин Линдсей вошла в историю как первая открыто трансгендерная болельщица НФЛ

Джастин Линдсей вошла в историю как первая открыто трансгендерная болельщица НФЛ
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Джастин Линдсей вошла в историю НФЛ на прошлой неделе после того, как заработала место в TopCats.Линдси объявила в Insta...
Эльвира
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Сын Илона Маска подал заявление на смену пола и имени, чтобы разорвать отношения с отцом

Сын Илона Маска подал заявление на смену пола и имени, чтобы разорвать отношения с отцом
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Ребенок миллиардера Илона Маска полностью меняет свою личность, чтобы дистанцироваться от отца.Ксавье Александ...
Джони Волкер
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Дочь Илона Маска отрекается от него и требует отказаться от его имени

Дочь Илона Маска отрекается от него и требует отказаться от его имени
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю
Против мнения
Не нравится
Нейтрально
Нравится
Поддерживаю

Один из детей Илона Маска подал прошение об изменении имени, заявив, что «я больше не живу и не хочу быть связ...
Джони Волкер
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
person Опубликовал(а): Самоучка
Против аккаунта
Не нравится
Нейтрально
Нравится
Поддерживаю
Оцените статью:
person group filter_1
Ширина охвата темы
0
0
0
Глубина
0
0
0
Оценка автору
0
0
0

Чтобы увидеть комментарии, или написать свой, авторизуйтесь.

ВНИМАНИЕ: факты и мнения, высказанные в этой статье, являются личным мнением автора. BeText.ru не несет никакой ответственности за точность, полноту, пригодность или достоверность любой информации в этой статье.