Новости    Библиотека    Байки    Ссылки    О сайте


предыдущая главасодержаниеследующая глава

§ 8.5.2. Экспериментальный материал и исходное описание

Согласно задаче исследования была подготовлена одна фраза на материале русского литературного языка, состоящая из 11 слогов: "монтаж приставок закончен полностью" (с главным логическим ударением на последнем слове). Фраза была начитана 40 дикторами (25 мужчин и 15 женщин). Указанная фраза была начитана с интонациями: повествовательной, вопросительной, восклицательной и интонацией незавершенности, обусловленными соответствующим контекстом.

Экспериментальный материал был записан на магнитофон и проверен 5 аудиторами. В результате аудиторского отбора было оставлено 120 фраз, стопроцентно идентифицированных аудиторами.

Из фонетических исследований [8.25] известно, что основная информация о коммуникативных типах интонаций содержится в таких параметрах речевого сигнала, как частота основного тона, интенсивность и длительность произнесения единиц речевого сигнала (например, длительность слогов). Значение частоты основного тона, интенсивности и длительности слогов были получены по интонограммам интонографа И-66.

На рис. 8.19 приведены интонограммы четырех типов интонаций, начитанных одним диктором. По осям абсцисс отсчитывается время, а по осям ординат - интенсивность и частота основного тона. Длины отрезков, на которые разбита произнесенная фраза, соответствуют длительностям слогов. Точками обозначены 27 отсчетов интонограммы, которые были выбраны в качестве исходного описания частоты основного тона и интенсивности.

8.19. Интонограммы четырех типов интонаций одного диктора
8.19. Интонограммы четырех типов интонаций одного диктора

На вид интонограммы сильно влияют средняя громкость произнесения, средняя частота основного тона и средний темп речи. С одной стороны, эти параметры полезны для различения заданных классов интонации, но, с другой стороны, они вносят большую нестабильность от диктора к диктору. Для инвариантизации параметров исходного описания для каждой интонограммы отсчеты частоты основного тона, интенсивности и длительности были пронормированы по средним значениям. Параметры средней частоты основного тона, средней интенсивности и средней длительности произнесения слога были добавлены в исходное описание интонаций после их нормирования.

Таким образом, препарированное исходное описание интонации состояло из 41 параметра.

предыдущая главасодержаниеследующая глава






Выпущен открытый сервер навыков 0Mind для упрощения разработки ИИ

Создатель Всемирной паутины выступил против Facebook и Google

В Китае построят суперкомпьютер, способный выполнять квинтиллион вычислений в секунду

Использование нейронной сети для восстановления повреждённых изображений

В Китае робот сдал тест для поступления в университет

Россия будет защищена от внешнего отключения Рунета к 2021 году

О конференции Strata AI: будущее искусственного интеллекта

Китайский самообучающийся процессор сможет имитировать работу нервных клеток человека

Илон Маск работает над интерфейсом для подключения мозга к компьютеру

Загадка QWERTY: почему буквы на клавиатуре расположены не в алфавитном порядке

Нейронную сеть научили практически идеально копировать человеческий голос





© Злыгостев Алексей Сергеевич, подборка материалов, оцифровка, статьи, оформление, разработка ПО 2001-2018
При копировании материалов проекта обязательно ставить активную ссылку на страницу источник:
http://informaticslib.ru/ "InformaticsLib.ru: Информатика"