Discente: Luma da Silva Miranda

Título da tese: Estudo fonético-perceptivo da entoação de enunciados assertivos, interrogativos e exclamativos no português do Brasil: uma análise multimodal

Orientador(a): João Antônio de Moraes

Co-orientador(a): Albert Olivier Blaise Rilliard

Ano da defesa: 2019

Páginas: 245

Resumo:

Nesta pesquisa, foi realizada uma análise fonético-perceptiva multimodal da entoação de enunciados assertivos, interrogativos totais do tipo eco, exclamativos e interrogativos parciais no português do Brasil. O objetivo desta tese é analisar o reconhecimento perceptivo auditivo e visual desses quatro tipos de enunciados com seus valores pragmáticos específicos. Dez falantes (cinco homens e cinco mulheres) do Rio de Janeiro foram gravados e filmados. Este estudo é dividido em três etapas. Na primeira, a produção dos quatro tipos de enunciados é descrita tanto acusticamente, em relação aos parâmetros de F0, intensidade e duração, quanto visualmente, em termos de Unidades de Ação. Os resultados da análise da produção indicam que há pistas acústicas e visuais que distinguem esses significados pragmáticos manifestados pela entoação. O parâmetro acústico de F0 e, secundariamente, o de intensidade, são os que discriminam mais claramente os quatro contornos entonacionais. No que se refere aos gestos faciais, verificamos que, enquanto movimentos de cabeça e piscar dos olhos foram encontrados para a asserção, movimentos de cabeça e de sobrancelha foram constatados na produção da questão parcial, e movimentos de cabeça, sobrancelha e levantamento dos lábios na da exclamação. Nas duas etapas seguintes de avaliação perceptiva, foram aplicados sete experimentos de percepção, reunindo um total de duzentos e noventa e cinco ouvintes. Na segunda etapa, cinco experimentos de reconhecimento perceptivo audiovisual foram aplicados a um grupo de duzentos e cinquenta e um ouvintes, através da apresentação dos estímulos em três modalidades: somente áudio (A), somente vídeo (V) e áudio combinado com vídeo (AV). Os testes perceptivos audiovisuais mostraram que os quatro tipos de enunciado são identificados nas modalidades audiovisual (AV), auditiva (A) e visual (V), com exceção da questão-eco nessa última modalidade, devido ao fato desse tipo de enunciado não ter apresentado em nossos dados gestos faciais prototípicos, o que diferencia nossos resultados daqueles encontrados na literatura de prosódia audiovisual. Além disso, foi constatado que o canal visual não só atua de forma integrada na percepção da entoação de asserções, perguntas e exclamações, como também contribui de maneira mais efetiva em contextos com fala ambígua e com áudio degradado. Na terceira etapa, foram elaborados dois experimentos de reconhecimento perceptivo, aplicados a um grupo de quarenta e quatro ouvintes, para verificarix os correlatos acústico-perceptivos característicos dos quatro padrões, por meio da técnica de manipulação da curva de frequência fundamental. A identificação perceptiva dos estímulos com F0 manipulada nos permitiu concluir que a oposição entre os enunciados se dá na região nuclear dos contornos entonacionais. As seguintes características fonéticas da sílaba tônica nuclear se mostraram relevantes perceptivamente para os ouvintes no reconhecimento do valor funcional dos padrões melódicos: movimento descendente de F0 na asserção e na questão parcial, movimento ascendente de F0 na questão-eco e movimento ascendente de F0 de baixa amplitude na da exclamação. Associado ao tipo de movimento de F0, o padrão rítmico (comportamento conjunto da intensidade e da duração) também contribui para o reconhecimento da distinção dos quatro tipos de enunciados.

Resumé:

This research has produced a phonetic-perceptual multimodal analysis of the intonation of assertive, echo-question, wh-exclamation and wh-question utterances in Brazilian Portuguese. It aims at analyzing the auditory and visual recognition of these four types of utterances and their specific pragmatic values. Ten speakers (five male and five female) from Rio de Janeiro were recorded and filmed. This study is divided into three stages. In the first stage, the production of the utterances is described both acoustically – in relation to the fundamental frequency (F0), intensity and duration parameters – and visually, in terms of Action Units. The analysis indicates the existence of acoustic and visual cues that distinguish these pragmatic meanings manifested through intonation. It is primarily the acoustic paremeter of F0, and secondarily the intensity paremeter, which most clearly differentiate the four intonational contours. Regarding facial gestures, we verified that, while head movements and blinking were used for the production of assertion, head and eyebrow movements were used for wh-questions, and head, eyebrow and lip movements for the production of wh-exclamations. In the next two stages of perceptual evaluation, seven perceptual experiments were applied to a group of two hundred ninety-five listeners. In the second stage, five audiovisual perceptual tests were applied to two hundred fifty-one listeners, through the presentation of stimuli in three modalities: audio only (A), video only (V) and audio combined with video (AV). The audiovisual perceptual tests support the view that the four utterance types are recognized in audiovisual (AV), auditory (A) and visual (V) modalities, – excluding the visually presented echo-question in the latter situation, due to the fact that this utterance type did not present coherent facial gestures in our data. This differs from other results reported in the literature on audiovisual prosody. More importantly, we verified that the visual channel is not only integrated in the perception of assertion, question and exclamation, but also that it has a special role in contributing to the robustness of perception in contexts with ambiguous information or degraded audio. In the third stage, two perceptual recognition tests were applied to a group of forty-four listeners. These tests were elaborated for the verification of the prototypical acousticperceptual correlates of these four patterns, through the technique of the manipulation of fundamental frequency curve. The perceptual identification of stimuli with manipulated F0xi allowed us to conclude that the phonological opposition among the four types of utterances occurs within the nuclear region of the intonational contours. The following phonetic characteristics of the nuclear stressed syllable were perceptually relevant for the listeners to be able to recognize the functional value of the melodic patterns: a falling F0 movement is characteristic of assertions and wh-questions, a rising F0 movement is characteristic of echoquestions, and a small amplitude rising F0 movement is characteristic of wh-exclamations. Associated with the type of F0 movements, the rhythmic pattern (joint behavior of intensity and duration) also contributes for the recognition of the distinction among the four types of utterances.

Coordenação

Coordenadora: Profa. Dra. Maria Eugenia Lammoglia

Vice-Coordenadora: Profa. Dra. Eliete Figueira Batista da Silveira 

Secretário: Renato Martins e Silva
posvernaculas@letras.ufrj.br

Atendimento

Além de atender por e-mail, a Secretaria do PPGLEV oferece atendimento telefônico e presencial de segunda a quinta-feira, das 13h às 17h, na sala F-319.

Endereço

Programa de Pós-Graduação em Letras  (Letras Vernáculas)
Faculdade de Letras da UFRJ
Av. Horácio de Macedo, 2151
Sala F-319
Cidade Universitária — CEP 21941-917
Rio de Janeiro — RJ