Exemplo do corpus

O corpus C-ORAL-BRASIL é um recurso multimídia composto por um conjunto de arquivos em três formatos:

  1. Arquivo "wav" (som);

  2. Arquivo "rtf" (texto);

  3. Arquivo "xml" (alinhamento texto-som).

Para ver um exemplo extraído do corpus, clique aqui para baixar os arquivos acima em formato "zip".

Cada transcrição possui um cabeçalho no qual encontram-se informações referentes à situação gravada e dados sociolinguísticos dos participantes. Clique aqui para ver um exemplo de cabeçalho.

Para baixar o cabeçalho (formato "txt"), clique com o botão direito no link e depois em Salvar link como... ou Salvar destino como..., dependendo do seu navegador.


Instruções

Extraia os arquivos em uma pasta de seu computador.

Para abrir o alinhamento texto-som, você precisará ter o software Winpitch Pro instalado em seu computador.

Execute o Winpitch e abra o arquivo de extensão "xml" através do menu Alignment file.... O áudio será carregado simultaneamente.