Vídeos de Informação - Legendagem Automática
Beta
Sobre o Projecto
Sistema P&R ( Pergunta & Resposta ) de Pesquisa Automática de Peças Jornalísticas

O Sistema em versão experimental transcreve, indexa e permite pesquisar peças jornalísticas emitidas nos programas de informação diária

Nomeadamente permite:
- Pesquisar o arquivo destes programas, identificando o conteúdo pertinente e respondendo a perguntas básicas por análise do contexto da notícia.
- Exemplo:
Pergunta: Qual o nome do computador portátil português?
Resposta: Magalhães

O sistema tem alguma imunidade a erros:
- Exemplo:
Pergunta: Quem é Hugo Chaves?
Resposta: Presidente da Venezuela.

- Identifica a partir das transcrições geradas automaticamente um conjunto de tópicos que condensam a informação contida nessas peças:
- Ex: Pessoas, Organizações, Entidades, Tópicos diversos a partir das quais pode hiper-navegar, refinar ou aumentar o âmbito da pesquisa inicial.

- Delimita semanticamente cada peça na sequência de peças jornalísticas que compôem os programas de informação diária através de um mecanismo automático de segmentação das notícias. O sistema identifica automaticamente pelo contexto o início e fim da peça sobre um determinado assunto atribuindo-lhe um título.

- Permite a visualização/áudio da peça (áudio e vídeo) e a sua transcrição automática, permitindo que pessoas com deficiência auditiva tenham acesso ao arquivo do programa Essa transcrição sendo automática está sujeita a erros derivados de fala espontânea, má interpretação por excesso de ruído, falta de palavras no vocabulário e residualmente por falha do reconhecedor Trata-se no entanto de um serviço de evidente utilidade para o cidadão portador ou não de deficiência auditiva.


Para o conseguir, o sistema usa não só a tecnologia de reconhecimento de fala, como sobretudo as actuais capacidades tecnológicas de processamento da linguagem natural, no sentido de incorporar módulos das funcionalidades/tecnologias de spelling, grammar, hifenao, sinonmia, etc. disponíveis para a língua portuguesa, na tecnologia desenvolvida pela Priberam.

O sistema foi desenvolvido em parceria com a RTP com a tecnologia de pesquisa da Priberam, Priberam Search e a tecnologia de legendagem online do INESC-ID, AUDIMUS.MEDIA.


Inovaes:
- Transcrio automática [AUDIMUS.MEDIA]

- Segmentação Automática [INESC I&D]

- Pesquisa semântica [Priberam Search].
Este serviço utiliza um sistema de transcrição, indexação e pesquisa totalmente automático, baseado no processamento da fala e da língua natural,
estando consequentemente sujeito a algumas incorrecções.