PCGuia PCGuia
  • [email protected]
  • Dicas
    • Apps
    • Descomplicómetro
    • Download da semana
    • Guia completo
    • Inteligência Artificial
    • Linux
    • Modding
    • Photoshop
    • Teste de velocidade da Internet
    • Open Source
  • MacGuia
  • Jogos
  • Notícias
    • Ambiente
    • Apps
    • Ciência
    • Curiosidades
    • Hardware
    • Inteligência Artificial
    • Internet
    • Mercados
    • Mobilidade
    • Multimédia
    • Robots
    • Segurança
    • Software
    • Startup
    • Especiais
      • Especial PCGuia
      • História
  • Reviews
    • Armazenamento
    • Áudio
    • Componentes
    • Desktops
    • Gadgets
    • Imagem
    • Mobilidade
    • Periféricos
    • Robótica
  • Opinião
    • Conceito Humanoide
    • Há Uma App Para Tudo
    • O Que Vem à Rede
    • Praia das Maçãs
    • Quinta Coluna
  • Precisa de ajuda?
  • Contactos
  • Resultados da votações dos Prémios Leitor PCGuia 2024
  • Como testamos os produtos
  • Termos de utilização
  • Política de privacidade e cookies
  • Estatuto Editorial
  • Declaração de Privacidade
  • Declaração de Privacidade
  • Política de Cookies
© 2023 - Fidemo Sociedade de Media
A ler: Reconhecimento de voz
Font ResizerAa
PCGuia PCGuia
Font ResizerAa
Procurar
  • Dicas
  • Jogos
  • Linux
  • Notícias
  • Opinião
  • Reviews
  • Cookie Policy
© 2023 Fidemo Sociedade de Média
PCGuia > Dicas > Descomplicómetro > Reconhecimento de voz
DescomplicómetroDicas

Reconhecimento de voz

Gustavo Dias
Publicado em 14 de Setembro, 2019
Tempo de leitura: 3 min

Para que um sistema operativo reconheça a voz do seu utilizador é necessário um microfone associado a um conversor AD (analógico para digital), que irá converter as ondas de som analógicas em dados, enquanto consegue filtrar ruídos e interferências. A partir desses dados, serão criadas pequenas fracções (fonemas) que depois são transformados em sons fonéticos e, posteriormente, sincronizados de acordo com os dados existentes na sua base de dados local, ou na cloud, para que o som captado tenha a mesma frequência que os dados armazenados.

- Publicidade -

Isto é, no fundo, uma tecnologia de reconhecimento de padrões, a partir da qual o sistema conseguirá identificar as palavras ditas pelo utilizador, atribuindo assim uma finalidade tendo em conta a função em uso, como uma pesquisa por voz ou a introdução de comandos por voz.

Assistentes
A evolução na eficácia dos sistemas de reconhecimento por voz deve-se, em grande parte, ao crescimento da base de dados utilizada para o reconhecimento de padrões.

É por isso que, actualmente, os sistemas mais eficazes no reconhecimento de voz são os chamados assistentes pessoais, como a Siri da Apple, a Cortana da Microsoft, a Alexa da Amazon e o Google Assistant, que já conseguem interpretar diversos tipos de comandos de voz em vários idiomas. Em contrapartida, podemos usar como exemplo os dispositivos com bases de dados locais limitadas, como os sistemas de GPS de alguns automóveis, que além de só serem compatíveis com um idioma, têm sérias dificuldades na interpretação de alguns comandos, também devido à forma como são ditos. Mais que a identificação das palavras, o segredo dos sistemas como os assistentes pessoais está na interpretação correcta das mesmas, razão pela qual conseguem identificar comandos como ‘tempo em Lisboa’ ou ‘temperatura no Porto’, e assumir que o objectivo do utilizador será aceder à aplicação de meteorologia para saber o estado do tempo no local pretendido.

Músicas
Para a identificação de músicas, em aplicações como o Shazam, o processo é muito similar, embora haja um método de pesquisa da base de dados diferente, onde as músicas são convertidas num gráfico tridimensional, devido a dados como o tempo, a frequência e a intensidade: são as variações destes pontos, dentro da própria música, que facilitarão o reconhecimento da mesma. Porém, ao contrário do sistema de reconhecimento de voz, este não consegue fazer uma filtragem do ruído ambiente, o que poderá levar a falhas na detecção de uma música. Quando identificada, o Shazam consegue mostrar inclusive as letra da música ao mesmo tempo que é cantada, o que torna a app. uma espécie de karaoke.

- Publicidade -
Etiquetas:AlexaAmazonAppleCortanaGoogle AssistantMicrosoftReconhecimento de vozShazamSiri
Ad image
Apoio
Ad image Ad image

Também lhe pode interessar

App do diaDicas

App do Dia – Meow Rangers

Tempo de leitura: 0 min
DicasInteligência Artificial

Três serviços de IA para gerar modelos tridimensionais

Tempo de leitura: 3 min
DicasMacGuia

Trazer de volta a antiga versão do Mail

Tempo de leitura: 5 min
App do diaDicas

App do Dia – Proximo

Tempo de leitura: 1 min
© 2023 Fidemo Sociedade de Media
Gerir a sua privacidade

Para fornecer as melhores experiências, nós e os nossos parceiros usamos tecnologias como cookies para armazenar e/ou aceder a informações do dispositivo. O consentimento para essas tecnologias permitirá que nós e os nossos parceiros processemos dados pessoais, como comportamento de navegação ou IDs exclusivos neste site e mostrar anúncios (não) personalizados. Não consentir ou retirar o consentimento pode afetar adversamente certos recursos e funções.

Clique abaixo para consentir com o acima ou fazer escolhas granulares. As suas escolhas serão aplicadas apenas a este site. Pode alterar suas configurações a qualquer momento, incluindo a retirada de seu consentimento, usando os botões de alternância na Política de Cookies ou clicando no botão de consentimento para gerir na parte inferior do ecrã.

Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para o fim legítimo de permitir a utilização de um determinado serviço expressamente solicitado pelo assinante ou utilizador, ou para o fim exclusivo de efetuar a transmissão de uma comunicação numa rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenamento de preferências não solicitadas pelo assinante ou utilizador.
Estatísticas
O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anónimos. Sem uma intimação, conformidade voluntária por parte do seu Fornecedor de Serviços de Internet ou registos adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de utilizador para enviar publicidade ou para rastrear o utilizador num site ou em vários sites para fins de marketing semelhantes.
Estatísticas

Marketing

Recursos
Sempre ativo

Sempre ativo
Gerir opções Gerir serviços Gerir {vendor_count} fornecedores Leia mais sobre esses propósitos
Gerir opções
{title} {title} {title}