PCGuia PCGuia
  • [email protected]
  • Dicas
    • Apps
    • Descomplicómetro
    • Download da semana
    • Guia completo
    • Inteligência Artificial
    • Linux
    • Modding
    • Photoshop
    • Teste de velocidade da Internet
    • Open Source
  • MacGuia
  • Jogos
  • Notícias
    • Ambiente
    • Apps
    • Ciência
    • Curiosidades
    • Hardware
    • Inteligência Artificial
    • Internet
    • Mercados
    • Mobilidade
    • Multimédia
    • Robots
    • Segurança
    • Software
    • Startup
    • Especiais
      • Especial PCGuia
      • História
  • Reviews
    • Armazenamento
    • Áudio
    • Componentes
    • Desktops
    • Gadgets
    • Imagem
    • Mobilidade
    • Periféricos
    • Robótica
  • Opinião
    • Conceito Humanoide
    • Há Uma App Para Tudo
    • O Que Vem à Rede
    • Praia das Maçãs
    • Quinta Coluna
  • Precisa de ajuda?
  • Contactos
  • Como testamos os produtos
  • Termos de utilização
  • Política de privacidade e cookies
  • Estatuto Editorial
  • Declaração de Privacidade
  • Política de Cookies
© 2023 - Fidemo Sociedade de Media
A ler: FFmpeg adiciona primeira funcionalidade de IA: o filtro de transcrição áudio Whisper
Font ResizerAa
PCGuia PCGuia
Font ResizerAa
Procurar
  • Dicas
  • Jogos
  • Linux
  • Notícias
  • Opinião
  • Reviews
  • Cookie Policy
© 2023 Fidemo Sociedade de Média
PCGuia > Notícias > Inteligência Artificial > FFmpeg adiciona primeira funcionalidade de IA: o filtro de transcrição áudio Whisper
Inteligência ArtificialMultimédiaNotícias

FFmpeg adiciona primeira funcionalidade de IA: o filtro de transcrição áudio Whisper

O Whisper para o FFmpeg é um modelo de reconhecimento de fala opcional que pode tirar partido da placa gráfica do PC.

Pedro Tróia
Publicado em 18 de Agosto, 2025
Tempo de leitura: 3 min

Ainda que o FFmpeg seja frequentemente associado a tarefas de transcodificação de vídeo, também pode manipular streams e ficheiros áudio com facilidade. O projecto de código aberto está agora a lançar a sua primeira funcionalidade potenciada por IA: um filtro de transcrição áudio baseado num popular modelo de reconhecimento de fala desenvolvido pela OpenAI.

- Publicidade -

Pela primeira vez na sua longa história, o FFmpeg via integrar modelos de IA com o lançamento do novo filtro de áudio Whisper. Este filtro pode processar streams ou ficheiros de áudio para reconhecer fala automaticamente, potencialmente simplificando os fluxos de trabalho de transcodificação de média – mesmo em eventos ao vivo.

O Whisper, desenvolvido pela OpenAI, é um modelo de reconhecimento de fala para fins gerais, treinado num conjunto de dados de áudio grande e diversificado. Suporta transcrição multilingue, tradução de fala e identificação de idioma. O modelo está disponível em seis tamanhos diferentes, cada um oferecendo um compromisso entre velocidade e precisão.

Com o Whisper, os utilizadores do FFmpeg podem produzir transcrições em múltiplos formatos, incluindo texto, ficheiros de legendas SRT ou JSON. O filtro também permite aos utilizadores equilibrar a precisão em relação ao desempenho e até suporta aceleração de GPU para um processamento mais rápido.

Os programadores do FFmpeg sempre priorizaram a velocidade e o desempenho nas tarefas de processamento de média. A equipa é conhecida pelo uso de código assembler escrito à mão e pelo processamento paralelo baseado em vectores quando usado com chips mais modernos. O processamento de áudio parece seguir a mesma filosofia de alto desempenho.

O filtro Whisper introduz capacidades integradas de reconhecimento e transcrição de fala, permitindo aos utilizadores evitar depender de serviços externos ou software adicional para obter resultados semelhantes. Esta funcionalidade será particularmente útil para criadores de conteúdos, streamers e profissionais que precisam de lidar com tarefas repetitivas de arquivo.

- Publicidade -

O filtro é especialmente significativo porque é o primeiro modelo de IA alguma vez integrado no FFmpeg, marcando o que muitos vêem como um precedente importante. Este passo pode abrir caminho para mais funcionalidades impulsionadas por IA, mesmo que o FFmpeg mantenha o foco principal na velocidade de processamento e transcodificação de média.

O FFmpeg continua a ser um dos mais importantes frameworks de multimédia, oferecendo bibliotecas e ferramentas para manipular vídeo, áudio e outros formatos de média. Suporta uma vasta gama de padrões abertos e fornece inúmeros filtros para transformar ou converter streams. Muitas grandes plataformas e organizações dependem do FFmpeg para transcodificação, incluindo o YouTube, o Google Chrome, a versão Linux do Firefox e outros.

- Publicidade -
Etiquetas:FFmpegOpenAI
Ad image
Apoio
Ad image Ad image

Também lhe pode interessar

Mico-1
Inteligência ArtificialNotícias

Microsoft ressuscita a ideia do Clippy com o Mico, a nova cara do Copilot

Tempo de leitura: 7 min
©Baseus
MultimédiaNotícias

Baseus lança novos Earbuds Bass BP1 Pro com ANC: custam menos de trinta euros

Tempo de leitura: 1 min
©Watt a Lot
InovaçãoNotícias

Uma sociedade onde se pode fazer trocas directas de energia via blockchain? É a ideia da Nova IMS

Tempo de leitura: 2 min
©Leica | M EV 1
MultimédiaNotícias

Esta máquina fotográfica Leica da série M é a primeira a ter um um visor electrónico

Tempo de leitura: 1 min
© 2023 Fidemo Sociedade de Media
Gerir a sua privacidade

Para fornecer as melhores experiências, nós e os nossos parceiros usamos tecnologias como cookies para armazenar e/ou aceder a informações do dispositivo. O consentimento para essas tecnologias permitirá que nós e os nossos parceiros processemos dados pessoais, como comportamento de navegação ou IDs exclusivos neste site e mostrar anúncios (não) personalizados. Não consentir ou retirar o consentimento pode afetar adversamente certos recursos e funções.

Clique abaixo para consentir com o acima ou fazer escolhas granulares. As suas escolhas serão aplicadas apenas a este site. Pode alterar suas configurações a qualquer momento, incluindo a retirada de seu consentimento, usando os botões de alternância na Política de Cookies ou clicando no botão de consentimento para gerir na parte inferior do ecrã.

Funcional Sempre ativo
O armazenamento ou acesso técnico é estritamente necessário para o fim legítimo de permitir a utilização de um determinado serviço expressamente solicitado pelo assinante ou utilizador, ou para o fim exclusivo de efetuar a transmissão de uma comunicação numa rede de comunicações eletrónicas.
Preferências
O armazenamento ou acesso técnico é necessário para o propósito legítimo de armazenamento de preferências não solicitadas pelo assinante ou utilizador.
Estatísticas
O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos. O armazenamento técnico ou acesso que é usado exclusivamente para fins estatísticos anónimos. Sem uma intimação, conformidade voluntária por parte do seu Fornecedor de Serviços de Internet ou registos adicionais de terceiros, as informações armazenadas ou recuperadas apenas para esse fim geralmente não podem ser usadas para identificá-lo.
Marketing
O armazenamento ou acesso técnico é necessário para criar perfis de utilizador para enviar publicidade ou para rastrear o utilizador num site ou em vários sites para fins de marketing semelhantes.
Estatísticas

Marketing

Recursos
Sempre ativo

Sempre ativo
  • Gerir opções
  • Gerir serviços
  • Gerir {vendor_count} fornecedores
  • Leia mais sobre esses propósitos
Gerir opções
  • {title}
  • {title}
  • {title}