Biometria Brasil

VERISPEAK SDK - VOZ

A tecnologia de identificação de voz VeriSpeak foi projetada para desenvolvedores e integradores de sistemas biométricos. O algoritmo de reconhecimento de oradores dependente do texto e garante a segurança do sistema verificando a autenticidade de voz e frase. Os templates de impressão de voz podem ser combinados nos modos “1-para-1” (verificação) e “1-para-muitos” (identificação).

Disponível como um kit de desenvolvimento de software que permite o desenvolvimento de aplicativos de reconhecimento de voz autônomos e baseados na Web nas plataformas Microsoft Windows, Linux, Mac OS X, iOS e Android.

 

CARACTERÍSTICAS E CAPACIDADES

  • O algoritmo dependente do texto impede o acesso não autorizado com uma voz de usuário secretamente gravada.
  • Autenticação de dois fatores, verificando a autenticação da frase-senha e biometria de voz.
  • Microfones e smartphones regulares são adequados para gravar vozes de usuários.
  • Disponível como um SDK multiplataforma que ofereça suporte a várias linguagens de programação.
  • Preços razoáveis, licenciamento flexível e suporte ao cliente gratuito.

O algoritmo VeriSpeak implementa o cadastro de voz e a verificação de impressões de voz usando tecnologias de processamento de som exclusivas:

  • Algoritmo dependente do texto. O reconhecimento do orador dependente do texto é baseado na mesma frase para o cadastro e verificação. O algoritmo VeriSpeak determina se uma amostra de voz corresponde ao template que foi extraído de uma frase específica. Durante o cadastro, uma ou mais frases são solicitadas à pessoa que está sendo cadastrada. Mais tarde, essa pessoa pode ser convidada a pronunciar uma frase específica para verificação. Este método garante proteção contra o uso de uma frase aleatória gravada dessa pessoa.
  • Autenticação de dois fatores com uma senha. O algoritmo de verificação de impressão de voz VeriSpeak pode ser configurado para funcionar em um cenário em que cada usuário grava uma frase exclusiva (como uma frase secreta ou uma resposta a uma "pergunta secreta" que é conhecida apenas pela pessoa que está sendo cadastrada). Mais tarde, uma pessoa é reconhecida por sua própria frase específica com um alto grau de precisão. A segurança geral do sistema aumenta à medida que a autenticidade da voz e a senha são verificadas.
  • Algoritmo independente do texto. O reconhecimento de oradores independente de palavras usa frases diferentes para inscrição e reconhecimento de usuários. Esse método é mais conveniente, pois não exige que cada usuário se lembre da frase-senha. Pode ser combinado com o algoritmo dependente do texto para executar pesquisas mais rápidas em texto com verificação de frases adicionais usando o algoritmo dependente de texto mais confiável.
  • Detecção automática de atividade de voz. VeriSpeak é capaz de detectar quando os usuários começam e terminam de falar.
  • Detecção de vida. Um sistema pode solicitar a cada usuário que cadastre um conjunto de frases únicas. Posteriormente, o usuário será solicitado a dizer uma frase específica do conjunto inscrito. Desta forma, o sistema pode garantir que uma pessoa viva esteja sendo verificada (em oposição a um impostor que usa uma gravação de voz).
  • Capacidade de identificação. As funções do VeriSpeak podem ser usadas em modos “1-para-1” (verificação) e “1-para-muitos” (identificação).
  • Múltiplas amostras da mesma frase. Um template pode armazenar vários cadastros de voz com a mesma frase para melhorar a confiabilidade do reconhecimento. Certas variações naturais de voz (ou seja, voz rouca) ou alterações de ambiente (isto é, escritório e exterior) podem ser armazenadas no mesmo template.
  • Combinações mescladas. Um sistema pode pedir aos usuários para pronunciarem várias frases específicas durante a verificação ou identificação do alto-falante e combinar cada amostra de áudio com os cadastros no banco de dados. O algoritmo VeriSpeak pode fundir os resultados correspondentes para cada frase em conjunto para melhorar a confiabilidade de verificação.
  •  

ESPECIFICAÇÕES TÉCNICAS

Uma taxa de amostragem mínima de 11025 Hz, com pelo menos 16 bits de profundidade, deve ser usada durante a gravação de voz.

São recomendadas amostras de voz de pelo menos 2 segundos de comprimento para garantir a qualidade do reconhecimento. Amostras de voz mais longas melhorarão o reconhecimento.

Veja também a lista de recomendações básicas para reconhecimento de oradores.

Todos os templates de voz devem ser carregados na RAM antes da identificação, portanto, o tamanho máximo do banco de dados do template de voz é limitado pela quantidade de RAM disponível.

O tamanho do template de impressão de voz tem dependência linear do comprimento da amostra de voz. Por exemplo, ao usar amostras de voz que são 2 vezes mais curtas, os valores do tamanho do template serão 2 vezes menores.

O mecanismo dependente do texto VeriSpeak 10.0 pode executar a verificação de templates em dois modos:

  • Frase fixa - cada usuário no banco de dados gravou a mesma frase. Este modo fornece uma verificação mais rápida, mas menor confiabilidade.
  • Frase única - cada usuário no banco de dados gravou uma frase exclusiva. Este modo proporciona uma maior confiabilidade, mas uma verificação mais lenta.

O algoritmo de extração e verificação do template biométrico VeriSpeak foi projetado para ser executado em processadores multi-core, permitindo alcançar o máximo de desempenho possível no hardware usado.

 

VeriSpeak 10.0 - Especificações do mecanismo de impressão em voz dependente do texto

 

Para plataforma Android

Para plataforma PC

Componentes de extração de template

Embedded
Voice
Extractor

Embedded
Voice
Client

Voice
Extractor

Voice
Client

Tempo de extração do template (segundos)

1.34 (1)

1.20 (1)

1.34 (2)

0.60 (2)

Componentes de verificação de template

Embedded Voice Matcher

Voice Matcher

Velocidade de verificação de template no modo frase fixa (impressão de voz por segundo)

100 (1)

8,000 (3)

Velocidade de verificação de template no modo frase única (impressão de voz por segundo)

20 (1)

1,700 (3)

Tamanho do cadastro de impressão de voz único em um template, com amostras de voz de 5 segundos usadas (bytes)

3,500 - 4,500

Notas:

(1) Requer para ser executado em dispositivos Android com base em pelo menos o sistema-em-chip Snapdragon S4 com o processador Krait 300 (4 núcleos, 1,51 GHz).

(2) Requer para ser executado em PC ou laptop com pelo menos o processador Intel Core 2 Q9400 quad-core (2.67 GHz) para alcançar o desempenho especificado.

(3) Requer para ser executado em PC ou laptop com pelo menos processador quad-core Intel Core i7-4771 (3.5 GHz) para alcançar o desempenho especificado.

 

REQUISITOS DE SISTEMA

Existem requisitos específicos para cada plataforma que executará aplicativos baseados em VeriSpeak.

Conteúdo da página:

  • Plataforma Microsoft Windows
  • Plataforma Android
  • Plataforma iOS
  • Plataforma Mac OS X
  • Plataforma Linux x86 / x86-64
  • Plataforma Linux ARM

 

REQUISITOS DA PLATAFORMA MICROSOFT WINDOWS

  • Microsoft Windows Vista/7/8/10, 32 bits ou 64 bits.
    • O Windows XP não é mais suportado nesta versão do SDK. Se o seu produto requer suporte para o Windows XP, você pode considerar a versão anterior do SDK. Entre em contato conosco para mais informações.
  • PC ou laptop com processadores compatíveis com x86 (32 bits) ou x86-64 (64 bits).
    • É recomendado um processador de 2 GHz ou melhor.
    • É necessário um suporte SSE2. Os processadores que não suportam SSE2 não podem executar o algoritmo VeriSpeak. Verifique se seu modelo de processador específico suporta o conjunto de instruções SSE2.
  • Pelo menos 128 MB de RAM livre devem estar disponíveis para o aplicativo. É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 1.000 templates (cada um contendo 1 cadastro de impressão de voz) exigem cerca de 5 MB de RAM adicional.
  • Espaço livre na unidade de disco rígido (HDD):
    • pelo menos 1 GB requerido para o desenvolvimento.
    • 100 MB necessários para a implantação de componentes VeriSpeak.
    • Sera necessário espaço adicional nesses casos:
      • VeriSpeak não exige que a amostra de voz original seja armazenada para a verificação; apenas os templates precisam ser armazenados. No entanto, o armazenamento de amostras de voz no disco rígido para o uso futuro potencial é recomendado.
      • Normalmente, um mecanismo de banco de dados é executado em um computador separado (servidor back-end). No entanto, o motor BD pode ser instalado no mesmo computador para aplicações autônomas. Neste caso, o espaço no HDD para armazenamento de templates deve estar disponível. Por exemplo, 10 000 templates (cada um contendo 1 cadastro de impressão de voz) armazenados usando um banco de dados relacional requerem cerca de 50 MB de espaço livre em HDD. Além disso, o próprio mecanismo de banco de dados requer espaço de HDD para execução. Consulte os requisitos de espaço na HDD dos provedores de mecanismo de banco de dados.
  • Microfone. Qualquer microfone suportado pelo sistema operacional pode ser usado.
  • Mecanismo de banco de dados ou conexão com ele. Os templates do VeriSpeak podem ser guardados em qualquer BD (incluindo arquivos) que suporte a economia de dados binários. VeriSpeak Extended SDK contém os seguintes módulos de suporte para Matching Server na plataforma Microsoft Windows:
    • Microsoft SQL Server;
    • MySQL;
    • Oráculo;
    • PostgreSQL;
    • SQLite.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor de verificação (incluído no VeriSpeak Extended SDK). A comunicação com o Servidor de verificação não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Microsoft .NET framework 4.5 ou posterior (para o uso de componentes .NET).
  • Um dos seguintes ambientes de desenvolvimento para desenvolvimento de aplicativos:
    • Microsoft Visual Studio 2012 ou posterior (para desenvolvimento de aplicativos em C / C ++, C #, Visual Basic .Net)
    • Sun Java 1.6 SDK ou posterior

 

REQUISITOS DA PLATAFORMA DE ANDROID

  • Um smartphone ou tablet que esteja executando o Android 4.4 (API nível 19) OS ou mais recente.
    • O nível 22 da API é o recomendado para a compilação do código.
    • Se você tiver um dispositivo personalizado baseado em Android ou placa de desenvolvimento, entre em contato conosco para descobrir se ele é suportado.
  • O processador baseado em ARM de 1,5 GHz é recomendado para processamento de impressão de voz no tempo especificado. Processos mais lentos também podem ser usados, mas o processamento de impressão em voz será demorado.
  • Pelo menos 20 MB de RAM livre devem estar disponíveis para o aplicativo. É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 1.000 templates (cada um contendo 1 cadastro de impressão de voz) exigem cerca de 5 MB de RAM adicional.
  • Espaço de armazenamento livre (flash incorporado ou cartão de memória externo):
    • 30 MB necessários para implantação de componentes de voz incorporados para cada aplicativo separado.
    • Espaço adicional sera necessário se um aplicativo precisar armazenar amostras de voz originais. VeriSpeak não exige que a amostra de voz original seja armazenada para a verificação; apenas os templates precisam ser armazenados.
  • Microfone embutido ou de fone de ouvido de qualquer smartphone ou tablet, suportado pelo sistema operacional Android.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor de verificação ( (incluído no SDK expandido da VeriSpeak). A comunicação com o servidor de verificação não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Requisitos do ambiente de desenvolvimento para PC:
    • Java SE JDK 6 (ou superior)
    • Eclipse Indigo (3.7) IDE
    • Ambiente de desenvolvimento Android (pelo menos o nível API 19 requerido)
    • Um dos seguintes sistemas de automação de compilação:
      • Apache Maven 3.1.x ou posterior
      • Gradle 2.10 ou mais recente
    • Conexão à Internet para ativar as licenças dos componentes VeriSpeak

 

REQUISITOS DA PLATAFORMA IOS

  • Um dos seguintes dispositivos, executando o iOS 8.0 ou posterior:
    • iPhone 5 ou mais recente.
    • iPad 2 ou mais recente, incluindo modelos iPad Mini e iPad Air.
    • iPod Touch 6th Generation ou iPod mais recente.
  • Pelo menos 20 MB de RAM livre devem estar disponíveis para o aplicativo. É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 1.000 modelos (cada um contendo 1 registro de impressão de voz) exigem cerca de 5 MB de RAM adicional.
  • Espaço de armazenamento livre (flash incorporado ou cartão de memória externo):
    • 30 MB necessários para implantação de componentes de voz incorporados para cada aplicativo separado.
    • Espaço adicional sera necessário se um aplicativo precisar armazenar amostras de voz originais. VeriSpeak não exige que as amostras de voz originais sejam armazenadas para a verificação; apenas os templates precisam ser armazenados.
  • Microfone embutido ou de fone de ouvido de qualquer smartphone ou tablet, suportado pelo iOS.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor de verificação ( (incluído no SDK expandido da VeriSpeak). A comunicação com o servidor de verificação não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Requisitos de ambiente de desenvolvimento:
    • um Mac com o Mac OS X 10.10.x ou mais recente.
    • Xcode 6.4 ou mais recente.

 

REQUISITOS DA PLATAFORMA MAC OS X

  • Um Mac com o Mac OS X 10.7.x ou mais recente. É recomendado um processador de 2 GHz ou melhor.
  • Pelo menos 128 MB de RAM livre devem estar disponíveis para o aplicativo.É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 1.000 modelos (cada um contendo 1 registro de impressão de voz) exigem cerca de 5 MB de RAM adicional.
  • Espaço livre na unidade de disco rígido (HDD):
    • pelo menos 1 GB requerido para o desenvolvimento.
    • 100 MB necessários para a implantação de componentes VeriSpeak.
    • Sera necessário espaço adicional nesses casos:
      • VeriSpeak não exige que a amostra de voz original seja armazenada para a verificação; apenas os templates precisam ser armazenados. No entanto, o armazenamento de amostra de voz no disco rígido para o uso futuro potencial é recomendado.
      • Normalmente, um mecanismo de banco de dados é executado em um computador separado (servidor back-end). No entanto, o motor BD pode ser instalado no mesmo computador para aplicações autônomas. Neste caso, o espaço no HDD para armazenamento de templates deve estar disponível. Por exemplo, 10 000 modelos (cada um com 1 registro de impressão de voz) armazenados usando um banco de dados relacional requerem cerca de 50 MB de espaço livre em disco rígido. Além disso, o próprio mecanismo de banco de dados requer espaço de HDD para execução. Consulte os requisitos de espaço na HDD dos provedores de mecanismo de banco de dados.
  • Microfone. Qualquer microfone suportado pelo sistema operacional pode ser usado.
  • Mecanismo de banco de dados ou conexão com ele. Os templates do VeriSpeak podem ser guardados em qualquer BD (incluindo arquivos) que suporte a economia de dados binários. O VeriSpeak Extended SDK  contém módulos de suporte SQLite para Matching Server na plataforma Mac OS X.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor correspondente (incluído no SDK expandido da VeriSpeak). A comunicação com o Servidor Matching não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Requisitos específicos para desenvolvimento de aplicativos:
    • XCode 4.3 ou mais recente
    • wxWidgets 3.0.0 ou mais recentes libs e pacotes de dev (para criar e executar amostras de SDK e aplicativos com base neles)
    • Qt 4.8 ou mais recentes libs, dev e qmake pacotes (para criar e executar amostras SDK e aplicativos com base neles)
    • GNU Make 3.81 ou posterior (para criar amostras e desenvolvimento de tutoriais)
    • Sun Java 1.6 SDK ou posterior

 

REQUISITOS DA PLATAFORMA LINUX X86 / X86-64

  • O kernel Linux 2.6 ou posterior (32 bits ou 64 bits) é necessário. O kernel do Linux 3.0 ou posterior é recomendado.
  • PC ou laptop com processadores compatíveis com x86 (32 bits) ou x86-64 (64 bits).
    • É recomendado um processador de 2 GHz ou melhor.
    • É necessário um suporte SSE2. Processadores que não suportam SSE2 não podem executar o algoritmo VeriLook. Verifique se seu modelo de processador específico suporta o conjunto de instruções SSE2.
  • Pelo menos 128 MB de RAM livre devem estar disponíveis para o aplicativo.É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 10 000 templates (cada um com 1 cadastro de impressão de voz) requerem cerca de 50 MB de RAM adicional.
  • Espaço livre na unidade de disco rígido (HDD):
    • pelo menos 1 GB requerido para o desenvolvimento.
    • 100 MB necessários para a implantação de componentes VeriSpeak.
    • Seria necessário espaço adicional nesses casos:
      • VeriSpeak não exige que a amostra de voz original seja armazenada para a verificação; apenas os templates precisam ser armazenados. No entanto, o armazenamento de amostra de voz no disco rígido para o uso futuro potencial é recomendado.
      • Normalmente, um mecanismo de banco de dados é executado em um computador separado (servidor back-end). No entanto, o motor BD pode ser instalado no mesmo computador para aplicações autônomas. Neste caso, o espaço no HDD para armazenamento de templates deve estar disponível. Por exemplo, 10 000 modelos (cada um com 1 registro de gravação de voz dentro) armazenados usando um banco de dados relacional requerem cerca de 50 MB de espaço livre em disco rígido. Além disso, o próprio mecanismo de banco de dados requer espaço de HDD para execução. Consulte os requisitos de espaço na HDD dos provedores de mecanismo de banco de dados.
  • Microfone. Qualquer microfone suportado pelo sistema operacional pode ser usado.
  • glibc 2.11.3 ou mais recente
  • libasound 1.0.x ou posterior (para captura de voz)
  • libgudev-1.0 164-3 ou mais recente (para uso de microfone)
  • Mecanismo de banco de dados ou conexão com ele. Os templates do VeriSpeak podem ser guardados em qualquer BD (incluindo arquivos) que suporte a economia de dados binários. VeriSpeak Extended SDK contém os seguintes módulos de suporte para Matching Server na plataforma Linux:
    • MySQL;
    • Oráculo;
    • PostgreSQL;
    • SQLite.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor correspondente (incluído no SDK expandido da VeriSpeak). A comunicação com o Servidor Matching não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Requisitos específicos para desenvolvimento de aplicativos:
    • wxWidgets 3.0.0 ou mais recentes libs e pacotes de dev (para criar e executar amostras de SDK e aplicativos com base neles)
    • Qt 4.8 ou mais recentes libs, dev e qmake pacotes (para criar e executar amostras SDK e aplicativos com base neles)
    • GCC-4.4.x ou mais recente
    • GNU Make 3.81 ou mais recente
    • Sun Java 1.6 SDK ou posterior
    • pkg-config-0.21 ou mais recente (opcional, apenas para compilação de módulos de suporte de banco de dados Matching Server)

 

REQUISITOS DA PLATAFORMA ARM LINUX

Recomendamos que entre em contato conosco e relate as especificações de seu dispositivo para descobrir se ele será adequado para executar aplicativos baseados em VeriSpeak.

Existe uma lista de requisitos comuns para a plataforma ARM Linux:

  • Um dispositivo com processador baseado em ARM, executando o kernel do Linux 3.2 ou posterior.
  • O processador baseado em ARM de 1,5 GHz é recomendado para processamento de impressão de voz no tempo especificado.
    • Arquitetura ARMHF (EABI 32-bit hard-float ARMv7) é necessária.
    • Os processadores de taxa de clock mais baixos também podem ser usados, mas o processamento de impressão de voz levará mais tempo.
  • Pelo menos 128 MB de RAM livre devem estar disponíveis para o aplicativo. É necessária RAM adicional para aplicativos que executem uma identificação de “1 para muitos”, pois todos os templates biométricos precisam ser armazenados na RAM para a verificação. Por exemplo, 1.000 templates (cada um contendo 1 cadastro de impressão de voz) exigem cerca de 5 MB de RAM adicional.
  • Espaço de armazenamento livre (flash incorporado ou cartão de memória externo):
    • 100 MB necessários para a implantação de componentes VeriSpeak.
    • Seria necessário espaço adicional nesses casos:
      • Um aplicativo precisa armazenar amostras de voz originais. Observe que o VeriSpeak não exige que a amostra de voz original seja armazenada para a verificação; apenas os templates precisam ser armazenados.
      • Normalmente, um mecanismo de banco de dados é executado em um computador separado (servidor back-end). No entanto, um mecanismo de banco de dados pode ser instalado no mesmo dispositivo para aplicativos independentes. Por exemplo, 1.000 modelos (cada um com 1 registro de gravação de voz) armazenados usando um banco de dados relacional requerem cerca de 5 MB de espaço de armazenamento livre.
    • O PostgreSQL, MySQL e SQLite são suportados no ARM-Linux. Consulte os requisitos de hardware dos provedores de mecanismo de banco de dados correspondentes.
  • Microfone. Qualquer microfone suportado pelo sistema operacional pode ser usado.
  • glibc 2.13 ou mais recente.
  • libasound 1.0.x ou posterior (para captura de voz)
  • libgudev-1.0 164-3 ou mais recente (para uso de microfone)
  • libstdc ++ - v3 4.7.2 ou mais recente.
  • Conexão de rede / LAN (TCP / IP) para aplicativos cliente / servidor. Além disso, a conexão de rede é necessária para usar o componente do servidor de verificação(incluído no SDK expandido da VeriSpeak). A comunicação com o servidor de verificação não é criptografada, portanto, se a comunicação deve ser protegida, é recomendável uma rede dedicada (não acessível fora do sistema) ou uma rede segura (como VPN, VPN deve ser configurada usando sistema operacional ou ferramentas de terceiros).
  • Requisitos específicos do ambiente de desenvolvimento:
    • GCC-4.4.x ou mais recente
    • GNU Make 3.81 ou mais recente
    • JDK 1.6 ou posterior

Nome Descrição Data Tamanho (KB)
VERISPEAK SDK RECONHECIMENTO DE ORADOR PARA APLICAÇÕES AUTÔNOMAS OU WEB 01/03/2018 992.590