Interface de voz: tendência mundial de interação com as máquinas para os próximos anos

A interface de voz tem sido usada de forma cada vez mais expressiva em todas as formas de interação humanos-máquina. Esse movimento, plenamente identificável por meio das operações simples que os usuários executam nos seus smartphones, alto-falantes inteligentes, assistentes pessoais, smart TVs e uma série de outros dispositivos, não é mais um recurso difícil de ser utilizado ou acessado, tampouco encontra resistência dentre os utilizadores das mais diversas plataformas digitais. Um levantamento recente elaborado pela desenvolvedora de softwares Adobe apontou que apenas 16% de todos os entrevistados afirmam sentirem-se constrangidos na hora de “conversar” com algum equipamento diante de outras pessoas. A fala com esse tipo de aparelho tem ficado cada vez mais natural — para quem ouve e principalmente, para quem fala.

Esse comportamento naturalizou-se porque a capacidade de entendimento das máquinas e sistemas sobre a fala humana melhorou muito. O que antes exigia a preparação prévia dos computadores e o reconhecimento acontecia a partir de um conjunto limitado e pré-definido de sílabas ou palavras, transformou-se praticamente em uma identificação de linguagem corrente, graças ao processamento de linguagem natural. Isso abriu um verdadeiro leque de oportunidades no mercado, tanto para os consumidores quanto para as empresas.

No ambiente corporativo, a facilidade de interação entre as pessoas e os sistemas vai além das sensações satisfatórias causadas pela descoberta de uma forma extremamente eficiente de interação: investir nessa tecnologia garante o posicionamento atualizado, demonstra o engajamento da corporação com a satisfação do cliente e eleva os níveis de compliance a patamares muito superiores aos dos concorrentes. Além de ser útil no ambiente administrativo das companhias, a adoção deste tipo de recurso aproxima fornecedores e públicos e serve de parâmetro para o estabelecimento de novos canais de comunicação.

Especialistas de diversas áreas têm colocado a interface de voz como a primeira grande tendência dos próximos anos quando o assunto é o desenvolvimento de tecnologias e a sua aplicação nas esferas organizacionais e individuais. Mas como ela pode aperfeiçoar o relacionamento também entre as próprias pessoas e as empresas?

O futuro será ativado por uma interface de voz

As vendas de assistentes digitais para uso individual cresceram 103% em 2018 na comparação com o ano anterior. Para os estudiosos do comportamento do mercado, isso significa que a sociedade caminha para uma direção em que a necessidade de telas para a interação com os dispositivos deve cair vertiginosamente. Evidentemente, ainda haverá recursos e equipamentos que precisarão deste recurso para tornar mais eficiente a compreensão dos seus “sinais”, mas eles serão exceção.

Mais do que pedir para tocar uma música, acender as luzes de um cômodo, ligar o ar condicionado ou solicitar uma chamada telefônica enquanto está com as mãos ocupadas, esse usuário compra — e muito — usando apenas a fala como “forma de comando” com alguns equipamentos. O processo simplificado, além de agilizar a operação, também serve para aumentar a aquisição de produtos no momento em que o potencial consumidor está mais fortemente interessado. É quase como se esse tipo de estratégia valorizasse o impulso que levou o usuário a pesquisar sobre determinado item à venda, e “fisgá-lo” neste momento é fundamental para obter sucesso no negócio.

Neste cenário, a possibilidade é baseada na personalização cada vez maior da relação entre os dispositivos e o usuário. O mecanismo que ouve a voz do usuário é capaz de, além de reconhecer nuances sutis na fala para garantir a segurança do “relacionamento”, adequar completamente o ambiente digital para que ele seja mais favorável ao usuário/cliente e a experiência resulte em uma venda ou uma conversão.

Essa expectativa se confirma na última edição do relatório Internet Trends, elaborado e divulgado pela consultoria internacional Kleiner Perkins. A apuração feita pelos especialistas aponta que a tendência de que em 2020 metade de todas as pesquisas sejam feitas por voz se confirma. Um dos sinais que evidencia esse movimento em torno da utilização da internet ao redor do mundo é o que mostra que o crescimento acelerado nas vendas de assistentes virtuais. Hoje existem cerca de 30 milhões de aparelhos do tipo Amazon Echo nas casas das pessoas, um número expressivamente mais significativo que os cerca de 10 milhões que havia em 2016. Além disso, os aplicativos de mensagem mais populares do mundo têm sido atualizado nos últimos tempos no sentido de disponibilizar ou aperfeiçoar soluções de voz, dando ao usuário a possibilidade de se relacionar de forma mais naturalizada com eles e outras pessoas falando do que escrevendo.

Voice design

Mas todas essas previsões dependem, fundamentalmente, de um aspecto técnico importante: a qualidade da captação de áudio e a eficácia da conversão da voz em texto. O hardware das soluções precisa ser, ao mesmo tempo, pequeno e robusto: o primeiro atributo é relacionado ao tamanho físico; o segundo, à capacidade de “ouvir” as vozes com boa definição, independente do volume delas na hora em que o usuário esteja interagindo com os dispositivos.

A chamada economia da oralidade, idealizada pelo radialista e jornalista brasileiro, Jorge Cury Neto, classifica a utilização adequada da voz como uns dos principais fatores de sucesso do mundo corporativo; na mesma linha, o gramático inglês Henry Sweet dizia que “as palavras não são feitas de letras, mas de sons”. E o estereótipo ultrapassado de que a voz captada ou emitida por quaisquer dispositivos eletrônicos tende a ser robótica ou mecanizada já não é mais válido há muito tempo (talvez nunca o fora, inclusive).

Neste sentido, o investimento em uma interface de voz para uso no ambiente corporativo deve considerar:

  • recursos técnicos de alta qualidade: para atender às diferentes finalidades, é importante que o microfone utilizado para captar a voz seja suficientemente sensível e claro. Ele deve ter a capacidade de “ouvir” alguém falando do outro lado da sala sem que seja necessário aumentar muito o nível de entrada de áudio, mas ao mesmo tempo não pode registrar ruídos alheios ao conteúdo da conversa em excesso (batidas na mesa, barulhos provenientes do mobiliário, pessoas passando fora o espaço onde está instalado, etc);
  • identificação precisa: a voz que for captada precisa estar nítida para permitir a posterior identificação na hora da transcrição do áudio. Essa condição é importante, principalmente se a necessidade for a de gravar uma reunião no ambiente corporativo para fins documentais como a redação da ata. Já há soluções no mercado que identificam automaticamente cada um dos interlocutores por meio de canais de voz diferentes, fazendo com que seja possível identificar o que cada pessoa falou, em qual momento e localizar cada trecho no arquivo de áudio original;
  • utilização de motores avançados: baseados na computação em nuvem, eles conseguem processar o áudio em tempo real e redigir o que foi dito em um documento de texto, criando uma cópia altamente fiel do que foi captado durante uma sessão. Esses motores são particularmente úteis quando há a necessidade de transcrever grandes quantidades de áudio, já que quando é feito manualmente, esse processo costuma levar três vezes mais tempo que a duração da fala.

Esse tipo de solução auxilia sobremaneira as empresas que precisam ganhar produtividade, aumentar o ritmo de atendimento das demandas e modernizar a relação com os seus públicos interno e externo. Além da possibilidade de usar interfaces de voz para a transcrição de reuniões, elas podem se aproximar dos clientes e fornecedores por meio de uma dinâmica mais moderna, eficiente e precisa.


Para conhecer mais sobre como a tecnologia pode dar mais voz à sua empresa, acesse o nosso site e leia outros conteúdos sobre esse tema no nosso blog.


Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Chat On-line
Preencha as informações abaixo para iniciar o Chat