Menu
Acessibilidade / Deficiência Auditiva / Entrevistas

10 perguntas para o inventor do Google Live Transcribe: Dimitri Kanevsky

dimitri kanevsky google live transcribe

Dimitri Kanevsky é o inventor do Live Transcribe, o app gratuito disponibilizado pelo Google que salva a vida de milhões de pessoas com deficiência auditiva todos os dias no mundo inteiro.

O Live Transcribe faz LEGENDAS em tempo real do que é dito em inúmeras línguas. Ele foi introduzido no Google Meet – o que significa que nos salva também em reuniões. Além disso, agora as reuniões em inglês podem ter suas legendas automaticamente traduzidas para português, francês, alemão e espanhol!

Ter legendas em tempo real à disposição em infinitas situações sempre foi o sonho de qualquer pessoa surda.

Esse também era o sonho do Dimitri, e foi assim que tudo começou para o Live Transcribe.

10 perguntas para Dimitri Kanevsky

Conte um pouco sobre a criação do Live Transcribe!

A criação do Live Transcribe foi resultado de inúmeros eventos, bem como dos esforços combinados do nosso time e várias pessoas no Google. Um desses eventos aconteceu há alguns anos, quando eu estava num restaurante com minha amiga e colega no Google, Sara Basson, e a família dela. Para poder conversar comigo, Sara começou a usar o ditado do Google Docs no seu telefone – ele usa reconhecimento de fala para transformar a fala em texto em tempo real. Essa ferramenta me ajudou a entender o que Sara e seus familiares diziam, mas ela não havia sido criada para ser usada em conversas, já que você deve clicar no microfone após cada pausa. Compartilhei a experiência com Chet Gnegy, outro colega do Google.

Chet sabia que eu costumava usar os serviços de estenotipistas profissionais, mas esse serviço pode custar caro e deve ser reservado com antecedência – o que significava que eu não poderia usá-lo em jantares ou conversas de corredor após reuniões. No final de semana seguinte, Chet criou um protótipo de app que poderia ser usado no Android, baseando-se na premissa do reconhecimento de voz. Ele me mostrou como o app funcionava, fazendo legendas instantâneas do que era dito ao meu redor. Eu adorei aquilo! Durante os meses seguintes, trabalhamos juntos para melhorar o protótipo e trabalhamos com muitos funcionários do Google que têm algum grau de surdez.

Conseguimos criar um time de pessoas, liderado pelo Chet, para construir o que hoje é conhecido como o Live Transcrive, lançado em 2019.

Você entende o impacto do Live Transcribe na vida de pessoas com deficiência auditiva?

Desde que foi lançado, vimos o impacto do Live Transcribe na vida de milhões de pessoas no mundo todo que têm deficiência auditiva. Durante a pandemia, vimos muitas pessoas que dependem da leitura labial passando a usar o Live Transcribe para ajudar na comunicação, já que as máscaras impedem de ver os lábios.

O app está disponível em mais de 80 línguas e pode ser usado na maioria dos devices Android, incluindo telefones mais baratos que estão disponíveis em outros mercados ao redor do mundo, o que permite que pessoas que vivem em países menos favorecidos também possam usá-lo.

Conte-nos sobre seu trabalho com reconhecimento de voz

Me formei em matemática e recebi meu PhD em matemática na Moscow State University. Durante 10 anos, trabalhei em vários centros matemáticos de prestígio ao redor do mundo.

Perdi toda a minha audição na infância e, em 1984, me mudei para os Estados Unidos. Naquela época, não existiam os serviços de estenotipia. Então, decidi começar a trabalhar com tecnologias de reconhecimento de voz para ajudar as pessoas que não escutam a se comunicarem.

Saí da academia em 1986 para trabalhar com reconhecimento de voz na IBM. Em 2014, fui para o Google trabalhar com o time de reconhecimento de voz. Passei esse tempo todo desenvolvendo algoritmos que podem aumentar a precisão, fazendo com que a tecnologia entenda melhor o que as pessoas dizem. Como parte disso, desenvolvi um novo algoritmo de reconhecimento de voz chamado Extended Baum-Welch. Ele se tornou popular e essencial para a criação de um vasto vocabulário de reconhecimento de voz que pudesse “compreender” conversas. Entretanto, por muitos anos a precisão dos sistemas de reconhecimento de voz não era boa o bastante para ser usada como uma ajuda na comunicação de pessoas que não escutam.

Quando comecei a trabalhar no Google, nosso time estava apto a usar dados de voz provenientes de vídeos do Youtube em combinação com legendas feitas manualmente, o que aumentava significativamente a precisão. Foi essa melhora na precisão que nos permitiu a começar a desenvolver aplicações práticas para ajudar as pessoas a se comunicarem- como o Live Transcribe e o Live Caption (que faz legendas de conteúdos de áudio e vídeo no Android e no Chrome.

dimitri kanevsky google transcribe

Dimitri Kanevsky recebendo em nome do Google o Eleanor Roosevelt Humanitarian Award for its achievements in accessibility

Por que vemos tão poucas pessoas com deficiência em cargos de liderança?

Há vários motivos para isso, incluindo o fato de que muitas pessoas com deficiência encontram desafios que são resultado da falta de acessibilidade que as pessoas sem deficiência não enfrentam.

Em muitos casos, pessoas com deficiência precisam ter habilidades superiores ou mais ferramentas, incluindo tecnologia, para superar esses obstáculos. Além disso, há o viés da sociedade que torna mais difícil para pessoas com deficiência progredirem na carreira. Acima de tudo, nossa sociedade precisa trabalhar em educar as pessoas a superarem seus vieses e serem mais inclusivas com pessoas com deficiência.

Quais desafios você enfrenta na sua vida diária por causa da surdez?

No passado, meu maior desafio girava em torno da comunicação com as pessoas. Não haviam opções convenientes e acessíveis para me ajudar na comunicação com os outros no dia a dia. Mas agora, com o Live Transcribe e outras tecnologias, esses desafios foram reduzidos de forma significativa.

Como você lidou com a sua deficiência auditiva na infância e como lida hoje?

Cresci na Russia e aprendi a ler lábios muito bem, então podia me comunicar facilmente com as pessoas. Agora posso usar as tecnologias de reconhecimento de voz para ajudar na comunicação com os outros.

Se pudesse voltar no tempo, teria aplicado o meu conhecimento para melhorar a precisão do reconhecimento de fala mais rápido.

Compartilhe algumas situações nas quais o Live Transcribe tem impacto na sua vida

Ele me ajuda em várias situações. Posso me comunicar com meus colegas, fazer ligações telefônicas, falar com minhas netas (que não falam russo), etc.

Há pouco estava fazendo um call no Zoom com matemáticos e usando o Live Transcribe para entender o que eles diziam. O app teve atualizações recentes, e a minha favorita é a notificação que faz vibrar o telefone quando alguém fala o meu nome.

Quais os seus conselhos para jovens surdos que estão lendo essa entrevista?

Você precisa acreditar que vai ser capaz de fazer o que quiser. Sua deficiência auditiva não é um obstáculo para alcançar os seus objetivos. Enquanto todos devemos trabalhar para mudar a atitude da sociedade perante as pessoas com deficiência, também devemos trabalhar melhorando as nossas próprias capacidades que irão nos ajudar a alcançar nossos objetivos de vida.

Ter uma atitude positiva e otimista, especialmente em face às dificuldades, é muito importante. É por isso que pessoas com deficiência são ótimas em resolver problemas, já que passam a vida enfrentando desafios e encontrando maneiras de superá-los.

Qual é o futuro da acessibilidade?

A tecnologia continuará tendo um impacto positivo na acessibilidade. Estamos sempre melhorando nossos recursos de acessibilidade para que mais pessoas se empoderem e possam explorar todo o seu potencial. Acreditamos em criar produtos realmente úteis e inclusivos para pessoas com deficiência.

Trabalhamos juntos para entender como usar esses dispositivos e ferramentas, os obstáculos que podem surgir e como é o dia a dia das pessoas com deficiência. O resultado disso é maior do que um novo app ou dispositivo: é um modo mais inclusivo para todas as pessoas explorarem o mundo.

Qual é o próximo passo do Live Transcribe?

Nosso time vai continuar trabalhando sempre para melhorá-lo e adicionar novas funcionalidades para melhorar a comunicação e tornar o app ainda mais útil.

GRUPO SURDOS QUE OUVEM: seja membro!

LEIA MAIS SOBRE APARELHO AUDITIVO

 

Grupo SURDOS QUE OUVEM

Você se sente sozinho? Solitário? Não tem com quem conversar sobre a sua surdez? Gostaria de tirar mil dúvidas sobre os seus aparelhos auditivos? Gostaria de conversar com pessoas que já usam implante coclear há bastante tempo? Precisa de indicação de otorrino especializado em surdez e fonoaudiólogo de confiança?

Somos 22.000 pessoas com algum grau de deficiência auditiva no Grupo SURDOS QUE OUVEM. Para ganhar acesso a ele, basta se tornar Apoiador Mensal do Crônicas da Surdez a partir de R$5.




NOSSAS REDES SOCIAIS

LIVROS CRÔNICAS DA SURDEZ

Neste link você encontra os seguintes livros:

  1. Crônicas da Surdez: Aparelhos Auditivos
  2. Crônicas da Surdez: Implante Coclear
  3. Saia do Armário da Surdez

RECEBA NOSSAS NOVIDADES NO SEU EMAIL

Clique aqui para receber.

LEIA MAIS SOBRE SURDEZ

About Author

Paula Pfeifer é uma surda que ouve com dois implantes cocleares. Ela é autora dos livros Crônicas da Surdez, Novas Crônicas da Surdez e Saia do Armário da Surdez.

1 Comment

  • Rafael
    18/01/2022 at 2:56 pm

    Olá,
    Soube que Live Transcribe do Google funcionaria muito melhor do que os aplicativos de terceiro.
    Alguém poderia confirmar se o aplicativo Live Transcribe do Google funciona com a transcrição instantânea na língua português?
    Tenho iphone e estou verificando a necessidade de mudança de sistema IOS (iphone) para android por conta da transcrição instantânea.
    Muito obrigado.

    Reply

Leave a Reply

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.

Copy Protected by Chetan's WP-Copyprotect.
Iniciar conversa
Grupo SURDOS QUE OUVEM
Grupo SURDOS QUE OUVEM