Não é só o Alexa. O Google Assistant também ouve todas as nossas conversas

Cristina De Luca

12/07/2019 11h25

Oito empresas contratadas pelo Google estão ouvindo secretamente nossas conversas, via Google Assistant, mesmo que não estejamos falando diretamente com o Google Home ou com nossos smartphones. É o que diz a reportagem da emissora belga VRT News, descrevendo o processo pelo qual as gravações do Google Home acabam sendo ouvidas por terceiros.

O mais assustador é que, aparentemente, não é preciso muito para iniciar uma gravação e clipes de áudio serem enviados para subcontratados, segundo a VRT. Com o auxílio de um denunciante, a emissora pôde ouvir alguns desses clipes e, posteriormente, ouviu o suficiente para discernir os endereços de vários holandeses e belgas usando o Google Home – apesar de alguns ainda não terem pronunciado as palavras " Ei Google", que supostamente é o gatilho de escuta do dispositivo.

O VRT News foi capaz de ouvir mais de mil gravações. A maioria dessas gravações foi feita conscientemente, mas o Google também ouve conversas que nunca deveriam ter sido gravadas, algumas das quais comntendo informações confidenciais.

A pessoa que vazou as gravações trabalhava como subcontratada do Google, transcrevendo os arquivos de áudio para uso subsequente na melhoria de seu reconhecimento de fala. Ela entrou em contato com a VRT depois de ler sobre a Amazon mantendo as gravações da Alexa indefinidamente.

Desde que o Google lançou seu dispositivo Google Home em 2016, milhões de pessoas instalaram um desses dispositivos de alto-falante inteligente em casa ou no escritório. Você pode fazer todos os tipos de perguntas triviais. Nem todos estão cientes do fato de que tudo o que dizem aos seus alto-falantes inteligentes do Google e ao Google Assistente está sendo gravado e armazenado. Mas isso é claramente expresso nos termos e condições do Google. E o que as pessoas certamente não sabem, simplesmente porque o Google não menciona isso em seus termos e condições, é que os funcionários do Google podem ouvir trechos dessas gravações.

Por que o Google está armazenando essas gravações e por que os funcionários estão ouvindo? Eles dizem que não estão interessados no que estamos dizendo, mas no jeito como estamos dizendo. O sistema de computador do Google consiste em algoritmos inteligentes de autoaprendizagem. E para entender as sutis diferenças e características de um determinado idioma, ela ainda precisa aprender muito.

A Wired analisou as transcrições dos arquivos compartilhados pela VRT. Em cerca de 150 das gravações, a emissora diz que o assistente parece ter sido ativado incorretamente. Quantas vezes isso já aconteceu com seus dispositivos, independente do assistente usado? Comigo, várias!

"O Google diz que transcreve uma fração de áudio do assistente para melhorar sua tecnologia automatizada de processamento de voz. No entanto, os dados confidenciais nas gravações e instâncias dos algoritmos do Google ouvindo de forma espontânea fazem com que algumas pessoas – incluindo o trabalhador que compartilhou o áudio com o VRT e alguns especialistas em privacidade – se sintam desconfortáveis", diz a reportagem da revista.

Questões de privacidade
"Saber que as pessoas que trabalham para o Google indiretamente estão ouvindo essas gravações gera dúvidas sobre privacidade. Para evitar que os trechos sejam automaticamente vinculados a um usuário, eles são desconectados das informações do usuário. Eles excluem o nome do usuário e o substituem por um número de série anônimo. Mas não é necessário um cientista de foguetes para recuperar a identidade de alguém; você simplesmente tem que ouvir atentamente o que está sendo dito", diz a VRT.

Michael Veale, pesquisador de política de tecnologia do Instituto Alan Turing, em Londres, disse à Wired que essas revelações não parecem atender aos requisitos do GDPR, mesmo para dados não considerados sensíveis. O grupo de reguladores nacionais de proteção de dados encarregado de aplicar o GDPR disse que as empresas devem ser transparentes quanto aos dados que coletam e como são processadas. "Você tem que ser muito específico sobre o que você está implementando e como", diz Veale. "Acho que o Google não fez isso porque seria assustador".

O porta-voz do Google disse que a empresa irá rever como poderia esclarecer aos usuários como os dados são usados para melhorar a tecnologia de fala da empresa.

A Amazon faz o mesmo
A Amazon também emprega milhares de pessoas para ouvir gravações de voz captadas pelos falantes da Echo, em um esforço para melhorar o software, de acordo com a Bloomberg.

A equipe de análise de voz do Alexa inclui tanto prestadores de serviço quanto funcionários da Amazon trabalhando em tempo integral em escritórios em todo o mundo, incluindo Boston, Índia, Romênia e Costa Rica. Cada revisor deve checar cerca de 1 mil arquivos de áudio em cada turno, dois dos funcionários disseram à Bloomberg. As gravações são transcritas, anotadas e realimentadas na esperança de melhorar o Alexa, o software que ativa os dispositivos Echo.

A terceirizada do Google entrevista pela VRT News diz analisar 1 mil arquivos de áudio por semana.

E o exército invisível da IA
Há um outro aspecto bastante preocupante em todos esses relatos, abordado recentemente pelo, The Guardian, em um artigo sobre as realidades da produção do Google Assistant. Por trás da "mágica" de sua capacidade de interpretar 26 idiomas está uma enorme equipe de linguistas, trabalhando como subcontratados, que devem rotular os dados de treinamento para que isso funcione. Eles ganham baixos salários e são rotineiramente forçados a trabalhar horas extras não pagas. Suas preocupações com as condições de trabalho foram repetidamente descartadas.

Karen Hao, cientista de dados e repórter da MIT Technology Review, ressalta que o artigo do Guardian é apenas um entre dezenas que começaram a abrir as cortinas de como funciona a indústria de Inteligência Artificial. Trabalhadores humanos não apenas rotulam os dados que fazem a IA funcionar. Às vezes, eles são a Inteligência Artificial. Por trás da IA de moderação de conteúdo do Facebook existem milhares de moderadores de conteúdo. Atrás da Amazon Alexa há uma equipe global de transcritores.

"A inteligência artificial não funciona com poeira mágica", diz Karen. "Ele depende de um exército de trabalhadores invisíveis que treinam algoritmos implacavelmente até que eles automatizem seus próprios trabalhos:", conclui.

Em seu novo livro "Ghost Work: Como impedir que o Vale do Silício construa uma nova subclasse global", a antropóloga Mary Gray e o cientista da computação Siddharth Suri argumentam que todos nós poderíamos ser parte desse exército em pouco tempo.

Entrevistada por Karen, Mary Gray faz o alerta: "A mudança dramática é que nós nunca tivemos indústrias tão completamente vendendo mão de obra contratada como automação – não apenas para tornar difícil para o consumidor ver a cadeia de suprimentos como podemos ver nos têxteis, nos alimentos e na agricultura, mas também para dizer que não há realmente uma pessoa trabalhando ali. Tenho calafrios só de pensar: se isso valer para todos os setores que efetivamente vendem serviços de informação, há um monte de pessoas tendo a sua participação na economia eliminada. O torna muito difícil para os trabalhadores se organizarem e recuperarem o poder".

Bem-vindo a 1984! George Orwell mirou no que viu e acertou no que não viu!

Segundo Mary Gray, com o trabalho fantasma nunca tivemos uma força de trabalho tão completamente distribuída globalmente. Isso cria um desafio diferente para os trabalhadores. Tanto para chamar a atenção para a questão entre os consumidores, como fez a subcontratada do Google que procurou a reportagem da VRT News, quanto para se organizarem em torno da reivindicação de direitos, como os anarquistas italianos da indústria gráfica de são Paulo, no século passado. "Indústrias sempre confiaram em trabalhadores contingentes. Mas agora nós construímos completamente uma economia em torno de depender de trabalhadores contingentes", diz a antropóloga.

No século 18, quando começou a industrialização na Europa, e diminuía o espaço cultivável, as pessoas migraram para as cidades em busca de trabalho em fábricas e fundições. Em 1850, descobertas como a máquina a vapor e o tear mecânico triplicaram a produção, mas muitos ingleses trabalhavam 14 horas por dia, seis dias por semana. Os salários mal davam para sobreviver. É sempre bom olhar pelo retrovisor, para tentar evitar repetir os mesmos erros.

Ao The Guardian, sete funcionários e ex-funcionários que trabalharam para a Pygmalion, uma das terceirizadas por trás do Google Assistant, descreveram suas condições de trabalho como "corrosivas", "altamente problemáticas" e "permissivas à exploração". Eles e seus colegas eram frequentemente pressionados a trabalhar horas extras sem pagamento, porque o Google confia em trabalhadores temporários e contratados, disseram. Embora haja entre 40 e 50 funcionários da Pygmalion em tempo integral, a equipe depende de outros 200 trabalhadores contratados, a maioria dos quais, segundo as fontes, altamente qualificados e cruciais para os negócios, embora não sejam qualificados para os benefícios e a segurança do trabalho em tempo integral.

Um deles chamou as condições de trabalho de "uma oficina de colarinho branco" e diz que se recusa a usar o Google Assistant "porque sabe como é feito". Em resposta, a empresa disse em abril que exigiria das terceirizadas benefícios aos trabalhadores, como dias de licença médica remunerada, licença parental remunerada e cobertura de saúde. Segundo os funcionários da Pygmalion que fizeram a denúncia, seus salários e benefícios de saúde eram muito inferiores aos de seus colegas em tempo integral.

Moral da história
Daqui para frente, a transparência sobre muitos dos aspectos do ecossistemas por trás do desenvolvimento e uso da Inteligência Artificial será essencial se as empresas de tecnologia _ e mesmo as empresas usuárias _ quiserem superar a percepção de que estão interessadas apenas na aparência de fazer o bem – às vezes chamado de teatro de ética.

Sobre a autora

Cristina De Luca é jornalista especializada em ambiente de produção multiplataforma. É diretora da ION 89, startup de mídia com foco em transformação digital e disrupção. Foi diretora da área de conteúdo do portal Terra; editora-executiva da área de conteúdo da Globo.com; e editora-executiva da unidade de Novos Meios da Infoglobo, responsável pela criação e implantação do Globo Online. Foi colunista de tecnologia da Rádio CBN e editor-at-large das publicações do grupo IDG no Brasil. Master em Marketing pela PUC do Rio de Janeiro, é ganhadora do Prêmio Comunique-se em 2005, 2010 e 2014 na categoria Jornalista de Tecnologia.

Sobre o blog

Este blog, cujo nome faz referência à porta do protocolo Telnet, que é o protocolo de comunicação por texto sem criptografia, traz as informações mais relevantes sobre a economia digital.

Cristina de Luca

Não é só o Alexa. O Google Assistant também ouve todas as nossas conversas

Sobre a autora

Sobre o blog

Ocorreu um erro ao carregar os comentários.

{{comments.total}} Comentário

{{comments.total}} Comentários

Seja o primeiro a comentar

Essa discussão está encerrada

Só assinantes do UOL podem comentar

Cristina de Luca

PL das Fake News não protege políticos, afirma o relator do projeto

Juiz nega liminar que suspenderia política de privacidade do WhatsApp

Como briga judicial pode suspender novos termos do WhatsApp no Brasil

Ao cobrar por acesso aos dados públicos, Governo impõe pedágio à inovação

Falta de transparência mancha ação das plataformas digitais no caso Trump

Você teme uso de seus dados pelo governo? OAB sim, e vê risco à democracia

Demissão no Google joga luz sobre a IA Ética

Regulação das plataformas, sim. Regulação da internet, não

ANPD: Uma autoridade de proteção de dados pessoais ou de vigilância?

Big Techs serão mais chamadas à responsabilidade nas eleições deste ano

Todas as empresas deverão ter um encarregado de proteção de dados pessoais

Cristina de Luca

Cristina de Luca

Colunistas do UOL

As mais lidas agora

De drogas a fisting: o dia que descobri ter usado errado emojis a vida toda

Dona do chatGPT teria usado secretamente vídeos do YouTube para treinar IA

LG lança nova linha de lava e seca com IA que reconhece diferentes tecidos

Sobre a autora

Sobre o blog

Ocorreu um erro ao carregar os comentários.

{{comments.total}} Comentário

{{comments.total}} Comentários

Seja o primeiro a comentar

Essa discussão está encerrada

PL das Fake News não protege políticos, afirma o relator do projeto

Juiz nega liminar que suspenderia política de privacidade do WhatsApp

Como briga judicial pode suspender novos termos do WhatsApp no Brasil

Ao cobrar por acesso aos dados públicos, Governo impõe pedágio à inovação

Falta de transparência mancha ação das plataformas digitais no caso Trump

Você teme uso de seus dados pelo governo? OAB sim, e vê risco à democracia

Demissão no Google joga luz sobre a IA Ética

Regulação das plataformas, sim. Regulação da internet, não

ANPD: Uma autoridade de proteção de dados pessoais ou de vigilância?

Big Techs serão mais chamadas à responsabilidade nas eleições deste ano

Todas as empresas deverão ter um encarregado de proteção de dados pessoais