Clique e assine a partir de 8,90/mês
Tecnologia

Smart speakers: vale a pena ter?

Elas estão chegando ao Brasil, cheias de funções interessantes. Mas fazem o que prometem? Passamos um mês testando duas: Amazon Echo Dot e Google Nest Mini.

Texto Bruno Garattoni e Rafael Battaglia  Ilustração Yan Blanco   Design Yasmin Ayumi   

“Você está sendo hackeada.” Foi o que a americana Danielle ouviu ao atender o telefone. Ela não reconheceu a voz do outro lado, que disse algo ainda mais perturbador: “Desligue imediatamente todos os seus dispositivos Alexa”. Danielle e o marido tinham instalado smart speakers (caixas de som inteligentes) da Amazon em vários cômodos e usavam sua assistente virtual, a Alexa, para tocar música e controlar a temperatura, as luzes e até as portas da casa. Danielle achou que fosse trote, e só acreditou quando a outra pessoa começou a tocar gravações de conversas dela com o marido, em casa. O casal havia sido grampeado pela Alexa, que enviou o áudio para uma terceira pessoa – por sorte, um colega do marido de Danielle.

A Amazon atribuiu o caso a um bug raro: Danielle ou o marido podem ter dito alguma palavra similar a “Alexa”, ativando a assistente, que então se confundiu com outras coisas que eles disseram – e entendeu que devia gravar tudo e encaminhar por email para um contato. A família nunca mais teve coragem de ligar as caixinhas. “Eu me senti invadida”, declarou Danielle (cujo sobrenome não foi revelado) à imprensa de Portland, onde ela mora, em 2018.

Quando a Amazon lançou a primeira smart speaker, em novembro de 2014, ninguém sabia se a novidade iria pegar. Afinal, com as gigantes da internet coletando cada vez mais informações sobre todo mundo, quem teria coragem de dar o próximo passo – e colocar, na própria casa, um gadget que fica com o microfone ligado 24 horas por dia? Resposta: muita gente. Segundo a pesquisa The Smart Audio Report, feita pela empresa Edison Research, 53 milhões de lares americanos têm pelo menos uma smart speaker, e há 118,5 milhões desses gadgets espalhados pelas casas dos EUA. Eles fazem sucesso porque são baratos, já que todo o processamento de dados é feito na “nuvem”, e prometem recursos avançados de inteligência artificial, assistentes virtuais que conversam com você e fazem uma série de coisas úteis e divertidas. Agora, as caixinhas finalmente estão à venda no Brasil: o Google lançou a sua, que se chama Nest Mini (R$ 349), e a Amazon trouxe três modelos da linha Echo, a partir de R$ 349.

Continua após a publicidade

Esses produtos demoraram para chegar aqui porque foi necessário adaptar seus sistemas de reconhecimento de voz e inteligência artificial para o nosso idioma. “Ao contrário do que se pensa, a gente não tem uma lista de frases em inglês, que são traduzidas. A estrutura lógica das línguas é diferente”, explica a linguista analítica Larissa Rinaldi, do Google. A ordem das palavras, as relações entre elas e a existência de gírias unilaterais complicam as coisas. “Coloca uma música, por exemplo. O equivalente seria put a song. Mas a gente tem diversas formas de dizer, como bota ou toca uma música, que não necessariamente têm correspondência no inglês”, diz Rinaldi.

Quando você dá uma ordem qualquer para a Nest Mini (“Ok Google, quais são meus compromissos de hoje?”, por exemplo), isso ativa cinco sistemas de processamento de dados: reconhecimento de fala, decomposição semântica, compreensão de intenção, geração de resposta e sintetização de voz, numa sequência de ações coreografada para levar 0,47 segundo – o tempo máximo entre a sua ordem e a resposta da Nest Mini. A adaptação desses softwares, que rodam nos servidores do Google, consumiu um ano de trabalho de quatro equipes de programadores e linguistas, que também tiveram a ajuda de robôs. “Nosso sistema tem dezenas de níveis de complexidade. Tem machine learning (técnica em que a máquina aprende sozinha, por tentativa e erro) e tem trabalho humano”, diz Larissa.

Chego mais perto e falo bem devagar e alto, com a irritação de quem não se fez compreender: “Ok Google, parar música”. A caixinha finalmente reage, mas não como esperado. Começa a tocar o axé “Parará”, hit do Carnaval baiano em 2011. Se fosse uma ironia, seria genial; mas foi só um bug. Aconteceram alguns durante os testes da Nest Mini. Quando eu disse “Ok Google, colocar café na minha lista de compras”, o Nest Mini começou a ler endereços de cafés – incluindo um a 7 km de casa. Fui ao supermercado e ao voltar me surpreendi ao encontrar a caixinha tocando música, coisa que ela tinha decidido fazer sozinha (desta vez era blues).

Nenhuma tecnologia é imune a erros – e quanto mais complexa se torna, mais propensa a falhas também. Mas tirando esses casos (isolados, e concentrados nos primeiros dias de uso), a Nest Mini funcionou bem. Quase sempre entende as ordens, mesmo se você falar baixo ou de longe, e reage da maneira correta. Dá para pedir músicas, playlists ou gêneros musicais no Spotify, ouvir rádios, ligar e desligar lâmpadas e eletrodomésticos e fazer várias outras coisas (veja quadro na página 46).

A função mais interessante é a rotina matinal, que unifica várias ações. Ao acordar (se você quiser, com a função despertador da própria Nest), basta dizer “Ok Google, bom dia”. A caixinha responde informando a previsão do tempo, quais compromissos você tem naquele dia, como está o trânsito até o trabalho e as principais notícias do dia.

Ela consegue fazer essas coisas porque é perfeitamente integrada a outros produtos e serviços do Google, como Agenda, Maps e até o Chromecast. Se você tiver um, pode dizer “Ok Google, ver The Crown na Netflix”, por exemplo, e ele liga a sua TV, abre o Netflix e começa a rodar o último episódio dessa série. Bem impressionante. Mas essas funções mais sofisticadas também têm seus poréns. Se você estiver ouvindo música na sala com a Nest Mini, por exemplo, e outra pessoa estiver vendo um vídeo na TV do quarto com o Chromecast, às vezes uma coisa interfere com a outra (você manda parar a música e o vídeo também é interrompido, o que não deveria acontecer). A caixinha pode controlar as luzes da sua casa – mas você terá de comprar lâmpadas Wi-Fi, que custam R$ 90 cada. Ela pode ligar e desligar os eletrodomésticos, mas é preciso plugar cada um deles a um adaptador de R$ 100; e o resultado pode não ser tão útil quanto parece. A Nest Mini é capaz de ligar automaticamente a sua cafeteira, por exemplo, enquanto você desperta e ouve a previsão do tempo, as notícias, etc. Legal. Mas você tem que se lembrar de abastecer a máquina com água e pó de café, na noite anterior; e lavar o coador depois de usá-la.

Continua após a publicidade

Prefere não cozinhar? Azar o seu. Não dá para pedir comida pela Nest Mini – que também não consegue chamar Uber. São funções bem úteis, cuja omissão é um pouco frustrante. Ainda mais porque a caixinha Echo Dot, da Amazon, promete as duas e milhares de outras: elas são chamadas de “skills”, e você baixa como se fossem aplicativos. Isso muda tudo; para melhor e para pior.

Vendeu mais do que qualquer outro dos 120 milhões de produtos  –somando livros, eletrônicos, roupas, ferramentas, utensílios de cozinha, etc. – que a Amazon atualmente oferece. Mesmo com a investida do Google, a Amazon ainda controla 69% do mercado de smart speakers, segundo dados da empresa de pesquisas CIRP. É assim por questões de marketing (a empresa foi a pioneira das caixinhas inteligentes, e oferece agressivamente a linha Echo às pessoas que entram em seu site para comprar outras coisas), mas também há um elemento tecnológico envolvido: sua assistente virtual segue uma filosofia radicalmente diferente da adotada pelo Google. Qualquer pessoa ou empresa pode criar novas habilidades (“skills”) para a Alexa e oferecê-las para download no site da Amazon. Nos EUA, elas já são mais de 70 mil. A habilidade 7-Minute Workoutpor exemplo, transforma a Alexa em personal trainer. A MySomm recomenda um vinho de acordo com o que você vai jantar, a What Beer? faz isso com cerveja, e a Anova Culinary controla uma panela de pressão elétrica (da marca Anova).

Também dá para pedir pizza, encher a banheira de casa ou checar as notas escolares do seu filho, só falando com a assistente da Amazon – em setembro, a empresa lançou uma plataforma para que as escolas dos EUA conectem seus servidores à Alexa. “A skill é como se fosse um aplicativo. A diferença é que o nível de conhecimento técnico e de desenvolvimento necessários é menor”, diz o executivo Ricardo Garrido, responsável pela implementação da Alexa em português. Daí o enorme número de habilidades criadas para a caixinha da Amazon. O Google enfatiza que a Nest Mini também é aberta (desenvolvedores de software podem criar ações para ela pelo site “Actions on Google”). Mas esse processo é mais controlado: as funções são testadas, aprovadas e ativadas pelos engenheiros do Google. Em tese, isso ajuda a garantir que de fato funcionem – mas diminui radicalmente sua quantidade.

Segundo a Amazon, há aproximadamente 500 skills da Alexa liberadas para download no Brasil (as demais só funcionam em inglês). Inclusive uma para pedir Uber, e outra do iFood. Imagine só, enquanto você se apronta para sair, simplesmente dizer: “Alexa, me chame um Uber”. Muito prático. Infelizmente, há um problema mortal: não dá para informar o destino da viagem. A ordem simplesmente chama um carro até a sua casa. Você fica às cegas, sem saber o preço ou quanto tempo a carona irá durar. E o recurso nem sempre funciona. No site da Amazon, há diversas reclamações de pessoas que não conseguiram vincular a Alexa a suas contas do Uber.

Se é difícil chamar um carro, então melhor ficar em casa e pedir um delivery, certo? Mais ou menos. A Alexa até funciona com um serviço do tipo, o iFood, mas você só pode repetir pedidos que já fez em outra data (por meio do app do iFood). É até compreensível que seja assim – talvez o sistema de reconhecimento de voz não esteja pronto para lidar com os intrincados menus dos restaurantes –, mas a função também deixa a desejar no básico. Para acioná-la, é preciso dizer “Alexa, abra o iFood”. Falar algo mais natural, como “Alexa, pede uma comida pra mim”, não funciona. Quando dissemos isso, a Alexa respondeu oferecendo o livro Comida de Bebê – Uma Introdução à Comida de Verdade, por R$ 38, que fez questão de adicionar ao carrinho. Obrigado, mas hoje não, Alexa.

Continua após a publicidade

Outro exemplo em que a filosofia da Amazon acaba não dando certo são os horários de cinema. Na Nest Mini, do Google, a consulta funciona perfeitamente. Ao dizer “Ok Google, que horas está passando Bacurau?”, por exemplo, a caixinha respondeu informando os horários das próximas sessões dos dois cinemas mais próximos. A Alexa não consegue fazer isso. Ela até tem uma skill do tipo, mas que só inclui os cinemas da rede Cinemark.

Depois de perguntar à Alexa se estava tudo bem (ao que ela respondeu positivamente), decidimos logo testar o seu carro-chefe: músicas. Quando você pede uma música, a Alexa puxa a brasa para a própria sardinha – e faz a pesquisa, primeiro, no serviço Amazon Music. É possível usar outros  serviços, como o Spotify ou o Deezer, mas isso precisa ser configurado no aplicativo da Alexa, que roda no seu celular. Na caixinha do Google, não é preciso fazer nenhum ajuste. Ela já vem de fábrica configurada para o Spotify.

Em tempo: para usar o Spotify, tanto na caixinha da Amazon quanto na do Google, o ideal é assinar a versão Premium desse serviço (R$ 16,90 mensais). Com o plano gratuito, você não consegue escolher a música que deseja ouvir (o serviço toca uma “rádio” baseada na faixa que você pediu). Já se você tiver a versão paga, pode pedir uma faixa específica, um álbum, playlist ou, ainda, escolher apenas um gênero. A caixinha da Amazon, assim como a do Google, entende o chamado “inglês brasileiro”: você pode falar os nomes das músicas numa boa, sem precisar forçar o sotaque. Mas a Alexa teve uma resposta estranha: ao pedir Sweet Child O’Mine, do Guns N’Roses, ela insistiu em tocar uma versão cover – sendo que a música original está disponível no Spotify. (Já se você assinar o Amazon Music, a música toca direto. Curioso.). O principal problema, por ora, está nos podcasts. O robô da Amazon ainda tem dificuldade em encontrá-los – o que também acontece com a Nest Mini.

Os demais recursos da Alexa são, de modo geral, eficientes. Ela é ótima como despertador, e sua rotina matinal (que informa a previsão do tempo, os compromissos do dia e lê algumas notícias) é tão boa quanto a da caixinha do Google. Já a lista de compras tem uma falha, que também afeta a Nest Mini: não dá para incluir vários itens de uma vez só. Se você falar “adicione alface, tomate, laranja, café, papel higiênico e sabão em pó à lista de compras”, por exemplo, a lista (que é enviada automaticamente para o seu smartphone) junta todos eles, embolados, num só item chamado “alface-tomate-laranja-café-papel higiênico-sabão”. Fica difícil de ler, e atrapalha bastante o uso da lista – pois você não consegue ir deletando os itens à medida que coloca os produtos no carrinho do supermercado. Pena.

Continua após a publicidade

A Alexa também pode acender lâmpadas, controlar câmeras, destrancar fechaduras, ligar a televisão… desde que você compre versões compatíveis de todas essas coisas, que quase ninguém tem. Talvez a verdadeira vocação da Echo Dot seja bem mais simples. Enquanto eu cozinhava, a Alexa tocou música, deu o resumo das notícias e avisou a hora de desligar o fogão, como eu havia pedido. Ela também é ótima como despertador. Não é nada de outro mundo; mas até que é útil.

Isso define bem as smart speakers. Elas servem para ouvir música, fazer mais algumas coisas simples e específicas, e só. Estão muito, mas muito aquém das expectativas futuristas que as pessoas alimentam. “Você lembra do filme Her?”, pergunta a linguista Larissa Rinaldi, do Google, mencionando a ficção científica de 2013 estrelada por Joaquim Phoenix e Scarlett Johansson – que faz a voz da assistente virtual Samantha, pela qual o protagonista se apaixona. “A ideia de você chegar naquele ponto de diálogo, ter a impressão de que [o assistente virtual] é uma pessoa… Isso nunca vai acontecer”, diz Rinaldi. Inclusive porque o Google não quer. O Google Duplex, um software que é capaz de telefonar para restaurantes e salões de beleza para marcar horário (e já está funcionando nos EUA), se identifica como robô no começo da conversa – mesmo conseguindo imitar bem, dentro daquele contexto, um ser humano.

As caixinhas inteligentes da Amazon e do Google não são o milagre tecnológico, nem a ameaça à privacidade, que aparentam ser. “Mas e os microfones delas, ligados 24 horas por dia?”, você deve estar se perguntando. A Amazon e o Google dizem que o microfone é programado para só detectar o comando-gatilho (respectivamente, “Alexa” e “Ok Google”), e ignorar todo o resto.

Que seja. O fato é que você já leva consigo, o tempo inteiro, um gadget que também tem microfone e pode gravar o que você diz, bem como vigiar a sua vida de várias outras maneiras, e nem por isso você dispensaria: o seu smartphone.

Continua após a publicidade

***

-
Yan Blanco/Superinteressante

Irmãs maiores

As caixas de som inteligentes também têm modelos turbinados, com mais alto-falantes e melhor qualidade de áudio.

1. Apple HomePod
US$ 300
Roda a assistente virtual Siri, a mesma do iPhone. Tem a melhor qualidade de áudio, com um woofer e sete tweeters, que distribuem o som em 360 graus. Também analisa a acústica do ambiente e se ajusta a ele. Sem previsão de chegada ao País.

2. Google Home
US$ 100
Versão maior da Nest Mini, com 14 cm de altura. Tem um alto-falante e dois radiadores passivos (eles aproveitam o som que o falante gera ao se mover para trás – e é desperdiçado nas caixas comuns). Ainda não tem data de lançamento no Brasil.

3. Amazon Echo
R$ 699
Tem exatamente a mesma inteligência artificial, e as mesmas funções, da Echo Dot. Mas é maior (é um cilindro que mede 15x10x10 cm) e tem dois alto-falantes: um woofer, que reproduz os sons graves, e um tweeter, para os agudos.