Somente para seus olhos
A realidade aumentada funde elementos virtuais com o ambiente real, ajustando a visão de mundo ao gosto do freguês.
Lizandra Magon de Almeida
Faltam poucos meses para suas próximas férias. Você começa a planejar uma viagem, pesquisa os destinos e decide conhecer a Itália, com tudo o que o país tem de história e de belezas naturais. Então, chega a hora de arrumar as malas. Na bagagem, você coloca os objetos de sempre – da escova de dente à máquina fotográfica. Os guias turísticos, prospectos e mapas, porém, dão lugar ao seu equipamento de realidade aumentada: um computador de mão, óculos especiais e fones de ouvido.
Com esse equipamento, a viagem de férias escapa dos limites da realidade. Enquanto passeia pelas ruas de Roma, você pode ver a cidade em todo o seu esplendor, como foi na época dos césares. Os monumentos, hoje em ruínas, são reconstruídos exatamente como eram. As imagens geradas pelos óculos, coloridas e tridimensionais, se sobrepõem aos prédios atuais e permitem que você conheça o lugar em dois momentos – no passado e no presente.
Enquanto você caminha, o computador de mão, algo como um palmtop, permite que você interaja com as imagens e acesse outras informações. Com uma caneta sensível, você seleciona o lugar que quer visitar e recebe, nos óculos, instruções sobre como chegar lá.
No hardware do equipamento estão armazenadas informações sobre os prédios antigos e atuais, sua importância histórica e as plantas internas, com a possibilidade de uma rápida navegação virtual antes de decidir se a visita é realmente interessante. Dentro do museu ou do lugar histórico, você garante que o “guia virtual”, que hoje já existe em CD, será executado em sua língua.
Com fome? Ao parar em frente ao restaurante, você também pode visualizar o cardápio, saber os preços e até conferir a opinião de um crítico gastronômico famoso sobre o estabelecimento. Da mesma forma, escolhe o hotel e acessa a previsão do tempo, uma vez que o equipamento tem uma conexão de internet rápida sem fio.
Esse tipo de experiência faz parte das pesquisas que vêm sendo feitas na área de realidade aumentada, uma variação de realidade virtual que suplementa o ambiente real com informações geradas por computador. A diferença básica é que na realidade virtual você está imerso em um ambiente criado por computador, enquanto na aumentada você está no mundo real, que é enriquecido por elementos virtuais. Com o auxílio de óculos especiais e outras interfaces, que permitem estabelecer interatividade com o equipamento, a realidade aumentada pretende fazer com que as pessoas tenham sempre à mão um dos mais valiosos bens atuais: a informação.
Por isso, o uso dessa tecnologia está sendo pesquisado para facilitar a vida de muitos profissionais que precisam de dados rápidos, precisos e imediatos, enquanto realizam outras atividades. É o caso de engenheiros de manutenção, que consertam equipamentos sofisticados em condições adversas e não têm a mínima condição de abrir um manual de instruções. Imagine, por exemplo, um astronauta, que precisa sair da nave e consertá-la no espaço. Não dá para consultar um livro, não é? Ou um grupo de bombeiros, que pode visualizar, nos óculos especiais, imagens da planta do prédio antes de entrar para apagar um incêndio.
A combinação de imagens reais e virtuais também é muito valiosa para os médicos, pois faz com que o cirurgião veja através do corpo do paciente antes de uma operação. As imagens do interior do corpo são produzidas por máquinas sofisticadas como a ressonância magnética ou a tomografia computadorizada, que criam projeções tridimensionais da parte do corpo examinada. Com a realidade aumentada, o médico sobrepõe essas imagens ao corpo do paciente na hora da cirurgia e determina exatamente o ponto em que deve intervir, tornando seu trabalho mais preciso.
Certamente essa tecnologia também vai evoluir para a área de entretenimento, que promete o lançamento de jogos fantásticos. Você pode atingir naves alienígenas virtuais no quintal da sua casa ou visualizá-las invadindo a vizinhança e também jogar com outras pessoas no mesmo ambiente. No Instituto de Tecnologia da Georgia, nos Estados Unidos, pesquisadores estão desenvolvendo um jogo chamado ARCraft, em referência ao WarCraft, no qual duas pessoas em locais diferentes jogam uma contra a outra, movendo-se sobre superfícies físicas em suas salas.
Documentário ao vivo
À primeira vista, a realidade aumentada pode soar como coisa de ficção científica. Mas muitas dessas aplicações já começam a se tornar viáveis e pesquisadores de todo o mundo estão empenhados em fazer com que nossa realidade comece a ser povoada com imagens de alta resolução. Steven Feiner, pesquisador da Universidade de Columbia, em Nova York, é um dos precursores da tecnologia de computação gráfica e de suas aplicações para a realidade aumentada.
Um de seus projetos em desenvolvimento é a criação de um “documentário ao vivo” sobre o campus da Universidade de Columbia, em parceria com o departamento de Jornalismo. Para isso, seus alunos criaram um sistema portátil que inclui os óculos especiais, fones de ouvido, um laptop de alta resolução e processador rápido, além de várias baterias. O computador e as baterias são colocados em uma mochila e o usuário carrega na mão o palmtop, que serve de interface interativa.
Assim que coloca os óculos, o visitante vê várias bandeirinhas coloridas posicionadas sobre alguns dos prédios do campus. Se clicar sobre as bandeirinhas, poderá saber que atração está ali. A interface de mão permite ainda selecionar um texto lido ou escrito sobre o local e sua história. À medida que o visitante vai andando, setas o mantêm no caminho certo e a proporção das bandeirinhas acompanha a posição do visitante.
O protótipo de Columbia foi construído com equipamentos comuns, à venda em qualquer loja de informática, o que resultou em um aparato de cerca de 11 kg e uma aparência um tanto insólita. Em uma mochila, nas costas do turista, está o laptop. Para precisar a localização da pessoa no campus foi utilizado um receptor de Global Positioning System (GPS). Esse sistema, o mesmo que dá a localização de barcos no oceano, determina a posição monitorando sinais de rádio a partir de um satélite. Por isso, o visitante ainda teve que carregar uma antena. “Definitivamente, esse não é um exemplo representativo do tamanho de um equipamento que achamos que as pessoas devem usar”, afirma Feiner. “Não acredito que sistemas com as características que estamos testando vão se tornar populares até que os computadores atinjam o tamanho de um MP3 player atual e os displays sejam óculos normais, em vez de terem essa aparência de óculos de esqui”, continua.
Ele acredita que, num primeiro momento, os sistemas de realidade aumentada serão usados em áreas específicas, nas quais os altos custos iniciais sejam justificados. Aplicações que já estão sendo estudadas incluem medicina, manutenção e consertos, e usos militares. Porém, com a redução do tamanho dos computadores e seu barateamento, e com a melhoria da qualidade dos displays e dos sistemas de rastreamento, a realidade aumentada deve se tornar parte integrante das interfaces comuns de computador. O que significa que será usada por todos.
Na vida cotidiana, o acréscimo de gráficos e áudio poderá ajudar a encontrar o caminho de um lugar desconhecido, permitirá dispor informações sobre nós mesmos que queremos que outros conheçam e permitirá ver uma estação de trem ou um restaurante à distância, como num jogo de SimCity, em que temos uma planta virtual perfeita da cidade e podemos navegar sobre ela ao mesmo tempo em que caminhamos ou dirigimos o carro. Com a integração de sistemas de transmissão de dados em tempo real, sem fio, podemos ainda conseguir informações como o horário dos trens (sabendo inclusive se vamos conseguir chegar a tempo à estação) ou saber qual é o prato do dia.
Para que tudo isso se torne parte do nosso dia-a-dia, como hoje já são os telefones celulares, alguns avanços tecnológicos importantes têm de acontecer. Em primeiro lugar, precisam ser solucionados os problemas de registro entre a imagem virtual e o mundo real. O pesquisador Blair McIntyre, do Instituto de Tecnologia da Georgia, afirma que, para um sistema de realidade aumentada funcionar corretamente, é necessário saber com exatidão onde estão a cabeça e os olhos do usuário em relação ao mundo real. Isso permite que a imagem gerada no display (que pode estar nos óculos ou num capacete) esteja na proporção correta e no lugar preciso dentro do seu campo de visão, mantendo a perspectiva conforme você movimenta a cabeça. Em geral, os sistemas atuais para mapeamento são muito caros e podem ser usados quase exclusivamente em ambientes fechados.
As experiências mais bem-sucedidas feitas até hoje foram em salas preparadas, com sensores magnéticos de posição e câmeras de vídeo. Esses sinais são processados por softwares específicos, que conseguem determinar a posição da pessoa com muita precisão, em tempo real, mesmo que ela faça movimentos rápidos com a cabeça. Para isso, é preciso também que a sala esteja “sensibilizada” – são feitas marcas em toda a sua extensão, que são interpretadas como pontos de referência pelo software.
Mas muito ainda precisa ser feito para que esses sistemas sejam viáveis, especialmente em ambientes externos. Atualmente, os pesquisadores estão usando sistemas de GPS, que são acessíveis e baratos, mas muito imprecisos. Em suas pesquisas, Steven Feiner tem arriscado combinações entre dois receptores de GPS, técnica chamada de GPS diferencial. O receptor móvel é monitorado por outro receptor fixo, ligado a um transmissor de rádio, aumentando a precisão. Já existem também os chamados GPS cinemáticos em tempo real, sistemas mais caros e sofisticados, que aumentam a precisão ao comparar a posição de vários receptores móveis e estáticos ao mesmo tempo.
O grande problema é que o GPS só funciona bem com céu claro e em ambientes abertos. O sinal do satélite é fraco, portanto um prédio ou mesmo um conjunto de árvores pode bloqueá-lo – isso inviabiliza seu uso em cidades como São Paulo, por exemplo. “Acredito que o GPS e outros rastreadores continuarão sendo úteis sobretudo para um ‘palpite inicial’ quanto à localização ou orientação da pessoa em um primeiro momento. Mas, com o tempo, até mesmo essas tecnologias devem evoluir e se tornar mais precisas. E também podem ser complementadas por outros rastreadores baseados na própria visão da pessoa, como pequenas câmeras portáteis”, diz Feiner.
Outro grande problema a ser enfrentado é a qualidade dos displays. Já existem óculos e capacetes, mas nenhum tem resolução suficiente para que as imagens geradas sejam perfeitamente fundidas com a realidade. Atualmente, há dois tipos mais comuns de display, o óptico e o de vídeo.
O sistema óptico consiste de um óculos com lentes espelhadas que tanto reflete quanto deixa passar a luz. A imagem gerada por computador é projetada sobre essa lente, o que permite que a pessoa observe o mundo real enquanto vê as imagens virtuais sobre a lente. Esse tipo de recurso é utilizado há bastante tempo por pilotos de caças e até por motoristas de carros de luxo. A vantagem, nesse caso, é que a pessoa consegue ver o mundo real em toda a sua extensão e resolução. Mas as imagens geradas não costumam ser opacas o suficiente para encobrir objetos sólidos, o que as torna menos convincentes. Além disso, o foco das imagens virtuais está nos óculos, enquanto os olhos humanos determinam o foco dos objetos de acordo com a distância. Isso significa que, mesmo com correções de imagem por software, uma imagem virtual que deveria estar sobre um objeto real pode não ter o mesmo foco.
Já o sistema por vídeo parte da tecnologia dos efeitos especiais. Os óculos são, na verdade, uma tela de cristal líquido (LCD) opaca. A imagem do ambiente é captada por uma câmera de vídeo e processada pelo computador já combinada à imagem virtual. Se a tela estiver bem posicionada em relação aos olhos do usuário, ele terá a impressão de que está vendo o mundo real. A vantagem, nesse caso, é que as imagens podem se sobrepor, por causa dos efeitos visuais da computação gráfica. Como os objetos reais e virtuais são vistos no mesmo plano, também não há problema de foco. As limitações existentes, porém, dizem respeito à qualidade das imagens. Especialmente os objetos que estiverem mais distantes tenderão a parecer uma imagem computadorizada sem nenhuma correspondência com a realidade. Qualquer imagem desse tipo perde de lavada para o olho humano, sem contar que o campo de visão humano real chega a 210º – e os óculos de LCD não passam de 60º de amplitude.
É mais ou menos como observar o mundo a partir do visor de uma câmera de vídeo.
Uma nova tecnologia que está sendo desenvolvida pela MicroVision, empresa americana especializada em equipamentos ópticos eletrônicos, promete resolver boa parte desses problemas. O sistema foi lançado comercialmente no início de 2002 e produz imagens monocromáticas diretamente na retina do observador. Em vez de usar óculos, o equipamento é preso acima dos olhos, a uma distância suficiente para que o sistema mapeie a retina e projete imagens sobre ela com raios laser. Essas imagens ainda não são tridimensionais nem coloridas, mas a tecnologia resolve vários problemas: o usuário vê o mundo real em sua plenitude e as imagens se mantêm na proporção e na distância corretas o tempo todo. No estágio atual, essa tecnologia é ideal para a projeção de gráficos e plantas, facilitando a vida de quem precisa consultar dados e números. A empresa já oferece um sistema de imagens em cores, de alta resolução.
Mas, por enquanto, sua aplicação está restrita a equipamentos militares, como a mira de caças americanos. Aparentemente, o sistema da MicroVision é o que tem mais chances de dar certo – embora visões mais futuristas prevejam implantes de chips que possam gerar as imagens direto no cérebro do usuário (leia mais na reportagem “A revolução biônica”, na página 48).
Para Marcelo Zuffo, diretor do Laboratório de Sistemas Integráveis (LSI) da Escola Politécnica da Universidade de São Paulo (USP), a capacidade de processamento dos computadores também precisa ser aumentada para que a tecnologia realmente funcione. A lentidão do processamento causa a latência, que é a demora na geração das imagens. “O cérebro humano consegue perceber um atraso de até 10 milissegundos. Essa diferença causa não só um problema de visão, mas também um fenômeno cognitivo, que pode gerar efeitos indesejáveis, como enjôos. Nossos sensores táteis e visuais não toleram esse atraso.” Outro problema a ser resolvido é a miniaturização dos equipamentos, para que o conjunto chegue ao tamanho de um MP3 player, que Feiner sugere. “Essa é uma necessidade importante, mas acredito que a indústria de computadores atual já esteja conseguindo resolver bem o problema”, comenta Feiner.
Em vários centros tecnológicos em todo o mundo pesquisadores tentam aperfeiçoar cada um desses aspectos. No Brasil, as pesquisas ainda estão engatinhando, mas alguns projetos pioneiros começam a ser desenvolvidos na área médica. No LSI, os pesquisadores estão criando um simulador de biópsia para tumores de pescoço. Segundo Marcelo Zuffo, essa parte do corpo é muito delicada, pois tem muitos nervos e artérias importantes. Por isso, os pesquisadores trabalham com modelos virtuais que poderão servir de guia para a intervenção.
As imagens do corpo humano para esse tipo de estudo podem ser obtidas no Centro de Informática Biomédica da Universidade Estadual de Campinas (Unicamp), que é o arquivo latino-americano das imagens do Visible Human Project, um banco de dados de imagens anatômicas de um ser humano completo. “Disponibilizamos essa base de dados para quem quiser realizar pesquisas”, explica Renato Sabbatini, coordenador do Núcleo de Informática Biomédica da Unicamp, “mas nós mesmos ainda não estamos realizando nenhum projeto. Quando a internet 2, de banda ultralarga, estiver disponível, essa biblioteca ficará acessível a muitos pesquisadores, que poderão usá-la em simuladores para aulas e treinamento”, acredita.
Internet turbinada
A chegada da internet 2, a rede de altíssimo desempenho voltada para a pesquisa científica, promete cenários ainda mais futuristas para a realidade aumentada. Mais que sobrepor imagens ao corpo do paciente, os especialistas prevêem que as próprias cirurgias poderão ser feitas virtualmente.
Uma experiência realizada ao mesmo tempo nos Estados Unidos e na Inglaterra, em outubro de 2002, permitiu que dois pesquisadores trocassem apertos de mão à distância. De cada lado da rede, havia um phantom, equipamento que recria a sensação de toque ao enviar impulsos de alta freqüência pela internet de alta velocidade. O phantom, que tem a forma de um cubo, gera estímulos que são interpretados pelo cérebro da mesma forma que os estímulos reais. Os pesquisadores puderam sentir a força do aperto, assim como a textura da mão. Esses experimentos dão margem para que os médicos possam, no futuro, manipular instrumentos cirúrgicos em tempo real, fazendo operações à distância.
Marcelo Zuffo afirma também que uma evolução natural da realidade aumentada é o projeto de telepresença, sistema de videoconferência em três dimensões que dá a sensação de teletransporte. Graças a um sofisticado sistema de câmeras, a imagem do conferencista é transmitida via internet e projetada na sala onde está a audiência. O conferencista também recebe as imagens da platéia, podendo movimentar-se ao seu redor. “Todas essas inovações têm um conceito geral, que é o da imersão. Os seres humanos estão imersos no mundo real e seus sensores naturais sofreram mutações para que o homem pudesse ficar imerso. Ultimamente o homem tem conseguido fazer mundos simulados nos quais ele pode estar totalmente imerso, como na realidade virtual, ou parcialmente, como na realidade aumentada.”
Visor óptico
O sistema óptico projeta gráficos de computador em monitores instalados em uma lente que permite ao usuário enxergar o ambiente à sua volta. Na tecnologia disponível, os gráficos não obscurecem totalmente os objetos que estão por trás deles.
1. Vista do mundo real da perspectiva de um jogador de videogame
2. Dinossauro criado pelo sistema de realidade aumentada
3. Imagens sobrepostas nas lentes dos óculos do jogador
Visor de vídeo
Nesse sistema, as imagens reais e as virtuais são fundidas em uma tela de vídeo. Os gráficos são totalmente opacos, porém o usuário enxerga o mundo como quem está operando uma câmera de vídeo. O campo de visão fica sensivelmente reduzido.
1. Visão do mundo real convertida em imagem de vídeo
2. Dinossauro virtual sobre fundo infinito
3. Fusão das imagens real e virtual no visor