Qualquer pessoa que tenha tentado o Google Fotos concordará que esse serviço gratuito de armazenamento e gerenciamento de fotos do Google é inteligente. Embala em vários recursos inteligentes, como pesquisa avançada, capacidade de categorizar suas fotos por locais e datas, criar automaticamente álbuns e vídeos com base em semelhanças e orientá-lo na memória mostrando fotos do mesmo dia há vários anos. Há muitas coisas que o Google Photos pode fazer que há vários anos seriam impossíveis. O Google Fotos é um dos muitos serviços "inteligentes" do Google que usa uma tecnologia de aprendizado de máquina chamada TensorFlow. A palavra aprendizagem indica que a tecnologia ficará mais inteligente com o passar do tempo até o ponto que nosso conhecimento atual não pode imaginar. Mas o que é o TensorFlow? Como uma máquina pode aprender? O que você pode fazer com isso? Vamos descobrir.
O que é o TensorFlow?
O TensorFlow é o poderoso software de inteligência artificial do Google, de código aberto, que alimenta muitos serviços e iniciativas do Google. É a segunda geração de um sistema para implementações de aprendizado de máquina em larga escala, construído pela equipe do Google Brain. Esta biblioteca de algoritmos consegue o DistBelief - a primeira geração.
A tecnologia representa computação como gráficos de fluxo de dados com estado. O que torna o TensorFlow único é sua capacidade de modelar cálculos em uma vasta gama de hardware, desde dispositivos móveis no nível do consumidor até servidores multi-GPU de classe mundial. Ele pode ser executado em diferentes GPUs e CPUs e promete a escalabilidade do aprendizado de máquina entre os vários dispositivos e dispositivos sem ter que alterar uma quantidade significativa de código.
O TensorFlow se originou da necessidade do Google de instruir um sistema de computador a imitar como um cérebro humano funciona no aprendizado e no raciocínio. O sistema, conhecido como redes neurais, deve ser capaz de executar matrizes de dados multidimensionais, chamadas de “tensores”. O objetivo final é treinar as redes neurais para detectar e decifrar padrões e correlações.
Em novembro de 2015, o Google tornou essa tecnologia de código aberto e permitiu que ela fosse adotada em todos os tipos de produtos e pesquisas. Qualquer pessoa, incluindo pesquisadores, engenheiros e entusiastas, pode ajudar a acelerar o crescimento do aprendizado de máquina e levá-lo a um nível mais alto em menos tempo.
Este movimento acabou por ser o caminho certo, porque há tantas contribuições dos desenvolvedores independentes para TensorFlow que ultrapassam em muito as contribuições do Google. A Wikipedia menciona que “existem 1500 repositórios no GitHub que mencionam o TensorFlow, dos quais 5 são do Google.” Dito isto, uma das discussões no Quora suspeita que o código aberto de código aberto é a versão “limpa” do um que o Google usa em seus serviços.
Como o TenserFlow funciona?
Usando a linguagem humana normal simples e uma simplificação pesada, podemos ver um lado do TensorFlow como uma tecnologia avançada de filtragem autônoma. Na sua essência, a tecnologia é uma enorme biblioteca de software de aprendizado de máquina. Ele usa o banco de dados para ajudá-lo a "tomar decisões".
Por exemplo, alguém envia uma foto para o Google Fotos. A tecnologia irá comparar todos os detalhes da imagem ao seu banco de dados e decidir se é uma imagem de um animal ou humano. Então, se é um ser humano, ele tentará determinar o sexo, a idade de quem a pessoa é. O mesmo processo é repetido para outros objetos na foto.
Ele também usa dados do usuário, como a identidade da pessoa na foto e o local onde a foto foi tirada, para aprimorar sua biblioteca para que ela possa oferecer melhores resultados no futuro - tanto para o indivíduo que enviou a foto quanto para todos outro. Daí o termo “aprender”. Mas não se resume apenas em conhecer e aprender dados de fotos. Há tanto que a tecnologia pode fazer com informações de uma foto. Por exemplo, pode agrupar fotos com detalhes semelhantes, como a mesma pessoa, o mesmo local, a mesma data; veja o padrão de rostos para determinar a família e os amigos a que a pessoa pertence e use as informações para criar vídeos de férias em família ou animações de fotos contínuas.
Isso apenas arranha a superfície de como o TensorFlow funciona, mas espero que ele possa lhe dar uma visão geral da tecnologia. Além disso, usar apenas um exemplo não faz justiça ao que é capaz.
E para todos os entusiastas da Inteligência Artificial, vale a pena mencionar que o Google já criou uma tecnologia de chip de computador otimizada para aprendizado de máquina e integrando o TensorFlow a ela. É chamado chip ASIC da Unidade de Processamento Tensor (TPU) .
Aqueles que querem aprender mais sobre o TensorFlow podem visitar sua página de tutorial.
Aplicações do TensorFlow
Estamos em um estágio inicial da tecnologia de aprendizado de máquina, então ninguém sabe para onde isso nos levará. Mas há alguns aplicativos iniciais que podem nos dar uma olhada no futuro. Como se origina do Google, é óbvio que o Google usa a tecnologia para muitos de seus serviços.
Mais sobre análise de imagens
Discutimos o exemplo do uso da tecnologia para análise de imagens no Google Fotos. Mas o aplicativo de análise de imagens também é usado no recurso Street View do Google Maps. Por exemplo, o TensorFlow é usado para conectar a imagem com as coordenadas do mapa e para borrar automaticamente o número da placa de qualquer carro que esteja incluído acidentalmente na imagem.
Reconhecimento de fala
O Google também está usando o TensorFlow para seu software de reconhecimento de voz de assistente de voz. A tecnologia que permite que os usuários falem instruções não é nova, mas incluir a biblioteca do TensorFlow na mixagem pode aumentar o nível do recurso. Atualmente, a tecnologia de reconhecimento de fala reconhece mais de 80 idiomas e variantes.
Tradução Dinâmica
Outro exemplo da parte de “aprendizado” da tecnologia de aprendizado de máquina é o recurso de tradução do Google. O Google permite que seus usuários adicionem novos vocabulários e corrijam os erros no Google Tradutor. Os dados sempre crescentes podem ser usados para detectar automaticamente o idioma de entrada que outros usuários desejam traduzir. Se a máquina cometer erros no processo de detecção de idioma, os usuários poderão corrigi-los. E a máquina aprenderá com esses erros para melhorar seu desempenho futuro. E o ciclo continua.
Alpha Go
Um exemplo divertido do uso do TensorFlow é o Alpha Go. É uma aplicação que está programada para jogar Go . Para aqueles que não estão familiarizados com o Go, é um jogo de tabuleiro abstrato para dois jogadores originado na China há mais de cinco mil e quinhentos anos, e é o mais antigo jogo de tabuleiro que ainda hoje é jogado continuamente. Embora as regras sejam simples - cercar mais território do que o adversário, o jogo é incrivelmente complexo e, segundo a Wikipedia: “possui mais possibilidades do que o número total de átomos no universo visível”.
Então, é interessante o que uma tecnologia de máquina de aprendizagem pode fazer com as infinitas possibilidades. Em seus jogos contra Lee Sedol - o 18 vezes campeão mundial de Go, Alpha Go venceu 4 de 5 jogos e recebeu a classificação mais alta de Grão Mestre.
Projeto Magenta
Outra aplicação interessante do TensorFlow é o Projeto Magenta. É um projeto ambicioso para criar arte gerada por máquina . Um dos primeiros resultados tangíveis do experimento é a melodia do piano de 90 segundos. A longo prazo, o Google espera gerar arte gerada por máquinas mais avançada através de seu projeto Magenta e construir uma comunidade de artistas em torno dele.
Em fevereiro de 2016, o Google também realizou uma exposição de arte e um leilão em San Francisco, mostrando 29 gerados por computador - com uma pequena ajuda de peças de arte humanas. Seis dos maiores trabalhos foram vendidos por até US $ 8.000. O computador ainda pode ter um longo caminho a percorrer antes de imitar um artista de verdade, mas a quantidade de dinheiro que as pessoas estão dispostas a pagar pela arte nos mostra até onde a tecnologia foi.
Suporte para iOS
Embora já tenhamos visto os recursos do TenserFlow no Android, com sua versão mais recente, o TensorFlow finalmente adiciona suporte para dispositivos iOS. Como existem muitos aplicativos para dispositivos móveis disponíveis exclusivamente para iOS ou lançados primeiro no iOS, isso significa que podemos esperar que mais aplicativos para dispositivos móveis adotem o aprendizado de máquina no futuro próximo. O mesmo pode ser dito para as possibilidades de adoção e aplicação mais amplas do TensorFlow.
O futuro do TensorFlow
O que se pode fazer com uma máquina capaz de aprender e tomar sua própria decisão? Como uma pessoa que lida com mais de um idioma como parte da vida diária, a primeira coisa que me vem à mente é a tradução de idiomas. Não no nível palavra por palavra, mas mais no nível de texto mais longo, como documentos ou até mesmo livros. A tecnologia de tradução de hoje é limitada aos vocabulários. Você pode facilmente descobrir o que está “dormindo” em chinês e vice-versa, mas tente colocar um capítulo do Musashi de Eiji Yoshikawa em seu original em japonês e traduza o capítulo para o inglês. Você vai ver o que eu estou chegando.
Também é divertido ver o que o futuro da Inteligência Artificial pode fazer com a música. Embora ainda seja muito básico, o aplicativo Music Memo da Apple já pode oferecer acompanhamento automático de baixo e bateria ao seu canto gravado. Lembro-me de um episódio de um programa de TV SciFi em que um personagem do programa criou uma máquina que analisa todas as principais músicas nas paradas e é capaz de escrever seus próprios sucessos. Nós chegaremos lá?
E como o pensamento final, gostaria de mencionar o Sunspring . É um pequeno filme de ficção científica escrito inteiramente por um roteirista de IA que se chama Benjamin - que até compôs o interlúdio musical pop-song. O filme foi montado pelo diretor Oscar Sharp para o evento de 48 horas do Film Challenge of Sci-Fi em Londres.
Agora não consigo parar de pensar no Exterminador. Bem vindo ao futuro.
Crédito de imagem: Wikipedia, TechInsider, The Verge, Wall Street Journal