INTERNACIONAL – Pouco tempo passa nos dias de hoje entre os chamados grandes avanços na inteligência artificial. No entanto, os pesquisadores não estão muito mais próximos do que eram há décadas para o grande objetivo: na verdade, replicar a inteligência humana. Essa é a revelação mais surpreendente de uma equipe de estudiosos eminentes que acabou de lançar o primeiro no que se destina a ser uma série de relatórios anuais sobre o estado da AI.
O relatório é uma ótima oportunidade para finalmente reconhecer que os métodos atuais que agora conhecemos como AI e aprendizagem profunda não se qualificam como “inteligentes”. Eles são baseados na “força bruta” dos computadores e limitados pela quantidade e qualidade dos dados de treinamento disponíveis. Muitos especialistas concordam.
O comitê de direção do “Índice de AI, novembro de 2017” inclui Eric Brynjolfsson, professor de Stanford, Yoav Shoham e do Instituto de Tecnologia de Massachusetts, um escritor eloquente que fez muito para promover a ortodoxia dos dias modernos que as máquinas logo deslocarão as pessoas em muitas profissões. A equipe por trás do esforço acompanhou a atividade em torno da AI nos últimos anos e encontrou milhares de artigos publicados (18.664 em 2016), centenas de empresas com capital de risco (743 em julho de 2017) e dezenas de milhares de postagens de trabalho. É um campo acadêmico vibrante e um mercado igualmente dinâmico (o número de empresas iniciantes nos EUA aumentou em 14 desde 2000).
Todo esse esforço concentrado não pode ajudar, mas produzir resultados. De acordo com o Índice AI, os melhores sistemas superaram o desempenho humano na detecção de imagens em 2014 e estão a caminho de resultados de 100%. As taxas de erro nas imagens de rotulagem (“este é um cão com uma bola de tênis”) caíram para menos de 2,5% em relação a 28,5% em 2010. As máquinas combinaram com seres humanos quando se trata de reconhecer o discurso em uma conversa telefônica e estão chegando perto de analisando a estrutura das frases, encontrando respostas a perguntas dentro de um documento e traduzindo notícias de alemão para inglês. Eles também aprenderam a vencer humanos no poker e Pac-Man. Mas, os autores do índice escreveram:
As tarefas para sistemas de AI são muitas vezes enquadradas em contextos estreitos, com o objetivo de progredir em um problema ou aplicativo específico. Enquanto as máquinas podem exibir desempenho estelar em uma determinada tarefa, o desempenho pode se degradar dramaticamente se a tarefa for modificada, mesmo que leve. Por exemplo, um humano que pode ler caracteres chineses provavelmente entenderia a fala chinesa, saberia alguma coisa sobre a cultura chinesa e até mesmo fazer boas recomendações nos restaurantes chineses. Em contraste, sistemas de IA diferentes são necessários para cada uma dessas tarefas.
Os sistemas de AI são pôneis de um único truque porque foram projetados para serem treinados em conjuntos de dados específicos, diversos e enormes. Pode-se argumentar que eles ainda existem dentro da “sala chinesa” do filósofo John Searle. Nessa experiência de pensamento, Searle, que não fala chinês, está sozinho em uma sala com um conjunto de instruções, em inglês, em correlação de conjuntos de caracteres chineses com outros conjuntos de caracteres chineses. Os falantes chineses são notas deslizantes em chinês sob a porta, e Searle empurra suas próprias anotações de volta, seguindo as instruções. Eles podem ser enganados ao pensar que suas respostas são inteligentes, mas esse não é realmente o caso. Searle desenvolveu o argumento “sala chinesa” – em que houve dúzias de respostas e tentativas de refutações – em 1980. Mas a AI moderna ainda está trabalhando de forma a que se encaixa na descrição.
A tradução automática é um exemplo. O Google Translate, que melhorou drasticamente desde que começou a usar redes neurais, treina as redes em bilhões de linhas de texto paralelo em diferentes idiomas, traduzidos por humanos. Onde existem muitas dessas linhas, o Google Translate faz OK – cerca de 80 por cento, bem como um especialista em humanos. Onde os dados são necessáriosg, produz resultados divertidos. Eu gosto de colocar em texto russo e dizer ao Google Translate que é Hmong. Os resultados, em inglês ou russo, serão muitas vezes surpreendentes – como os pronunciamentos encontrados dentro dos cookies da fortuna.
Eu duvido que isso seja acidental. Provavelmente não há muitas chamadas legítimas para traduções de Hmong, então os truqueiros ociosos devem ter ajudado a treinar a máquina de tradução do Google para produzir vários tipos de absurdos absurdos.
Os pesquisadores estão tentando superar o problema da insuficiência de dados. Dois artigos recentemente publicados mostram como a tradução automática pode funcionar com base em conjuntos de dados monolíngües, usando a probabilidade estatística de que algumas palavras sejam agrupadas. A qualidade não é tão boa quanto com dados de treinamento bilíngües, mas ainda não é uma absurda completa e é viável em uma pitada. No entanto, são meras muletas que não alteram a abordagem geral da força bruta.
A resolução de tarefas complexas exige cada vez mais energia e mais dados. Um computador superou os humanos em Othello no ano em que Sarle escreveu sobre a sala chinesa e o poker este ano – mas esse é um salto quantitativo e não qualitativo.
Este tipo de “inteligência artificial” continua a ser uma linha promissora de pesquisa e negócios, enquanto há quantidades crescentes de “dados importantes” para analisar. Kai-Fu Lee, da empresa chinesa de investimentos Sinovação Ventures, um dos especialistas que contribuíram com ensaios com o Índice AI 2017, escreveu que a China era competitiva contra os EUA na inteligência artificial porque gerava dados de dados:
Na China, as pessoas usam seus telefones celulares para pagar bens 50 vezes mais frequentemente do que os americanos. O volume de entrega de alimentos na China é 10 vezes maior do que o dos EUA. Tornou a empresa de movimentação de bicicleta Mobike 10 meses para passar de nada a 20 milhões de pedidos (ou passeios) por dia. Há mais de 20 milhões de passeios de bicicleta transmitindo o seu GPS e outras informações de sensores até o servidor, criando 20 terabytes de dados todos os dias. Da mesma forma, o operador de alta velocidade da China Didi é relatado para conectar seus dados com o controle de tráfego em algumas cidades-piloto. Todas essas coisas conectadas à Internet renderizarão dados que ajudem a tornar os produtos e aplicações existentes mais eficientes e permitir novas aplicações que nunca pensamos.
A dependência de dados, no entanto, não é excelente para o futuro desenvolvimento da AI. Uma reação contra a cobrança ilimitada de dados está acumulando força no Ocidente; os estados-nação estão colocando barreiras ao compartilhamento de dados; A armação de conjuntos de dados para produzir resultados intencionalmente defeituosos e respostas erradas para eles não está longe. E será muito mais difícil de detectar do que, por exemplo, a armação de redes sociais por guerreiros da informação russa tem sido.
Enquanto isso, o Índice de AI estima que a capacidade das máquinas modernas para o raciocínio de senso comum é muito inferior à de uma criança de cinco anos de idade. Praticamente não se faz qualquer progresso nessa área e é difícil quantificar.
Uma capacidade crescente de trituração de dados pode ser útil e perigosa para os seres humanos. No entanto, não é um trocador de jogos. E cabe a nós manter este ramo da ciência da computação em seu lugar, apenas dando-lhe tanto dados como estamos à vontade para entregar – e apenas usá-lo para as aplicações nas quais ele não pode produzir resultados perigosamente errado se alimentado muito lixo. A tecnologia em si não é o tipo que pode nos afastar dos controles – abordagens inteiramente novas seriam necessárias para criar essa ameaça.