O Google vem revelando novos detalhes sobre a criação de seu algoritmo DeepRank, que apresenta resultados de pesquisa mais relevantes ao compreender a linguagem como os humanos.
O DeepRank é amplamente discutido em um novo vídeo do Google sobre como funciona a pesquisa.
Entre outros aspectos da pesquisa, o vídeo do Google aborda o processo de desenvolvimento, teste e aprovação pelo qual cada atualização de algoritmo passa.
O DeepRank foi lançado em 2019 como BERT e tem esse nome devido aos métodos de aprendizado profundo usados pelo BERT e ao aspecto de classificação da pesquisa.
Pense no DeepRank como a integração do BERT na Pesquisa Google. Embora não seja tão simples quanto parece.
Neste artigo trago uma recapitulação do que é mostrado no novo vídeo do Google.
DeepRank / BERT
O DeepRank se baseia nos recursos de aprendizado de máquina e processamento de linguagem natural existentes do Google.
O processamento de linguagem natural permite que os pesquisadores insiram perguntas reais da mesma forma que fariam a um amigo em uma mensagem de texto, por exemplo.
O Google vem trabalhando no processamento de linguagem natural há quase 20 anos, começando primeiro com correções ortográficas e entendendo sinônimos.
Os recursos de aprendizado de máquina do Google estão em desenvolvimento há 10 anos.
O BERT aprimora ainda mais a compreensão dos algoritmos de pesquisa de consultas em linguagem natural.
A classificação da pesquisa percorreu um longo caminho nas últimas duas décadas, mas antes do BERT, os algoritmos não conseguiam entender as sutilezas da linguagem como os humanos.
DeepRank é a primeira vez que a Pesquisa Google tem um sinal que entende a relação entre termos humanos.
Em última análise, ele foi projetado para tornar a pesquisa mais intuitiva de usar e dar a impressão de que o Google entende seus usuários.
Desenvolvimento e teste de DeepRank
O DeepRank capta as sutilezas da linguagem que vêm naturalmente aos humanos, mas são difíceis de programar.
Os algoritmos de busca do Google costumavam ignorar palavras de parada e deixá-las fora da consulta.
Com o tempo, o Google aprendeu que essas palavras têm um papel importante em comunicar o que as pessoas realmente estão tentando dizer.
Com o DeepRank, as pessoas podem formular consultas de pesquisa de uma forma natural e não se deparar com o problema de as máquinas não entenderem as sutilezas.
No vídeo do Google, é mostrado um exemplo para a consulta: “Qual a temperatura que você deve pré-aquecer seu forno ao cozinhar peixes?”
Sem o DeepRank, os algoritmos do Google apresentam algumas informações úteis, mas também ficam confusos.
O DeepRank pode parecer uma solução simples, mas fazer com que o BERT funcione bem com a pesquisa não é fácil, diz o Google.
O DeepRank passou por meses de testes e você pode ver alguns deles em primeira mão no vídeo do Google.
Existem raras filmagens de bastidores de engenheiros da Pesquisa do Google analisando meticulosamente as consultas individuais para determinar se o DeepRank está ajudando ou prejudicando os resultados da pesquisa.
Qualquer mudança na pesquisa passa por muito escrutínio, não importa o quão grande ou pequena ela seja.
No entanto, os engenheiros do Google têm um tempo finito para trabalhar neste projeto.
O DeepRank, mesmo em testes, requer uma enorme capacidade de computação. Se a equipe que trabalha no DeepRank não progrediu o suficiente nos testes, os recursos de computação teriam sido alocados para outro projeto.
O vídeo tem mais cenas de bastidores de uma reunião onde o progresso no DeepRank é apresentado ao comitê de lançamento do Google.
Se você sempre quis ver o processo pelo qual os engenheiros da Pesquisa do Google passam para obter a aprovação de atualizações e alterações, esta pode ser a melhor aparência que tivemos até agora.
O comitê do Google aprovou o DeepRank para um eventual lançamento, e o sentimento de euforia dos engenheiros do Google era palpável.
Veja o vídeo completo abaixo. A parte sobre processamento de linguagem natural e DeepRank começa por volta dos 42 minutos.