Vazamentos do google revelam bastidores e contradições da busca
Como o Google faz exatamente para definir qual site aparece primeiro em um resultado na busca é um ...
Como o Google faz exatamente para definir qual site aparece primeiro em um resultado na busca é um segredo guardado há um quarto de século. Documentos internos da empresa vazados na semana passada, no entanto, jogaram luz sobre o que determina como os links aparecem em uma pesquisa " e mostram que a empresa faz aquilo que dizia não fazer.
O compilado de 2,5 mil documentos internos, que foram tornados públicos por dois profissionais de SEO (sigla para a otimização de mecanismos de buscas) dão detalhes dos dados coletados pelo Google para definir o ranqueamento de informações na busca. São mais de 14 mil fatores levados em consideração.
O material fornece pistas de como opera um dos algoritmos mais poderosos da internet, o que influencia o tráfego de audiência para fontes de informações e também a taxa de cliques que chega para as empresas " e que potencialmente é revertida em lucro e em vendas. São ferramentas que determinam a vida ou a morte de sites. E influenciam a vida de bilhões de pessoas que procuram informações no Google.
‘janela incompleta’
Um desses fatores é o uso de dados de navegação do Chrome para determinar o ranqueamento de sites. O Google sempre negou que usava esses dados para afinar a classificação de páginas no buscador. O vazamento, porém, mostrou que isso não é verdade.
A taxa de cliques (CTR, pela sigla em inglês) dos sites também pesa na ordem de exibição dos links, o que o Google negava.
" O que chama a atenção é que o Google sempre afirmou categoricamente que não utilizava dados do Chrome. Nós desconfiávamos porque frequentemente testamos os algoritmos " afirma Rosana Amaral, professora no curso de SEO da Escola Britânica de Artes Criativas e Tecnologia (EBAC).
Ela ressalta ainda que o mecanismo também privilegia sites grandes em detrimentos de sites pequenos.
O Google confirmou a autenticidade dos documentos vazados, mas ressaltou que era preciso ter cautela para não fazer "suposições imprecisas sobre a Busca com base em informações fora de contexto, desatualizadas ou incompletas."
Carlos Affonso, diretor do Instituto de Tecnologia e Sociedade (ITS), faz um paralelo com a fórmula secreta de um produto: os documentos trazem elementos dela, mas não revelam toda sua composição, nem o processo de produção:
" É importante não comprar a ideia de que a "verdade foi revelada", mas agora temos mais pistas. Abre uma janela, ainda incompleta, para entendermos como os sites são ranqueados. Se esses elementos forem verdadeiros, é importante a gente entender como eles podem favorecer determinados tipos de sites. E aí a principal preocupação é a desinformação.
Uma das preocupações das companhias é que, ao revelar as "fórmulas" dos algoritmos, explica Affonso, sites de desinformação usem isso para tirar vantagem desses mecanismos.
Isso é ainda mais preocupante depois que o Google passou a usar inteligência artificial (IA) nas buscas, oferecendo aos usuários um resumo do tema pesquisado e deixando os links em segundo plano. Sem os cliques que esse links na busca proporcionam, os sites não conseguem recursos e podem deixar de existir, o que levaria a um "deserto de informações" na internet, sem dados de fontes originais.
vozes de crianças
Em meios aos debates sobre as novas informações das buscas, o Google também confirmou a autenticidade de outro vazamento, revelado pelo site especializado em tecnologia 404 Media. Os documentos, de 2,7 mil páginas, revelaram milhares de incidentes relacionados à privacidade dos usuários entre 2013 e 2018, incluindo um episódio em que endereços residenciais de usuários do Waze foram tornados públicos, e outro em que a empresa armazenou e transcreveu placa de carros em fotos do Google Street View.
Os documentos também mostram que a companhia acidentalmente gravou vozes de mil crianças no YouTube Kids. Segundo o banco de dados, um filtro que deveria interromper gravações de áudio de crianças "não foi aplicado corretamente".
Os relatórios mostram que os incidentes foram reportados pelos funcionários do Google e depois corrigidos. Mas a empresa não divulgou isso na época.
Para Pedro Martins, coordenador da Data Privacy Brasil, as revelações abrem margem para questionamentos sobre o tratamento de dados dentro do Google:
" As informações podem gerar questionamentos sobre a legalidade das práticas da empresa, independentemente do erro. Ficou claro que foram erros que a empresa não queria cometer e que ela tentou resolver. Mas para além do erro, pode haver o questionamento se a prática é lícita, como transcrever informações do Street View.
Em nota, o Google afirmou que os relatórios obtidos pela 404 têm mais de seis anos e mostram como os funcionários da empresa rapidamente sinalizaram e consertaram os problemas.