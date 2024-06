Relatórios de diferentes meios de comunicação informam que o Google sofreu um vazamento sensível de um documento que revela como funcionam os algoritmos de seu serviço.

O gigante de Mountain View é o principal motor de busca da Internet desde cerca de 2000. Primeiro estava integrado ao famoso serviço do Yahoo! e depois se tornou um serviço independente.

Nos seus sistemas, existem uma série de algoritmos que se combinam para oferecer o conteúdo mais preciso possível a um usuário que fez uma pesquisa na sua caixa de perguntas, que agora é a mesma das direções web.

Milhares (talvez milhões) de páginas da web dependem da capacidade de interpretar as modificações feitas pelo laboratório interno do Google, que atualiza essas fórmulas para evitar conteúdo de spam, desinformação e páginas maliciosas que são abundantes no vasto universo da Internet.

De acordo com um relatório do Bio Bio, a filtragem foi tornada pública (entre outras fontes) por Rand Fishkin, reconhecido por ser o co-fundador da ferramenta de inteligência SparkToro.

O especialista publica um artigo no qual afirma ter documentos oficiais do Google que contêm a interface de programação (API) do mecanismo de busca do gigante de Mountain View.

Os documentos vazados do Google

O meio citado anteriormente informa que uma das informações vazadas nos documentos é que "o Google parece ter diferentes maneiras de filtrar os cliques que não deseja registrar em seus sistemas de classificação e inclui apenas os que lhe interessam".

Além disso, revela que a empresa tem uma espécie de "listas de URLs principais" e que usa a quantidade de cliques nas páginas do Chrome para determinar quais são as mais populares.

Em terceiro lugar, os documentos sugerem que o Google introduz determinados domínios relacionados com "consultas muito controversas ou potencialmente perigosas" em pesquisas relacionadas a viagens e política. Isso oferece resultados que favorecem informações tendenciosas.

A filtragem também revelou que há evidências de que as pontuações e os dados gerados por alguns avaliadores da plataforma EWOK, que medem a qualidade dos sites, podem estar diretamente envolvidos com o sistema de busca do Google, “em vez de serem apenas um conjunto de treinamento para experimentos”.

Finalmente, parte destes documentos revisados concluem que o Google utiliza dados de cliques para determinar como ponderar os links nas classificações (de baixa, média ou alta qualidade). Dessa forma, se um deles não registra cliques, entra no índice de baixa qualidade e é ignorado. Por outro lado, se tem um grande volume de cliques de dispositivos verificáveis, é classificado como um link de alta qualidade.