2006-07-11

O Google não é um ser humano

Pessoal, por favor, não faz sentido fazer buscas no Google escrevendo frases gramaticalmente corretas ou com contexto subentendido. Parece besteira, mas toda santa vez que eu dou uma olhada no monitor de acessos a este site, vejo que ele foi encontrado através de buscas como estas (todas exemplos reais):

flagras de acidentes aéreos em vídeos
tradução da palavra thinker para português
fotos para plano de fundo do corinthians
achar ícone para colocar em meu monitor
quebra pau entre famosos
fotos de todas as capas da revista Sexy
desenhos para colocar no perfil do orkut
sempre que descer a página a layer fica no topo
posso sacar o meu FGTS para casar?
todos seus documentos perfeitamente organizados
pessoas que dizem como são em seus blogs
cursos de cozinheiro na suissa (sic)
gravar desenhos de DBZ
fotos de alimentos de origem mineral
como entrar na fase 6 do Super Mario 64
senhoras quarentona fotos (sic)
transa agressiva
saber quando uma pessoa está mentindo
estocada gostosa
modelo de carta de cobrança de dívida
manias engraçadas dos homens
senha para entrar no site da Playboy
Eu quero te ajudar, mas você tem que cooperar. Será que você não tem um mapa preu me achar?

Vamos pensar um pouco. Não adianta absolutamente nada entrar com frases completas contendo todos os artigos e advérbios. Não dão em coisa nenhuma buscas que exijam uma interpretação de contexto, coisa que os computadores ainda simplesmente não sabem fazer. Só diminuem as suas chances de sucesso colocar palavras que tenham pouca chance de estarem nas páginas da Web que contêm a informação desejada.
O certo é o seguinte: basta jogar as duas ou três palavras-chave essenciais, mais um ou outro operador lógico (explicado claramente no próprio site do Google) quando for o caso. Fim.

(Sei que daqui em diante vou receber ainda mais visitantes mediante buscas - estúpidas ou não - que incluam qualquer uma das palavras acima. Mas confesso que não acho nada ruim atrair dezenas de pessoas em busca por "Letícia Birkheuer", "Paola Oliveira" e "Fernanda Lima".)

7 comentários:

  1. Fora que "de" tem apenas 8 bilhões de ocorrências versus "of" que tem 21 bilhões. Antes o google informava que tal palavra ocorria com muita frequencia e que não vale mais a pena a busca.

    Não é mais assim.

    Embora eu seja um procurador correto, se eu quiser uma coisa específica procuro pela frase inteira (gramaticalmente correta).

    Um exemplo vem de vc, que postou uma música bosta, preu descobrir o autor eu copiei o trecho completo do seu blog e colei no google. Veio o autor imediatamente, coisa que talvez não seria tão preciso se eu procurasse somente as palavras chaves. Mesmo esquema com seus posts em chinês.

    Se eu puder divagar no google em busca de algo próximo atingiremos o ideal - e não o retalhado, que vc considera mais correto. "-disclaimer-" Sem ofensa "
    -/disclaimer-"

    ResponderExcluir
  2. Para os usuários conseguirem entender essa lógica eles tem que melhorar muito.

    Nem adianta tentar explicar. Infelizmente.

    ResponderExcluir
  3. caio, o tom do seu comentário revela uma má vontade totalmente desnecessária em relação ao que estou falando, que é o caso das buscas típicas que reproduzi no post.
    Uma busca por trecho de música, ou pela citação de frase de alguma celebridade, ou de uma fórmula matemática, OBVIAMENTE requer uma abordagem diferente. Portanto, você não consegue negar meu comentário do caso geral invocando uma exceção.
    Vê se escuta umas músicas menos bostas que as minhas e perde um pouco do mau humor antes de comentar aqui. Sem ofensa, claro!

    o'marin, estou certo de que algum dia no futuro os nossos computadores se comunicarão conosco em linguagem natural, mas atualmente isso é um sonho distante. No Google, se você não põe o termo de busca entre aspas, a primeira coisa que o motor de busca faz é desmontar a frase e procurar por todas as combinações das palavras em qualquer ordem. Portanto, a correção gramatical na busca é uma comodidade possível, mas não essencial.
    Mas note bem, buscas como a "quebra pau entre celebridades" pressupõem que o computador deveria relacionar "celebridades" com nomes de pessoas reais e "quebra pau" com os termos sinônimos que possam aparecer em páginas sobre o assunto. Isso seria uma análise de contexto, função que o humano exercita sem se dar conta, mas está totalmente fora do alcance da máquina.
    Depois de escrever o post, me ocorreu que uma das razões pelas quais os usuários normais pressupõem que os computadores entendem a linguagem natural vem do hábito de ler mensagens de erro e notificações do Windows, todas redigidas em uma linguagem suficientemente natural, mesmo quando não conseguem informar o usuário realmente do que está ocorrendo. Os programadores do software tentam fazer o usuário se sentir como se um cerebrinho humano vivesse dentro da máquina. Nada mais longe da verdade...

    ResponderExcluir
  4. agorinha dei risada olhando os logs. chegaram ao meu assim:
    "contratos dos jogadores modos de vida e como começaram a carreira de todos os jogadores da seleção brasileira de 2006"
    :-)

    ResponderExcluir
  5. Realmente eu devia estar de muito mau humor, nem reconheci o post qdo reli agora - muito agressivo e eu peço desculpas.

    A música bosta era um pagode ou coisa parecida que vc postou faz anos pra exemplificar algo. Nada relacionado aos gostos musicais que vc normalmente posta.

    Invocar uma exceção pra provar uma regra pode ser um vício maldito. Na verdade tive uma vontade e quis prová-la de qquer jeito.

    Feh.

    ResponderExcluir
  6. Ah meu... desiste!
    Depois aparece no meu site e clica no shiny stats, e vai em search keywords! Eu mesmo já fiz uns 4 ou 5 posts falando disso ou tentando ensinar! Mas desiste! Sempre tem ignorante de primeira viagem, e estupidos q nunca aprendem!

    Principalmente depois q o yahoo comprou o ask jeeves!

    ResponderExcluir
  7. ótimo. nunca tinha raciocinado a coisa em termos de "análise de contexto", mas me recordo bem de ter passado por esse aprendizado.

    ResponderExcluir