Criando um mecanismo de busca no seu site com o Google Custom Search Engine

Recentemente a Yahoo! lanço o BOSS (Build your Own Search Service), para concorrer diretamente com o Google Custom Search Engine. Ambos são mecanismos de buscas que procuram dentro de páginas ou domínios configurado por você. Aqui eu vou falar do Google Custom Search Engine que parece ser mais simples.

Google Custom Search Engine

Me apresentaram o Google Custom Search Engine lá no Google Search Masters 2008 e deram bons motivos para nos pensar em utilizá-lo, como:

  • Fazer uma busca em todo o seu site, pode ser complexo, gastar horas e horas de programação, no mecanismo deles eu fiz em 5 minutos.
  • O algoritmo de buscas é o mesmo que o google usa, então, ele consegue definir níveis de príoridade (ranking), por exemplo se nós procurarmos javascript, o algorítimo procura qual a relevância da keyword javascript dentro de cada página. E depois ele apresenta qual tem o resultado mais relevante. O que seria é mais complicado ainda.
  • Os usuários estão acostumados a interface do google.
  • É possível mesclar o conteúdo com links patrocinados e, quem sabe, ganhar dinheiro com isso.

Faça o teste aqui com o nosso mecanismo de busca que eu acabei de criar.

Procure por modal, javascipt, jQuery, ou o que quiser.

É lógico que tem desvantagens, acaba com o layout do seu site, e pra quem usa CMS como wordpress, joomla, drupal, etc.. etc… não dá trabalho nenhum criar uma busca. Mas pra quem não usa, ou se seu cliente quer um projeto “bom, rápido e barato”, vale a pena experimentar, até a w3c schools usa.

Resumo do Google Search Masters 2008

Acabei de voltar do evento, vou tentar postar aqui o que achei de melhor do Google Search Masters.

google search masters

O evento tinha umas 1200 pessoas, de diversos lugares (conheci até um fulano de Teresina).
As palestras foram muito boas, aprendi bastante pra um dia. Vou citar 4 tópicos que achei bem interessante.

Google Search Appliance ou Google Enterprise
Em todas as empresas (pelo menos as em que trabalhei), achar qualquer informação é um processo bem dificil. O Google Search Appliance funciona com crawlers que lêem informações e diretórios de arquivos em um ambiente corporativo e tornam possível uma busca igual ao do Google.

google search appliance

Isso merece até um post só pra essa ferramenta. Faço em breve, prometo.

Futuro da busca
Questões como busca semânticas foram levantadas, mas o que mais me chamou atenção, é o que já está sendo produzido.
Reconhecimento de face já está sendo aplicado no Picasa, e em breve será possível mandar selecionar uma foto da Belinha por exemplo
e mandar procurar por outras fotos que aparece ela no meio de um álbum. Outro ponto legal foi o Google Áudio.
Um algoritmo eficiente que interpreta áudio (em inglês) e torna disponível busca por termos encontrados em áudio / vídeo.
Entrem no google áudio e façam uma pesquisa de algum termo ou palavra em inglês para testar (no evento, usaram “Brazil”).

Google Custom Engine
É uma busca do Google dentro do seu site. Ao invés de se preocupar com palavras chaves, termos de busca, busca pelo conteúdo, etc.
Pode valer a pena usar o GCE (Google Custom Engine). Além da praticidade, é possível colocar links patrocinados nos resultados das buscas, o que se torna uma alternativa interessante para monetização de blogs.

Usuários do GTalk que funcionam como tradutores online.
Acreditem, foi o que mais gostei, algo bem simples:
adicionem [email protected] e Diga “Olá, como vai você?” e o bot te responde na hora em inglês.

Tradutores online do gtalk

O processo contrário é feito pelo bot [email protected] . Outros 46 bots desses que traduzem diversas linguas.

Além desses tópicos, falaram bastante de ferramentas para webmasters (como analisar robots.txt, a importância do sitemap), falaram sobre o Knol (que basicamente é uma Wikipedia do Google) entre outras coisas.

PS:Os organizadores informaram que as palestras do evento serão disponibilizadas no Youtube, que eu recomendo para quem não foi.