Muitos analistas do mercado de buscas de Internet vivem a perguntar quem será a próxima Google, ou seja, a empresa detentora da poderosa tecnologia, que derrubará a gigante de Mountain View. Vocês, entretanto, talvez nunca tenha ouvido falar em Powerset ou Cuill e, por isso mesmo deve estar achando uma loucura eu perguntar se elas irão vencer a Google, principalmente porque não pergunto se a Microsoft ou a Yahoo! o farão. Não é mesmo?
Mas eu não estou tentando provocar ninguém. Há nos EUA quem acredite que estas startups poderiam vir a ser as próximas substitutas da Google e não a Microsoft, a Yahoo!, ou a Ask e nem mesmo a Baidu.
Mas, por que isto? E mais: isto é realmente possível? São estas as respostas que tentaremos encontrar ao final deste artigo.
Em primeiro lugar, temos que lembrar que a indústria de alta tecnologia é movida a grandes e muito inovações. Assim, nunca uma empresa pode ser considerada totalmente segura de sua posição no mercado, se ficar estagnada, seja por poucos meses. A própria história da Google tem início na estagnação dos motores de busca da época, que eram toscos. Quando ela chegou, indexando a Internet com o seu PageRank, conferiu um nível de relevância até então não conhecido às buscas, o que forjou o império, que hoje conhecemos.
Assim, a chave para o sucesso parece ser a unicamente a relevância das buscas. Seria isto mesmo? Veremos no final.
Mas, e quanto as startups citadas? Quem são elas, para merecer tanta atenção?
Bem, até agora, pouco se sabe sobre elas, além de relatos de poucos privilegiados, que puderam ver seus resultados. Ou seja, muitos já falaram sobre elas, mas poucos as conheceram por dentro, porque ambas estão funcionando em beta fechado e somente deverão vir a público em 2008.
Virão mesmo?
Sobre a Powerset, sabe-se que muito sucesso fez em sua apresentação no TechCrunch 40, um seminário sobre tecnologia de Internet, havido em setembro, em São Francisco – Califórnia. Quem assistiu, disse que o poderoso algoritmo de pesquisa suporta a tão esperada pesquisa em linguagem natural. Mas, o que seria linguagem natural e o que a difere da pesquisa hoje feita pelos motores de busca usuais (Google incluído)? Nos Motores atuais, se nós estamos procurando, por exemplo, o ano da morte de Getúlio Vargas, colocamos as palavras [ano morte Getúlio Vargas] e o motor, por uma combinação destas palavras, vai procurar páginas que as contenham. A proposta da linguagem natural é que possamos fazer a pergunta “Em que ano morreu Getúlio Vargas?” e o motor linguístico natural entenda não apenas as palavras-chave, mas também o significado intrínseco da frase, procurando por outros textos, que não tenham as palavras em si e conferindo-lhes a relevância que desejamos, segundo o contexto linguístico. Sem dúvida, um motor de buscas com tais características apresentaria um grau de relevância nas respostas muito maior que os hoje existentes. Há, entretanto, quem diga que não há no mundo tecnologia apta a usar isso em larga escala.
Vale lembrar que a Powerset ainda está fazendo experimentos apenas em inglês. Ressalte-se que a IBM tem experiências nesta área, mas restritas ao mundo corporativo, não o utilizando na Internet. A própria Google já busca esta tecnologia há algum tempo, que se espera, seja a forma de consulta da Web 3.0. Até agora, não há notícia de ninguém que a tenha utilizado em larga escala na Web. Parece que a Powerset seria a primeira.
Quanto à Cuill, menos ainda foi divulgado. Como Renê Fraga já divulgou aqui, a empresa tem dito que seu motor de buscas pode indexar as páginas de internet com maior agilidade e menor custo em comparação com o Google – Cuill tem anunciado para potenciais investidores que seus custos serão 90% a menos em relação ao Google, devido a sua nova arquitetura e métodos relevantes. Ela promete indexar as páginas de Internet a um custo de 10% de todos os motores atuais, o que é uma vantagem competitiva, que não se pode deixar de reconhecer.
Sabe-se também que este algoritmo foi criado por um casal, que trabalhava num projeto de buscas da Google chamado TeraGoogle e que de lá saíram, levando boa parte da equipe, para formar a nova empresa.
Há um forte boato de que a Google, apesar de ameaçar processa-los por atitudes, com as quais a Google não concorda, já negocia a compra da empresa e ela não deverá entrar em operação em 2008, como promete.
Mas, por que estas empresas, que nem ainda estão no mercado, são consideradas por alguns analistas mais ameaçadoras ao poder da Google que a Microsoft e a Yahoo! juntas? Segundo eles, porque apresentam justamente a inovação, que as outras não possuem.
Com efeito, os demais motores, possuem hoje relevância de buscas tão grandes quanto às da Google. Entretanto, a Google continua a manter e até a aumentar o seu espaço no mercado mundial, com exceção da China, onde ela perde feito para a Baidu, mas já começa a crescer mais em termos relativos, apesar de perder muito em termos absolutos.
Outro ponto importante é que estas empresas hoje não fazem apenas buscas em páginas de Internet, mas em mapas, fotos de satélites, telefones celulares, buscas locais, fotos, vídeos, além de fornecerem e-mail, editor de texto, planilha eletrônica, software de apresentação, completos serviços de publicidade e vários outros serviços, que estas startups teriam muita dificuldade de montar de um dia para outro, além de terem que fazer os usuários, publicitários e anunciantes migrarem dos motores tradicionais para os seus serviços, o que hoje não é fácil. Afinal, o fato de os motores de Microsot e Yahoo! estarem tão bons quanto os da Google e, mesmo assim eles estarem perdendo mercado para a Google, mostra que este é um mercado de fidúcia. Neste caso, somente há migração de usuários, logo, de clientes, quando há real insatisfação, como havia no momento do nascimento da Google. E isto não parece haver hoje.
Diante deste quadro, o que me parece, estas empresas estão fadadas a ser incorporadas aos grandes motores, o que não é um demérito. No que tange à Cuill, dizem que será da Google, o que seria até natural, para que segredos industriais não sejam repassados aos demais. Já quanto à Powerset, poderá ser adquirida por quaisquer uma das três grandes, mas não a vejo funcionando muito tempo solitária, mesmo que consiga realmente entregar o que promete, o que seria um passo fantástico.
4 Comentários
Sinceramente, eu acho que isso não tem futuro. Os sistemas de RI (recuperação de informação, Google e afins…) resolvem os problemas que estas novas empresas se propõe a resolver, de maneira relativamente eficiente.
Isso de 90% a menos de custo é simplesmente MUITO estranho e DUVIDOSO! Processamento de linguagem natural até onde eu sei é muito pesado. Quero saber como eles conseguiriam escalar algo assim.
Quando você diz: “…procurando por outros textos, que não tenham as palavras em si e conferindo-lhes a relevância que desejamos, …”
Se outro texto não contém as palavras em si muito provavelmente ele não é relevante para a consulta, é só tentar pensar num exemplo que isso aconteça, no máximo se conter sinônimos dos termos da consulta. Mesmo assim, os sistemas de RI tradicionais (inclusive o Google, claro) faz algo parecido. Fazendo algumas consultas pode-se perceber como em alguns resultados nem todas as palavras que você buscou estão presentes numa determinada resposta.
As máquinas de busca hoje não são perfeitas, tem muito pra onde evoluir. Mas não creio que haja a necessidade de processamento de linguagem natural para ajudar a “entender” a consulta do usuário.
Estou pensando em escrever um post só sobre isso, vou falar com dois professores meus da área pra ter mais embasamento. Qualquer aviso aqui! hehehe
Abraço!
Caro Felipe Hummel,
Ficamos muito felizes com o seu comentários e, principalmente, em saber que isto lhe motivou a escrever um artigo sobre o tema. É para isto que servem os blogs: para fomentar a troca de idéias. Mostrei o seu e-mail ao nosso editor e proprietário do blog, Renê Fraga e ele pediu que o convidasse a submeter o seu artigo à editoria dele, para eventual possibilidade de publicação aqui no Google Discovery, caso isto venha a ser de seu interesse.
Esta é uma política do Renê. Eu mesmo tornei-me um colaborador voluntário deste blog, a partir de participações como esta. Houve um dia em que ele me convidou a escrever um artigo e, depois, mais outro e mais outro. E tomei gosto pela coisa.
Muito obrigado pela participação.
Abraços,
Rômulo
Pingback: Microsoft quer adquirir a Powerset - um sistema de buscas semântico - Google Discovery
Pingback: Powerset e Cuill Vs Google « Desabafos Digitais