.
Imagine que você esteja buscando informações sobre futebol na Internet.
Entre com a palavra futebol num programa de busca e virão respostas tão variadas quanto a contratação de Ronaldinho, futebol americano e futebol de botão.
Isto porque os programas não distinguem o filme da revista ou do centro de pesquisas. É claro que você pode (aliás, deve) combinar - futebol - com outras palavras-chave, acrescentando ou excluindo termos que permitam refinar a busca, preferencialmente indicando também outros parâmetros, como data, língua ou domínio, que muitos programas aceitam na função de "busca avançada". Ainda assim, o resultado é muitas vezes desolador.
São dezenas (às vezes centenas) de páginas que não interessam.
Com o crescimento exponencial da Web tornou-se difícil indexar as informações. A linguagem HTML, que popularizou a Web e é utilizada pela maioria dos sites, não possui recursos que permitam atribuir significado à informação.
As tags são muito limitadas nesse sentido.
Para melhorar a indexação, são necessárias categorias mais apuradas que permitam triar com eficiência, no oceano de dados disponíveis, aquilo que interessa ao usuário num contexto preciso. Na verdade, categorias já existem.
O problema é que ela só é entendida por nós, humanos, mas não fazem sentido para os programas de computador, que ainda estão muito distantes de imitar o funcionamento da mente humana.
Os programas de computador (ainda) não conseguem resolver as ambigüidades e outros problemas complexos que o ser humano consegue, embora esta seja a aspiração da Inteligência Artificial: fazer com que a máquina reproduza os mecanismos da inteligência humana. Mas disto ainda estamos longe...
A Web Semântica é uma tentativa inversa de solução. Ao invés de pensar na informação para os humanos, a idéia é pensar na máquina. "Machine-understandable Information", esta é a definição da Web Semântica, segundo o "pai da Web", Tim Berners-Lee, um dos comandantes desse projeto.
É curioso, claro, pois o objetivo final é atender às pessoas e não aos computadores, mas para isso é preciso construir categorias e uma linguagem que façam sentido para a máquina.
O projeto da Web Semântica, embora pareça uma novidade, não nasceu há tão pouco tempo. Capitaneado pelo consórcio W3C, ele é um sucessor do projeto Metadados, cujos princípios são os mesmos (incluir "informação sobre a informação" na Web), mas que trabalhava com linguagem (HTML), que não permite criar categorias semânticas.
Um componente central da Web Semântica é a linguagem XML, que permite descrever semanticamente os dados e, a partir de categorias que o próprio usuário pode definir.
As metas do projeto da Web Semântica são mais ambiciosas do que simplesmente permitir indexar melhor a informação da Web. Interessam as aplicações que se tornam possíveis com a utilização de categorias semânticas para descrever os dados.
Quem leu o texto de Berners-Lee, James Hendler e Ora Lassila, na revista Scientific American de maio/2001, se lembrará que o início descreve o caso de Pete, um filho que busca na Internet, através de um software, alternativas para a fisioterapia de sua mãe.
Dispondo previamente de uma série de dados de Pete (seu endereço, seus horários, o seguro-saúde de sua mãe, etc), o agente busca na Web as informações relevantes (lista de médicos credenciados, suas agendas, etc) e em alguns minutos oferece uma lista de opções para que ele escolha a que mais lhe convém. Não satisfeito com a primeira lista, Pete pede que o agente refaça a busca de acordo com as restrições por ele estabelecidas. Desta vez, a solução oferecida é satisfatória e com algumas ações simples. Pete muda parte de seus compromissos, obtém a aceitação do agente de Lucy (sua irmã, com quem irá dividir as idas à fisioterapia da mãe) e acerta a agenda.
Todo esse cenário, é claro, ainda está relativamente distante. Além disso, as aplicações mais prováveis das ferramentas acima descritas serão o comércio eletrônico e grandes bancos de dados, como os próprios autores ressaltam.
Mas sites não comerciais também se beneficiarão da utilização do XML e do desenvolvimento da Web Semântica, pois seus conteúdos serão indexados mais eficientemente pelos programas de busca.
-----
Para saber mais:
Semantic Web Road Map - Texto de Tim Berners-Lee que, como diz o título, é um mapa da Web Semântica, aspectos gerais de sua arquitetura e objetivos. Interessante para quem busca um texto de introdução ao projeto. Claro e consistente.
The Semantic Web - Artigo de Tim Berners-Lee, James Hendler e Ora Lassila na revista Scientific American de maio de 2001.
Tutorial XML - Em português, elaborado por Miguel Furtado Júnior, estudante da UFRJ.
RDF Model Theory - Última versão da teoria semântica da linguagem RDF (Resource Description Framework). Atualizado em fevereiro de 2002. Exige conhecimentos de lógica, semântica e informática.
MIT Artificial Intelligence Laboratory - Importante laboratório de pesquisa sobre Inteligência Artificial. Site traz resumos das pesquisas e outros materiais interessantes.