_NOSCRIPT

Portal do Governo Brasileiro
canal-ciencia

Busca Avançada

A busca de informação na Internet com base em critérios de relevância e prioridade

O que é a pesquisa

 Em essência essa pesquisa investiga as relações da comunicação com a lingüística (ciência que estuda as funções da linguagem). O assunto é particularmente relevante quando se trata de comunicações científicas, formuladas em linguagem específica.

Um físico, por exemplo, cria suas construções teóricas, usando um sistema próprio de símbolos, que constitui a linguagem específica da sua comunidade.

Entretanto, o que para um lingüista ou comunicador pode parecer um simples fato técnico, isto é, a passagem de uma estrutura de informação (um texto, por exemplo) de seu emissor para o seu receptor, é na verdade um fenômeno especial, pois se relaciona à possibilidade de um indivíduo superar sua "solidão existencial" (a incomunicabilidade essencial de cada experiência vivenciada).

O fenômeno é especial porque, através da informação produzida, e com a ajuda de um sistema simbólico, um sujeito procura relatar a sua experiência vivenciada para outros sujeitos. Em outras palavras: tenta transferir a experiência vivida na esfera privada da criação individual para a esfera pública da significação coletiva.

Considerando esse dado, pesquisadores do Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) e da Universidade Federal do Rio de Janeiro investigam qual a melhor forma para a passagem e o entendimento, pelos destinatários, do conteúdo de informações técnicas e científicas transmitidas como textos escritos em ambientes virtuais (chamados aqui de "estoques de informação").

Como é feita a pesquisa

 Inicialmente, para verificar como se dão as diferentes interpretações de informação foram selecionados textos de 3 áreas - Comunicação, Ciência da Informação e Física – e identificadas as diferenças mais significativas no comportamento destes sub-códigos da linguagem.

O primeiro passo foi solicitar a pesquisadores das três áreas de conhecimento focadas que examinassem dez textos de cada área, e dessem, através de palavras, seu significado (conteúdo do texto).Nos dados coletados foi identificado um forte desvio cognitivo, conforme o tipo de receptor. O desvio manifesta-se tanto na interpretação de conceitos simples como para os conceitos que exigem maior elaboração de pensamento.

Quanto mais livre ou menos formal o sub-código da comunidade lingüística considerada (sendo Comunicação a mais livre, Ciência da Informação a intermediária e Física a mais restrita) maior é a fluência de conceitos interpretativos ou a atuação de um pensar divergente. Inversamente, quanto mais formal o subcódigo, maior é a concordância ou pensamento convergente.

Estes dados mostram que ao relacionar-se com um texto um receptor é levado, sim, a reflexões diretamente relacionadas à informação recebida; mas mostram também que o pensamento do receptor sofre outras influências e é seduzido por condições quase ocultas, silenciosas, de um meditar próprio de sua privacidade.

Essas divergências podem ser explicadas por vários fatores: contexto do texto, enquanto estrutura de informação; contexto particular do sujeito, no tempo e no espaço de interação com o texto; o desvio cognitivo da privacidade do receptor; o estoque de informação do sujeito; a qualidade da memória do leitor no contexto do texto;a competência simbólica do receptor em relação ao sub-código lingüístico na qual o texto se insere; ou o contexto físico e cultural do sujeito que interpreta o texto.Esses ruídos na interpretação do texto levam à hipótese de que o conhecimento é resultado tanto de um fluxo de processos do pensamento, quanto do que pode ser chamado de conjunto de manifestações tácitas, que dizem respeito às experiências incomunicáveis de cada indivíduo.

Esta hipótese pode influir na compreensão de como a informação se transforma em conhecimento. Os pesquisadores constataram que, no processo de conhecer (como a interpretação de um texto, por ex.), intervém tanto as condições explícitas quanto condições tácitas.

Como as condições tácitas são importantes, necessitam ser consideradas no gerenciamento dos conjuntos de informação e nos procedimentos e instrumentos da organização da informação.

A pesquisa portanto investiga a relevância quantitativa associada às palavras de maior freqüência no texto e a prioridade qualitativa associada a palavras menos citadas. Assim em um determinado estoque especifico de informação (como conteúdos digitais ou grupos de informações na InterNet, etc.) podem existir zonas de diferentes pesos em relação à relevância e qualidade.

Com isso pretende-se:
1. determinar os estímulos necessários para articular informações relevantes e prioritárias, estabelecendo zonas de qualidade para estoques de informação,

2. analisar como as zonas de qualidade num estoque de informação alteram a eficiência da interação do receptor com a informação e se este zoneamento pode ser feito por compressão semântica, isto é, usando modelos simbólicos (conjuntos de símbolos) do estoque e das preferências qualitativas do receptor.

As hipóteses que a pesquisa procura validar são:

1. na gestão da informação, armazenada em estoques específicos, existem configurações conjuntas de informação relevante e informação prioritária que podem ser zoneadas (com conjuntos de símbolos) facilitando a interação do usuário com o estoque de informação;

2. a informação relevante está diretamente relacionada com a quantidade dos conceitos mais freqüentes, que aparecem em um documento de informação;

3. a informação prioritária está diretamente relacionada com a qualidade dos conceitos de um documento de informação;

4. a informação que é relevante para um determinado receptor é razoavelmente inelástica em relação ao tempo: não apresenta variações radicais no curto prazo;

5. a informação que é prioritária para um determinado receptor é razoavelmente elástica em relação ao tempo, no curto prazo, pois a condição de prioridade modifica-se em função do tempo.

Assim, é pressuposição inicial da pesquisa que um estoque de informação específico pode ser qualitativamente zoneado e particionado, em pelos menos quatro setores.

Uma "zona de excelência" (chamada na pesquisa de Zona A) onde existem ou se reúnem documentos relevantes e documentos prioritários, e que pode ainda ser fragmentada em graus de prioridade.
Uma Zona B, de documentos revelantes, mas não prioritários, que pode indicar, por exemplo, que uma informação sobre turismo pode ser relevante para um planejamento de férias no futuro, mas não é prioritária no tempo atual.

Uma Zona C, que pode indicar que existem informações sem utilidade naquele contexto informacional, por falha da abrangência ou por serem marginais ao foco atual do usuário, mas que podem ter uma prioridade potencial no futuro.

E finalmente a Zona D, que reúne um conjunto de documentos sem relevância ou priopridade, naquele contexto e momento.

Importância da pesquisa

 Em termos práticos a pesquisa aponta uma metodologia para configurar estoques de informação (bibliotecas digitais ou núcleos de informação virtual) em zonas de qualidade para o receptor.

Nesses estoques os requerimentos de informação relevante e prioritária dos usuários podem ser estabelecidos, permitindo maior eficiência no acesso a informação, sua recuperação e distribuição.A pesquisa também permite classificar o conteúdo dos estoques de informação em faixas de freqüência, ajudando no seu direcionamento intencional (isto é, aprimorando os atendimentos).

Além disso, essa metodologia permite construir instrumentos de pesquisa eletrônica - como browsers ou robôs de pesquisa - que realizam automaticamente a compressão semântica quando um receptor interage com a base de informação. A compressão semântica aumenta a densidade de informação transferida ao indivíduo.Finalmente a metodologia da pesquisa permite diminuir o tempo de pesquisa online e de conexão com o estoque de informação, e aumentar a densidade da informação transmitida.

Em termos teóricos a pesquisa indica as bases conceituais para facilitar a interação entre um receptor e estoques de informação baseados num novo conceito de faixas de qualidade.

Nesse sentido a pesquisa desenvolve o conceito de Compressão Semântica capaz de representar simbolicamente a informação relevante e prioritária.

A Compressão Semântica de uma ferramenta ou veículo de informação capacita esse veículo a disparar protótipos de memória associados ao contexto informacional do indivíduo. Por isso a Compressão Semântica melhora a freqüência cognitiva, ou seja, o tempo e o esforço mental para um receptor processar a informação em sua mente, assimilando-a e transformando-a em conhecimento.

Devido à alta exposição à informação que todos sofrem atualmente, esta freqüência é muito grande e todos os instrumentos para sua redução ampliam a eficiência comunicacional.Em termos da tranferência dos resultados para a sociedade esta pesquisa ajudará a formar recursos humanos (em cursos regulares de mestrado e doutorado), e alimentará publicações especializadas, seminários e listas de discussão especializadas.

Além disso, serão incentivadas as aplicações em diferentes contextos informacionais e de receptores diversos, além de se prever divulgação na Web e a elaboração do relatório final.

Texto de divulgação científica publicado em 12 de junho de 2003.