TY - GEN AU - Moreira, Manoel Palhares AU - Stempliuc, Sergio Murilo TI - Reconhecimento de títulos de artigos não condizentes com seu conteúdo através da utilização de palavras-chave PY - 2006/// CY - Marília PB - UNESP KW - Organização da informação KW - Br KW - elementos de dados KW - título KW - Recuperação da informação N2 - O formato digital, possibilitado pela Tecnologia da Informação, tornou-se um novo suporte para registro de informações. O advento da Web, em meados dos anos 90, permitiu que novas formas de disseminação e recuperação de informações fossem introduzidas através da disponibilidade de documentos e do desenvolvimento de sistemas de recuperação de informação nesse ambiente. Os periódicos científicos encontrados na rede constituem uma destas formas de disseminação. Desde sua origem no século XVII, os periódicos científicos objetivam maior comunicação entre a comunidade de cientistas. Eles são produzidos em linguagem natural e obedecem a determinado formato, com normas para sua construção e submissão que constituem um padrão por onde os autores são conduzidos. As unidades de um texto científico: - o título, o resumo, as palavras-chave, o desenvolvimento do texto e as referências bibliográficas - representam um ponto de partida para estudos e compreensão do mesmo. Essas unidades são privilegiadas em processos de indexação de artigos científicos, quer manual ou automatizada, e entre elas o título possui papel de destaque: é através dele que de forma primeira os usuários realizam buscas bibliográficas. Se o título é pouco atrativo ao usuário, ou se é evasivo quanto ao conteúdo, maior a chance da obra ser descartada. Mesmo assim, em muitos casos os títulos acabam por não coincidir com o conteúdo do texto. Fica então o problema do reconhecimento de títulos que não condizem com o conteúdo do documento. O trabalho apresenta uma solução para o caso através das palavras-chaves indicadas pelos autores em artigos de revistas científicas digitais, a partir da hipótese de que artigos com pelo menos uma de suas palavras-chave em seu título possuem conteúdo condizente ao mesmo. Foram colhidos 300 artigos de duas revistas científicas brasileiras disponibilizadas na Web. Em um primeiro passo, com o auxílio de programas de computação, verificou-se a ocorrência das palavras-chaves indicadas pelos autores nos títulos de seus artigos: em 23% dos casos (69 artigos) nenhuma palavra-chave foi encontrada no título. O mesmo procedimento aplicado às demais unidades destes textos mostrou que 13% (9 textos) não possuíam nenhuma de suas palavras-chave no corpo do texto; em 36% (25 textos) elas não foram encontradas nos resumos e em 58% (40 textos) nas referências bibliográficas. Em uma segunda etapa foi realizada uma análise qualitativa verificando que em alguns casos o problema era a designação das palavras-chave. Concluiu-se que a presença de palavras-chaves em títulos de artigo pode ser um indicativo a ser observado durante o processo de submissão para a verificação do título junto ao conteúdo do artigo; e que revistas digitais poderiam ter vocabulários controlados construídos a partir destas palavras. Isto facilitaria os autores na construção de títulos e na designação de palavras-chave. Procedimentos neste sentido facilitariam a busca e o encontro de documentos frente à necessidade dos usuários UR - http://www.portalppgci.marilia.unesp.br/enancib/viewpaper.php?id=177 ER -