PROCESSAMENTO DE LINGUAGEM NATURAL : em busca de evidências temáticas nas publicações nacionais e contemporâneas
Nos últimos anos, as linguagens naturais têm recebido um inegável destaque, principalmente diante do advento da web e das bibliotecas digitais, o que propiciou que uma avalanche de informação em documentos textuais fosse propagada. A melhoria desses sistemas de recuperação depende de resultados em várias linhas de pesquisa, dentre elas, a de processamento de linguagem natural. Sendo assim, o presente trabalho tem como objetivo analisar a produção científica nacional e contemporânea na área, tendo em vista os desenvolvimentos realizados ao longo dos últimos 40 anos. A plataforma Lattes foi utilizada para obter os pesquisadores nacionais e contemporâneos, assim como suas publicações pertinentes para a área de processamento de linguagem natural. Essa seleção por pertinência foi realizada baseando-se num parâmetro conceitual construído a partir da análise de assunto realizada nos capítulos de revisão do ARIST nos últimos anos. Tal parâmetro é constituído de quatro categorias temáticas: conceitos computacionais e lingüísticos, aplicações e técnicas ou métodos. Algumas análises foram feitas baseando-se nessas categorias temáticas. Foram recuperados 405 pesquisadores que produziram 774 publicações relevantes para a área. Observou-se que o volume de produção científica aumentou consideravelmente a partir da década de 90. Dentre as publicações que apresentaram pelo menos um conceito lingüístico, observou-se que os termos linguagem,português, linguística, semântico e palavra são suficientes para recuperar cerca de 90% das publicações. Dentre as publicações que foram classificadas na categoria das aplicações, é possível observar que quase 40% das publicações estavam relacionadas com indexação. Ao analisar as técnicas presentes nas publicações relevantes, é possível observar que a grande maioria está relacionada a abordagens estatísticas. O trabalho sintetizou o perfil de pesquisadores e de publicações feitas por brasileiros da área de processamento de linguagem natural nos últimos 40 anos. Como trabalho futuro, pretende-se identificar as temáticas que surgiram nessas publicações e que não haviam sido apontadas nos capítulos de revisão do ARIST
Processamento de linguagem natural (Computação) Catalogação por assunto