segunda-feira, 13 de dezembro de 2010

Linguística Computacional ou PLN

A Linguística Computacional ou Processamento de língua natural (em inglês Natural Language Processing, sigla NLP) é um campo multidisciplinar que envolve a Inteligência Artificial, a Informática e a Linguística e que se utiliza de processos computacionais para manipulação da linguagem humana. Os linguistas computacionais almejam desenvolver, através de um modelamento lógico-formal de línguas naturais, sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural.
As origens desta disciplina remontam à década de 1950 e se devem em grande parte aos esforços dos Estados Unidos em usar computadores para traduzir automaticamente documentos redigidos em outras línguas (especialmente russo) para o inglês. Apesar de os resultados obtidos pela tradução automática não serem ainda perfeitos, uma qualidade bastante razoável de tradução já é possível para vários tipos de textos. Isso evidencia a consolidação desta área de pesquisa voltada ao desenvolvimento de métodos, algoritmos e softwares que levam um computador à condição de lidar com uma língua natural de forma útil e sensata aos olhos humanos.

Aplicações populares da área:

  • Reconhecimento de fala
  • Síntese de voz
  • Máquinas de busca
  • Tradução automática
  • Correção automática em processadores de texto
  • Extração de informações de textos
  • Sumarização automática


Em São Carlos - SP, temos um núcleo chamado NILC (Núcleo Interinstitucional de Linguística Computacional) - formado por alguns professores meus da UFSCar, e pesquisadores da USP e UNESP Araraquara - que trabalha nesta área e produz muito. Como exemplo podemos citar o REGRAS, que corrige nossos errinhos no WORD, sabe? Ele foi vendido para a Microsoft em 2001, e faz maior sucesso entre nós, usuários do Word!

Nenhum comentário:

Postar um comentário