domingo, 31 de outubro de 2010

PARTE I – Introdução ao Processamento das Línguas Naturais


1. Introdução ao PLN

Este texto pretende introduzir o leitor à área de pesquisa e desenvolvimento em
Processamento de Línguas Naturais (PLN). Sem se aprofundar nos mais variados tópicos que
serão abordados, o texto tem, antes de tudo, o objetivo maior de motivar o leitor à exploração
dessa área e estimulá-lo ao aprofundamento dos tópicos que mais lhe interessam. É intenção
dos autores produzir textos que dêem continuidade a esse e, portanto, alarguem o horizonte do
leitor que inicia seus estudos nessa área.
O PLN abrange várias e complexas áreas do conhecimento e, por isso, exige que
adotemos uma certa perspectiva a fim de traçar uma visão da área. Nesse caso, estaremos
focalizando nesse texto apenas o processamento de línguas escritas e, em grande parte das
vezes, apenas de textos mono-sentenciais. Além disso, nossas motivações e ilustrações, em
geral, referem-se à língua portuguesa escrita no Brasil.
O leitor encontrará, nas seções seguintes, um breve histórico da área de PLN, uma
introdução aos diferentes tipos de conhecimento lingüístico para o tratamento de línguas
naturais, a apresentação de arquiteturas de sistemas de interpretação e geração de línguas
naturais, uma introdução ao processo automático de análise sintática, tão importante na
maioria das aplicações de PLN, e a apresentação do projeto ReGra, no qual vários conceitos
apresentados anteriormente serão ilustrados. Finalmente, as referências bibliográficas
representam importantes fontes de informações complementares.

2. O Processamento Automático das Línguas Naturais: história e
metodologia

Fonte:UFSCAR

sábado, 10 de abril de 2010

* Linguística de corpus auxiliada por computador;
* Análise sintática (parsing) em língua natural;
* Part-of-speech tagging;
* Representação de conhecimento (Knowledge representation);
* Recuperação de informação (Information Retrieval)
* Web semantica (Semantic Web)
* Tradução automática

A Linguística Computacional ou Processamento de língua natural (em inglês Natural Language Processing, sigla NLP) é um campo multidisciplinar que envolve a Inteligência Artificial, a Informática e a Linguística e que se utiliza de processos computacionais para manipulação da linguagem humana. Os linguistas computacionais almejam desenvolver, através de um modelamento lógico-formal de línguas naturais, sistemas com capacidade de reconhecer e produzir informação apresentada em linguagem natural.

As origens desta disciplina remontam à década de 1950 e se devem em grande parte aos esforços dos Estados Unidos em usar computadores para traduzir automaticamente documentos redigidos em outras línguas(especialmente russo) para o inglês.[1] Apesar dos avanços na área de tradução automática serem até a atualidade insatisfatórios, emergiu desta tentativa todo um campo devotado ao desenvolvimento de métodos, algorítmos e softwares que levam um computador à condição de lidar com uma língua natural de forma útil e sensata aos olhos humanos .

Twitter Delicious Facebook Digg Stumbleupon Favorites More

 
Powered by Blogger