1 |
Um método adaptativo para análise sintática do Português Brasileiro. ; An adaptive method for syntactic analysis of Brazilian Portuguese.
|
|
Padovani, Djalma. - : Biblioteca Digital de Teses e Dissertações da USP, 2022. : Universidade de São Paulo, 2022. : Escola Politécnica, 2022
|
|
Abstract:
As línguas naturais caracterizam-se por sua riqueza semântica, léxica e sintática, permitindo a elaboração de textos complexos com alto grau de abstração como os vistos nas grandes obras da literatura, ou precisos e direcionados, como os encontrados em tratados acadêmicos e trabalhos científicos. Há um grande apelo para que as pessoas se comuniquem com as máquinas da mesma forma que fazem umas com as outras. No entanto, o processamento de linguagens naturais requer o desenvolvimento de programas capazes de determinar e interpretar a estrutura léxico-sintática e semântica das sentenças em vários níveis de detalhe. A análise sintática, também conhecida como parsing, é um dos principais componentes em várias aplicações de processamento de linguagem natural, porém se trata de uma tarefa complexa por causa das ambiguidades da linguagem, múltiplas interpretações de palavras, diferentes ordens possíveis de elementos e itens ausentes. Além disso, as línguas mais conhecidas se beneficiam de um número significativo de recursos computacionais, enquanto as demais, entre elas o Português, não dispõem de tantas ferramentas dessa natureza. Esta tese tem como objetivo apresentar um método para análise sintática do Português Brasileiro. O formalismo adaptativo foi escolhido como modelo teórico subjacente devido à sua potencial riqueza de representação e de manipulação, o que o torna consistente e flexível ao mesmo tempo, proporcionando o embasamento necessário para a construção do modelo computacional proposto, sem a necessidade de recorrer a técnicas auxiliares. O modelo proposto foi validado através de experimentos nos quais os resultados foram comparados aos obtidos pelos analisadores sintáticos do estado da arte para o Português, visando avaliar a sua eficiência nos diversos cenários de testes. ; Natural languages are characterized by their semantic, lexical and syntactic richness, allowing the elaboration of complex texts with a high degree of abstraction, such as those seen in great works of literature, or precise and directed, as found in academic treatises and scientific works. There is a huge appeal for people to communicate with machines the same way they do with each other. However, natural language processing requires the development of programs capable of determining and interpreting the lexical-syntactic and semantic structure of sentences at various levels of detail. Parsing is one of the main components of many natural language processing applications, but it is a complex task because of language ambiguities, multiple word interpretations, different possible orders of elements and missing items. In addition, the most popular languages benefit from a significant number of computational resources, while the others, including Portuguese, do not have as many tools of this nature. This thesis aims to present a method for syntactic analysis of Brazilian Portuguese. The adaptive formalism was chosen as the underlying theoretical model because of its potential richness of representation and manipulation, which makes it consistent and flexible at the same time, providing the necessary foundation for the construction of the proposed computational model, without the need to resort to auxiliary techniques. The proposed model was validated through experiments in which the results were compared to those obtained by stateof- the-art syntactic analyzers for Portuguese, in order to evaluate the efficiency of the model in different test scenarios.
|
|
Keyword:
Análise morfossintática; Automata; Autômatos finitos; Gramática transformacional; Grammars; Natural language processing; Parsers; Processamento de linguagem natural
|
|
URL: https://doi.org/10.11606/T.3.2022.tde-20042022-080552 https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20042022-080552/
|
|
BASE
|
|
Hide details
|
|
4 |
Document Image Parsing and Understanding using Neuromorphic Architecture
|
|
|
|
In: DTIC (2015)
|
|
BASE
|
|
Show details
|
|
5 |
Learning to Understand Natural Language with Less Human Effort
|
|
|
|
In: DTIC (2015)
|
|
BASE
|
|
Show details
|
|
6 |
Natural Language Semantics using Probabilistic Logic
|
|
|
|
In: DTIC (2014)
|
|
BASE
|
|
Show details
|
|
7 |
Arabic Natural Language Processing System Code Library
|
|
|
|
In: DTIC (2014)
|
|
BASE
|
|
Show details
|
|
10 |
Corrección no supervisada de dependencias sintácticas de aposición mediante clases semánticas ; Unsupervised correction of syntactic dependencies of apposition through semantic classes
|
|
|
|
BASE
|
|
Show details
|
|
11 |
Le programme Mogador en linguistique formelle arabe et ses applications dans le domaine de la recherche et du filtrage sémantique
|
|
|
|
In: https://halshs.archives-ouvertes.fr/halshs-00912009 ; 2012 (2012)
|
|
BASE
|
|
Show details
|
|
12 |
An All-Fragments Grammar for Simple and Accurate Parsing
|
|
|
|
In: DTIC (2012)
|
|
BASE
|
|
Show details
|
|
13 |
Incremental Syntactic Language Models for Phrase-Based Translation
|
|
|
|
In: DTIC (2011)
|
|
BASE
|
|
Show details
|
|
14 |
Introduction of Automation for the Production of Bilingual, Parallel-Aligned Text
|
|
|
|
In: DTIC (2011)
|
|
BASE
|
|
Show details
|
|
15 |
Multilingual Content Extraction Extended with Background Knowledge for Military Intelligence
|
|
|
|
In: DTIC (2011)
|
|
BASE
|
|
Show details
|
|
16 |
Learning for Semantic Parsing Using Statistical Syntactic Parsing Techniques
|
|
|
|
In: DTIC (2010)
|
|
BASE
|
|
Show details
|
|
17 |
A Formal Model of Ambiguity and its Applications in Machine Translation
|
|
|
|
In: DTIC (2010)
|
|
BASE
|
|
Show details
|
|
18 |
Rapidly Customizable Spoken Dialogue Systems
|
|
|
|
In: DTIC (2009)
|
|
BASE
|
|
Show details
|
|
19 |
Pictures from Words, Pictures from Text: Constructing Pictorial Representations of Meaning from Text
|
|
|
|
In: DTIC (2009)
|
|
BASE
|
|
Show details
|
|
20 |
Wide-coverage deep statistical parsing using automatic dependency structure annotation
|
|
|
|
In: Cahill, Aoife orcid:0000-0002-3519-7726 , Burke, Michael, O'Donovan, Ruth, Riezler, Stefan, van Genabith, Josef orcid:0000-0003-1322-7944 and Way, Andy orcid:0000-0001-5736-5930 (2008) Wide-coverage deep statistical parsing using automatic dependency structure annotation. Computational Linguistics, 34 (1). pp. 81-124. (2008)
|
|
BASE
|
|
Show details
|
|
|
|