DE eng

Search in the Catalogues and Directories

Page: 1 2
Hits 1 – 20 of 28

1
Dicionário gramatical de verbos do português
Baptista, Jorge,; Mamede, Nuno. - : HAL CCSD, 2020
In: https://hal.archives-ouvertes.fr/hal-03109961 ; 2020 (2020)
BASE
Show details
2
Syntactic Transformations in Rule-Based Parsing of Support Verb Constructions: Examples from European Portuguese
In: SLATE ; https://hal.archives-ouvertes.fr/hal-03020185 ; SLATE, Jul 2020, Barcelos (virtual), Portugal. pp.11:1-11:14, ⟨10.4230/OASIcs.SLATE.2020.11⟩ ; http://slate-conf.org/2020/home (2020)
BASE
Show details
3
Syntactic Transformations in Rule-Based Parsing of Support Verb Constructions: Examples from European Portuguese ...
Baptista, Jorge; Mamede, Nuno. - : Schloss Dagstuhl - Leibniz-Zentrum für Informatik, 2020
BASE
Show details
4
Processing European Portuguese Verbal Idioms: From the Lexicon-Grammar to a Rule-based Parser ...
Galvão, Ana; Baptista, Jorge; Mamede, Nuno. - : Unpublished, 2019
BASE
Show details
5
INTEGRATION OF NOMINAL PREDICATES INTO A PARSER: AN EXPERIMENT WITH THE CONSTRUCTIONS WITH THE SUPPORT VERB DAR ‘GIVE’ IN BRAZILIAN PORTUGUESE ...
RASSI, Amanda; BAPTISTA, Jorge; VALE, Oto. - : SciELO journals, 2018
BASE
Show details
6
INTEGRATION OF NOMINAL PREDICATES INTO A PARSER: AN EXPERIMENT WITH THE CONSTRUCTIONS WITH THE SUPPORT VERB DAR ‘GIVE’ IN BRAZILIAN PORTUGUESE ...
RASSI, Amanda; BAPTISTA, Jorge; VALE, Oto. - : SciELO journals, 2018
BASE
Show details
7
Revising the Annotation of a Broadcast News Corpus: a Linguistic Approach
Cabarrão, Vera; Moniz, Helena; Batista, Fernando. - : European Language Resources Association (ELRA), 2018
BASE
Show details
8
Vocatives in Portuguese: Identification and Processing
Baptista, Jorge; Mamede, Nuno. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2017. : OASIcs - OpenAccess Series in Informatics. 6th Symposium on Languages, Applications and Technologies (SLATE 2017), 2017
BASE
Show details
9
Vocatives in Portuguese: Identification and Processing ...
Baptista, Jorge; Mamede, Nuno. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik GmbH, Wadern/Saarbruecken, Germany, 2017
BASE
Show details
10
Automated anonymization of text documents
BASE
Show details
11
Automatic generation of exercises on passive transformation in portuguese
BASE
Show details
12
Assisting European Portuguese teaching: linguistic features extraction and automatic readability classifier
Curto, Pedro; Baptista, Jorge; Mamede, Nuno. - : Inst Syst & Technologies Informat, Control & Commun; Int Soc Engn EducInst Syst & Technologies Informat, Control & Commun; Int Soc Engn Educ, 2016
BASE
Show details
13
Syntax Deep Explorer
Baptista, Jorge; Mamede, Nuno; Correia, José. - : SPRINGER INT PUBLISHING AG, 2016
BASE
Show details
14
The fuzzy boundaries of operator verb and support verb constructions with dar "give" and ter "have" in Brazilian Portuguese
In: Proceedings of the Workshop on Lexical and Grammatical Resources for Language Processing ; COLING ; https://hal.archives-ouvertes.fr/hal-01354243 ; COLING, Aug 2014, Dublin, Ireland. pp.92-101, ⟨10.3115/v1/W14-5812⟩ ; http://www.coling-2014.org/ (2014)
BASE
Show details
15
Automatic Identification of Whole-Part Relations in Portuguese
Markov, Ilia; Mamede, Nuno; Baptista, Jorge. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2014. : OASIcs - OpenAccess Series in Informatics. 3rd Symposium on Languages, Applications and Technologies, 2014
BASE
Show details
16
Automatic Identification of Whole-Part Relations in Portuguese ...
Markov, Ilia; Mamede, Nuno; Baptista, Jorge. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik GmbH, Wadern/Saarbruecken, Germany, 2014
BASE
Show details
17
Automatic identification of whole-part relations in Portuguese
Markov, Ilia. - 2014
Abstract: Dissertação de Mestrado, Ciências da Linguagem, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve, 2014 ; Neste trabalho, procurou-se melhorar a extração de relações semânticas entre elementos textuais tal como é atualmente realizada pela STRING, um sistema híbrido de Processamento de Linguagem Natural (PLN), baseado em métodos estatísticos e regras híbrido, e desenvolvido para o Português. Visaram-se as relações todo-parte (meronímia), que pode ser definida como uma relação semântica entre uma entidade que é percebido como parte integrante de outra entidade, ou a relação entre um membro e um conjunto de elementos. Neste caso, vamos-nos concentrar num tipo de meronímia envolvendo entidades humanas e nomes parte-do-corpo (Npc); e.g., O Pedro partiu uma perna: WHOLE-PART(Pedro,perna). Para extrair este tipo de relações parte-todo, foi construído um módulo de extração de relações meronímicas baseado em regras e que foi integrado na gramática do sistema de STRING. Cerca de 17.000 instâncias de Npc foram extraídas do primeiro fragmento do corpus CETEMPúblico para a avaliação deste trabalho. Foram também recolhidos 79 casos de nomes de doença (Nd), derivados a partir de um Npc subjacente (e.g., gastrite-estômago). A fim de produzir um corpus de referência (golden standard) para a avaliação, foi selecionada uma amostra aleatória estratificada de 1.000 frases, mantendo a proporção da frequência total de Npc no corpus. Esta amostra também inclui um pequeno número de Nd (6 lemas, 17 frases). Essas instâncias foram repartidas e anotadas por quatro falantes nativos de português. 100 frases foram dadas a todos os anotadores a fim de calcular o acordo inter-anotadores, que foi considerado entre “razoável” (fair) e “bom” (good). Comparando a saída do sistema com o corpus de referência, os resultados mostram, para as relações parte-todo envolvendo Npc, 0,57 de precisão, 0,38 de cobertura (recall), 0,46 de medida-F e 0,81 de acurácia. A cobertura foi relativamente pequena (0,38), o que pode ser explicada por vários fatores, tais como o facto de, em muitas frases, o todo e a parte não estarem relacionadas sintaticamente e até se encontrarem por vezes bastante distantes. A precisão é um pouco melhor (0,57). A acurácia é relativamente elevada (0,81), uma vez que existe um grande número de casos verdadeiro-negativos. Os resultados para os nomes de doença, embora o número de casos seja pequeno, mostram uma 0,50 de precisão, 0,11 de cobertura, 0,17 de medida-F e 0,76 de acurácia. A cuidadosa análise de erros realizada permitiu detetar as principais causas para este desempenho, tendo sido possível, em alguns casos, encontrar soluções para diversos problemas. Foi então realizada uma segunda avaliação do desempenho do sistema, verificando-se uma melhoria geral dos resultados: a precisão melhorou +0,13 (de 0,57 para 0,70), a cobertura +0,11 (de 0,38 para 0,49), a medida-F +0,12 (de 0,46 para 0,58) e a acurácia +0,04 (de 0,81 para 0,85). Os resultados para os Nd permaneceram idênticos. Em suma, este trabalho pode ser considerado como uma primeira tentativa de extrair relações partetodo, envolvendo entidades humanas e Npc em Português. Um módulo baseado em regras foi construído e integrado no sistema STRING, tendo sido avaliado com resultados promissores. ; In this work, we improve the extraction of semantic relations between textual elements as it is currently performed by STRING, a hybrid statistical and rule-based Natural Language Processing (NLP) chain for Portuguese, by targeting whole-part relations (meronymy), that is, a semantic relation between an entity that is perceived as a constituent part of another entity, or a member of a set. In this case, we focus on the type of meronymy involving human entities and body-part nouns (Nbp); e.g., O Pedro partiu uma perna ’Pedro broke a leg’: WHOLE-PART(Pedro,perna). In order to extract this type of whole-part relations, a rule-based meronymy extraction module has been built and integrated in the grammar of the STRING system. Around 17,000 Nbp instances were extracted from the first fragment of the CETEMPúblico corpus for the evaluation of this work. We also retrieved 79 instances of disease nouns (Nsick), which are derived from an underlying Nbp (e.g., gastrite-estômago ’gastritis-stomach’). In order to produce a golden standard for the evaluation, a random stratified sample of 1,000 sentences was selected, keeping the proportion of the total frequency of Nbp in the source corpus. This sample also includes a small number of Nsick (6 lemmas, 17 sentences). These instances were annotated by four native Portuguese speakers, and for 100 of them the inter-annotator agreement was calculated and was deemed from “fair” to “good”. After confronting the produced golden standard against the system’s output, the results for Nbp show 0.57 precision, 0.38 recall, 0.46 F-measure, and 0.81 accuracy. The recall is relatively small (0.38), which can be explained by many factors such as the fact that in many sentences, the whole and the part are not syntactically related. The precision is somewhat better (0.57). The accuracy is relatively high (0.81) since there is a large number of true-negative cases. The results for Nsick, though the number of instances is small, show 0.50 precision, 0.11 recall, 0.17 F-measure, and 0.76 accuracy. A detailed error analysis was performed, some improvements have been made, and a second evaluation of the system’s performance was carried out. It showed that the precision improved by 0.13 (from 0.57 to 0.70), the recall by 0.11 (from 0.38 to 0.49), the F-measure by 0.12 (from 0.46 to 0.58), and the accuracy by 0.04 (from 0.81 to 0.85). The results for Nsick remained the same. In short, this work may be considered as a first attempt to extract whole-part relations, involving human entities and Nbp in Portuguese. A rule-based module was built and integrated in the STRING system, and it was evaluated with promising results. ; Erasmus Mundus Action 2 2011-2574 Triple I - Integration, Interaction and Institutions scholarship.
Keyword: Body-part noun; Disease noun; Domínio/Área Científica::Ciências Sociais::Ciências da Comunicação; Domínio/Área Científica::Humanidades::Outras Humanidades; Meronímia; Meronymy; Nome de doença; Nome parte-do-corpo; Português; Portuguese; Relação todo-parte; Whole-part relation
URL: http://hdl.handle.net/10400.1/8438
BASE
Hide details
18
ASR-based exercises for listening comprehension practice in European Portuguese
In: Computer speech and language. - Amsterdam [u.a.] : Elsevier 27 (2013) 5, 1127-1142
OLC Linguistik
Show details
19
Syntactic REAP.PT: Exercises on Clitic Pronouning
Baptista, Jorge; Freitas, Tiago; Mamede, Nuno. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik, 2013. : OASIcs - OpenAccess Series in Informatics. 2nd Symposium on Languages, Applications and Technologies, 2013
BASE
Show details
20
Syntactic REAP.PT: Exercises on Clitic Pronouning ...
Freitas, Tiago; Baptista, Jorge; Mamede, Nuno. - : Schloss Dagstuhl - Leibniz-Zentrum fuer Informatik GmbH, Wadern/Saarbruecken, Germany, 2013
BASE
Show details

Page: 1 2

Catalogues
2
0
3
0
0
0
0
Bibliographies
3
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
23
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern