DE eng

Search in the Catalogues and Directories

Hits 1 – 16 of 16

1
Evaluating semantic textual similarity in clinical sentences using deep learning and sentence embeddings
Antunes, Rui; Silva, João Figueira; Matos, Sérgio. - : Association for Computing Machinery, 2020
BASE
Show details
2
Statistical Complexity Analysis of Turing Machine tapes with Fixed Algorithmic Complexity Using the Best-Order Markov Model
In: Entropy (Basel) (2020)
BASE
Show details
3
Understanding Depression from Psycholinguistic Patterns in Social Media Texts
BASE
Show details
4
Historiografia e Res Publica nos últimos dois séculos
Matos, Sérgio Campos; João, Maria Isabel. - : Centro de História da Universidade de Lisboa, 2018
BASE
Show details
5
Introdução
Matos, Sérgio Campos; João, Maria Isabel. - : Centro de História da Universidade de Lisboa, 2018
BASE
Show details
6
Biomedical word sense disambiguation with word embeddings
Antunes, Rui; Matos, Sérgio. - : Springer, 2017
BASE
Show details
7
Evaluation of word embedding vector averaging functions for biomedical word sense disambiguation
Antunes, Rui; Matos, Sérgio. - : UA Editora, 2017
BASE
Show details
8
Overview of the interactive task in BioCreative V
In: ISSN: 1758-0463 ; EISSN: 1758-0463 ; Database - The journal of Biological Databases and Curation ; https://hal.archives-ouvertes.fr/hal-01469079 ; Database - The journal of Biological Databases and Curation, Oxford University Press, 2016, 2016, ⟨10.1093/database/baw119⟩ ; https://academic.oup.com/database/article-lookup/doi/10.1093/database/baw119 (2016)
BASE
Show details
9
The CHEMDNER corpus of chemicals and drugs and its annotation principles
Krallinger, Martin; Rabal, Obdulia; Leitner, Florian. - : BioMed Central, 2015
BASE
Show details
10
An Overview of Biomolecular Event Extraction from Scientific Documents
Vanegas, Jorge A.; Matos, Sérgio; González, Fabio. - : Hindawi Publishing Corporation, 2015
BASE
Show details
11
Mining biomedical information from scientific literature ; Mineração de informação biomédica a partir de literatura científica
Campos, David Emmanuel Marques. - : Universidade de Aveiro, 2013
Abstract: Doutoramento conjunto MAP-i ; The rapid evolution and proliferation of a world-wide computerized network, the Internet, resulted in an overwhelming and constantly growing amount of publicly available data and information, a fact that was also verified in biomedicine. However, the lack of structure of textual data inhibits its direct processing by computational solutions. Information extraction is the task of text mining that intends to automatically collect information from unstructured text data sources. The goal of the work described in this thesis was to build innovative solutions for biomedical information extraction from scientific literature, through the development of simple software artifacts for developers and biocurators, delivering more accurate, usable and faster results. We started by tackling named entity recognition - a crucial initial task - with the development of Gimli, a machine-learning-based solution that follows an incremental approach to optimize extracted linguistic characteristics for each concept type. Afterwards, Totum was built to harmonize concept names provided by heterogeneous systems, delivering a robust solution with improved performance results. Such approach takes advantage of heterogenous corpora to deliver cross-corpus harmonization that is not constrained to specific characteristics. Since previous solutions do not provide links to knowledge bases, Neji was built to streamline the development of complex and custom solutions for biomedical concept name recognition and normalization. This was achieved through a modular and flexible framework focused on speed and performance, integrating a large amount of processing modules optimized for the biomedical domain. To offer on-demand heterogenous biomedical concept identification, we developed BeCAS, a web application, service and widget. We also tackled relation mining by developing TrigNER, a machine-learning-based solution for biomedical event trigger recognition, which applies an automatic algorithm to obtain the best linguistic features and model parameters for each event type. Finally, in order to assist biocurators, Egas was developed to support rapid, interactive and real-time collaborative curation of biomedical documents, through manual and automatic in-line annotation of concepts and relations. Overall, the research work presented in this thesis contributed to a more accurate update of current biomedical knowledge bases, towards improved hypothesis generation and knowledge discovery. ; A rápida evolução e proliferação de uma rede mundial de computadores, a Internet, resultou num esmagador e constante crescimento na quantidade de dados e informação publicamente disponíveis, o que também se verificou na biomedicina. No entanto, a inexistência de estrutura em dados textuais inibe o seu processamento direto por parte de soluções informatizadas. Extração de informação é a tarefa de mineração de texto que pretende extrair automaticamente informação de fontes de dados de texto não estruturados. O objetivo do trabalho descrito nesta tese foi essencialmente focado em construir soluções inovadoras para extração de informação biomédica a partir da literatura científica, através do desenvolvimento de aplicações simples de usar por programadores e bio-curadores, capazes de fornecer resultados mais precisos, usáveis e de forma mais rápida. Começámos por abordar o reconhecimento de nomes de conceitos - uma tarefa inicial e fundamental - com o desenvolvimento de Gimli, uma solução baseada em inteligência artificial que aplica uma estratégia incremental para otimizar as características linguísticas extraídas do texto para cada tipo de conceito. Posteriormente, Totum foi implementado para harmonizar nomes de conceitos provenientes de sistemas heterogéneos, oferecendo uma solução mais robusta e com melhores resultados. Esta aproximação recorre a informação contida em corpora heterogéneos para disponibilizar uma solução não restrita às característica de um único corpus. Uma vez que as soluções anteriores não oferecem ligação dos nomes a bases de conhecimento, Neji foi construído para facilitar o desenvolvimento de soluções complexas e personalizadas para o reconhecimento de conceitos nomeados e respectiva normalização. Isto foi conseguido através de uma plataforma modular e flexível focada em rapidez e desempenho, integrando um vasto conjunto de módulos de processamento optimizados para o domínio biomédico. De forma a disponibilizar identificação de conceitos biomédicos em tempo real, BeCAS foi desenvolvido para oferecer um serviço, aplicação e widget Web. A extracção de relações entre conceitos também foi abordada através do desenvolvimento de TrigNER, uma solução baseada em inteligência artificial para o reconhecimento de palavras que desencadeiam a ocorrência de eventos biomédicos. Esta ferramenta aplica um algoritmo automático para encontrar as melhores características linguísticas e parâmetros para cada tipo de evento. Finalmente, de forma a auxiliar o trabalho de bio-curadores, Egas foi desenvolvido para suportar a anotação rápida, interactiva e colaborativa em tempo real de documentos biomédicos, através da anotação manual e automática de conceitos e relações de forma contextualizada. Resumindo, este trabalho contribuiu para a actualização mais precisa das actuais bases de conhecimento, auxiliando a formulação de hipóteses e a descoberta de novo conhecimento.
Keyword: Bioinformática; Bioinformatics; Concept recognition; Engenharia electrónica; Information extraction; Interactive mining; Literatura científica; Recuperação da informação; Relation mining; Sistemas de informação médica; Text mining
URL: http://hdl.handle.net/10773/12853
BASE
Hide details
12
Benchmarking of the 2010 BioCreative Challenge III text-mining competition by the BioGRID and MINT interaction databases
In: Krallinger, Martin; Vazquez, Miguel; Leitner, Florian; Salgado, David; Chatr-aryamontri, Andrew; Winter, Andrew; et al.(2011). Benchmarking of the 2010 BioCreative Challenge III text-mining competition by the BioGRID and MINT interaction databases. BMC Bioinformatics, 12(Suppl 8), S3. doi: http://dx.doi.org/10.1186/1471-2105-12-S8-S3. Retrieved from: http://www.escholarship.org/uc/item/44z3n3v1 (2011)
BASE
Show details
13
The Protein-Protein Interaction tasks of BioCreative III: classification/ranking of articles and linking bio-ontology concepts to full text
In: ISSN: 1471-2105 ; BMC Bioinformatics ; https://hal.archives-ouvertes.fr/hal-01780325 ; BMC Bioinformatics, BioMed Central, 2011, 12 (Suppl 8), ⟨10.1186/1471-2105-12-S8-S3⟩ (2011)
BASE
Show details
14
Corpógrafo and NooJ: using linguistic resources to obtain aligned concordances from corpora
BASE
Show details
15
Interpretações temporais de sintagmas com a preposição Em
In: http://aleph.letras.up.pt/F?func=find-b&find_code=SYS&request=000145509 (1998)
BASE
Show details
16
Linguística e informática : perspectivas recentes do computador em linguística aplicada e descritiva
In: http://aleph.letras.up.pt/F?func=find-b&find_code=SYS&request=000189478 (1989)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
0
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
16
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern