10.06.2019 - Seminarium Instytutowe - godz. 13:00,

Laure Petrucci (Uniwersytet Paryż 13) 

Streszczenie (autorskie):

This paper considers the consistency problem for Parametric Interval Markov Chains. In particular, we introduce a co-inductive definition of consistency, which improves and simplifies previous inductive definitions considerably. The equivalence of the inductive and co-inductive definitions has been formally proved in the interactive theorem prover PVS. These definitions lead to forward and backward algorithms, respectively, for synthesizing an expression for all parameters for which a given PIMC is consistent. We give new complexity results when tackling the consistency problem for IMCs (i.e. without parameters). We provide a sharper upper bound, based on the longest simple path in the IMC. The algorithms are also optimized, using different techniques (dynamic programming cache, polyhedra representation, etc.). They are evaluated on a prototype implementation. For parameter synthesis, we use Constraint Logic Programming and the PARMA library for convex polyhedra.
Praca we współatorstwie z Jaco van de Pol (University of Twente)

15.04.2019 - Seminarium Instytutowe oraz "Przetwarzania Języka Naturalnego" - godz. 13:00, Piotr Rybak i Alina Wróblewska (IPI PAN) 

2019041 Wroblewska

Streszczenie autorskie:
Parsowanie zależnościowe jest kluczowym problemem w zaawansowanych zdaniach NLP. Struktura predykatywno-argumentowa zakodowana w strukturach zależnościowych może wspierać tłumaczenie maszynowe, odpowiadanie na pytania, analizę wydźwięku itp. W prezentacji przedstawimy PDB – największy bank drzew zależnościowych dla języka polskiego, oraz COMBO – niezależny od języka system neuronowy do taggowania, analizy morfologicznej, lematyzacji i parsowania zależnościowego.

Abstract:
Dependency parsing is a crucial issue in various NLP tasks. The predicate-argument structure transparently encoded in dependency-based syntactic representations may support machine translation, question answering, sentiment analysis, etc. In the talk, we will present PDB – the largest dependency treebank for Polish, and COMBO – a language-independent neural system for part-of-speech tagging, morphological analysis, lemmatisation and dependency parsing.

01.04.2019 - Seminarium Instytutowe - godz. 13:00,

Agata Dziedzic, Marta Jardanowska (IPI PAN) 

Streszczenie (autorskie):

Transcription factors (TF) regulate gene expression. TF binding affinity to its DNA motif might be affected by the methylation level of cytosines within that motif. The aim of this study was to verify the hypothesis that TFs would bind more likely to the hypomethylated motifs than to hypermethylated ones. This analysis was done with respect to glioma (brain tumour) grade: pilocytic astrocytoma (PA; grade I), diffuse astrocytoma (DA; grades II and III) and glioblastoma (GB; grade IV) from the Polish patients' samples. Firstly 283 transcription factors motifs in enhancers (distal regulatory regions) were identified and then the level of their methylation was calculated. As a result, some specific regulatory path is proposed that might be responsible for modulating the level of gene expression. This part of the analysis is also a first step for finding very specific genome modification responsible for glioma development. If so, selected DNA modifications would have to be validated by in vitro experiments in the future.

25.03.2019 - Seminarium Instytutowe - godz. 13:00,

Tomasz Steifer (IPPT PAN) 

Streszczenie (autorskie):

W czasie referatu zostaną przedstawione częściowe wyniki z przygotowywanej rozprawy doktorskiej, której tematem jest efektywna predykcja. Przez predykcję rozumie się tu działanie pewnej całkowitej obliczalnej funkcji, przyjmującej jako argument słowo binarne i zwracającej 0 lub 1. O predyktorze można myśleć jako o algorytmie zgadywania przyszłego zdarzenia na podstawie informacji o przeszłych zdarzeniach. W szczególności, interesować będzie autorów asymptotyczne zachowanie błędu predykcji rozumianego jako odległość Hamminga między prefiksami ciągu, który autorzy starają się przewidzieć, a odpowiedziami predyktora.

Na początku zostanie rozważona predykcja ograniczona do indywidualnych ciągów (przypadek deterministyczny). Zostanie przedstawionych kilka wyników dotyczących istnienia ciągów binarnych dla których:

  1. dowolny predyktor nie ma granicy błędów,
  2. każdy predyktor ma granicę błędów równą 1/2 i
  3. nie istnieje predyktor optymalny.

Z punktu widzenia teorii obliczeń szczególnie interesujące są ciągi rekurencyjnie przeliczalne. Tam gdzie jest to możliwe, zostanie przedstawiona odpowiedź na pytanie o istnienie rekurencyjnie przeliczalnych ciągów o zadanych własnościach asymptotycznych predykcji. Na koniec zostanie zarysowana problematyka predykcji dla binarnych procesów stochastycznych (przypadek niedeterministyczny), ze szczególnym uwzględnieniem kontekstu algorytmicznej teorii losowości. Krótko zostanie przedstawione pojęcie losowości w sensie Martina-Loefa i zarysowane otwarte problemy związane z predykcją ciągów algorytmicznie losowych.

18.03.2019 - Seminarium Instytutowe - godz. 13:00,

Michał Dramiński, Adam Filip i Michał J. Dąbrowski (IPI PAN) 

Streszczenie (autorskie):

MCFS-ID (Monte Carlo Feature Selection and Interdependency Discovery) is a Monte Carlo method-based algorithm for feature selection. It returns a ranked list of informative features, and thus play a significant role in the classification of objects that belong to different classes. This is achieved through constructing thousands of decision trees. MCFS-ID also allows for the discovery of interdependencies between the features, visualized as a directed graph of the pairwise interdependencies found. The discovered interdependencies thus provide a basis for making causal hypotheses to be verified using background knowledge. MCFS-ID algorithm is publicly available as the R package - rmcfs. This tool was successfully applied in many classification problems, among them on the Cancer Genome Atlas dataset consisting of various molecular information: protein coding gene expression levels (mRNA), microRNA expression levels (miRNA) and DNA methylation status (HumanMethylation450), in order to define prognostic markers for Breast Invasive Carcinoma (BRCA).Each object in the dataset is thus described by over half million of features, a vast majority of them unrelated or next to unrelated to the problem under study. It will be shown that the algorithm returns truly significant features, i.e., features of importance in biological cancer-related pathways as well as unveils true interdependencies between different molecular characteristics.
Prezentują: Michał Dramiński, Adam Filip


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności