udapi.block.ud.cs.fixedeprels module¶
Block to fix case-enhanced dependency relations in Czech.
- class udapi.block.ud.cs.fixedeprels.FixEdeprels(zones='all', if_empty_tree='process', **kwargs)[source]¶
Bases:
Block- static compose_edeprel(bdeprel, cdeprel)[source]¶
Composes enhanced deprel from the basic part and optional case enhancement.
Parameters¶
- bdeprelstr
Basic deprel (can include subtype, e.g., ‘acl:relcl’).
- cdeprelTYPE
Case enhancement (can be composed of adposition and morphological case, e.g., ‘k:dat’). It is optional and it can be None or empty string if there is no case enhancement.
Returns¶
Full enhanced deprel (str).
- copy_case_from_adposition(node, adposition)[source]¶
In some treebanks, adpositions have the Case feature and it denotes the valency case that the preposition’s nominal must be in.
- outermost = {'aby': [], 'ač': [], 'ačkoli': [], 'ačkoliv': [], 'ať': [], 'byť': [], 'i_když': [], 'jak': [], 'jakkoli': [], 'jako': [], 'jakoby': ['jakoby_pod:ins'], 'když': [], 'než': ['než_aby'], 'nežli': [], 'pokud': [], 'protože': [], 'takže': [], 'třebaže': [], 'že': []}¶
- process_tree(tree)[source]¶
Occasionally the edeprels automatically derived from the Czech basic trees do not match the whitelist. For example, the noun is an abbreviation and its morphological case is unknown.
We cannot use the process_node() method because it ignores empty nodes.
- set_basic_and_enhanced(node, parent, deprel, edeprel)[source]¶
Modifies the incoming relation of a node both in the basic tree and in the enhanced graph. If the node does not yet depend in the enhanced graph on the current basic parent, the new relation will be added without removing any old one. If the node already depends multiple times on the current basic parent in the enhanced graph, all such enhanced relations will be removed before adding the new one.
- unambiguous = {'abi': 'aby', 'aby_na': 'na:loc', 'ačkoliv': 'ačkoli', 'ať': 'ať', 'ať_forma': 'formou:gen', 'ať_jako': 'jako', 'ať_na': 'na:loc', 'ať_s': 's:ins', 'ať_v': 'v:loc', 'ať_v_oblast': 'v_oblasti:gen', 'ať_z': 'z:gen', 'ať_z_hledisko': 'z_hlediska:gen', 'ať_z_strana': 'ze_strany:gen', 'až_do': 'do:gen', 'až_o': 'o:acc', 'bez': 'bez:gen', 'bez_na': 'bez_ohledu_na:acc', 'bez_ohled_na': 'bez_ohledu_na:acc', 'bez_zřetel_k': 'bez_zřetele_k:dat', 'bez_zřetel_na': 'bez_zřetele_na:acc', 'blízko': 'blízko:dat', 'blízko_k': 'blízko:dat', 'blíž': 'blízko:dat', 'blíže': 'blízko:dat', 'bok_po_bok_s': 'bok_po_boku_s:ins', 'během': 'během:gen', 'cesta': 'cestou:gen', 'co_jako': 'jako', 'coby': 'coby', 'daleko': 'nedaleko:gen', 'daleko_od': 'od:gen', 'dle': 'dle:gen', 'do': 'do:gen', 'do_k': 'k:dat', 'do_oblast': 'do_oblasti:gen', 'do_rozpor_s': 'do_rozporu_s:ins', 'do_ruka': 'do_rukou:gen', 'do_soulad_s': 'do_souladu_s:ins', 'do_čelo': 'do_čela:gen', 'dík': 'díky:dat', 'díky': 'díky:dat', 'důsledkem': 'v_důsledku:gen', 'forma': 'formou:gen', 'formou': 'formou:gen', 'hledět_na': 'nehledě_na:acc', 'i_když': 'i_když', 'i_pro': 'pro:acc', 'jak_aby': 'jak', 'jak_ad': 'jak', 'jakkoliv': 'jakkoli', 'jako': 'jako', 'jako_kupříkladu': 'jako', 'jakoby': 'jako', 'jakoby_pod': 'pod:ins', 'jakožto': 'jako', 'jelikož_do': 'jelikož', 'jenom': 'jen', 'jesli': 'jestli', 'jestli_že': 'jestliže', 'jménem': 'jménem:gen', 'k': 'k:dat', 'k_konec': 'ke_konci:gen', 'k_prospěch': 'ku_prospěchu:gen', 'kdykoliv': 'kdykoli', 'kol': 'kolem:gen', 'kolem': 'kolem:gen', 'kolem_dokola': 'kolem:gen', 'koncem': 'koncem:gen', 'konec': 'koncem:gen', 'krom': 'kromě:gen', 'kromě': 'kromě:gen', 'kvůli': 'kvůli:dat', 'leda_když': 'ledaže', 'li_jako': 'li', 'liž': 'li', 'mezi_uvnitř': 'uvnitř:gen', 'na:ins': 'na:acc', 'na_báze': 'na_bázi:gen', 'na_mimo': 'na:loc', 'na_než': 'na:acc', 'na_od': 'na_rozdíl_od:gen', 'na_podklad': 'na_podkladě:gen', 'na_počest': 'na_počest:gen', 'na_počátek': 'na_počátku:gen', 'na_rozdíl_od': 'na_rozdíl_od:gen', 'na_strana': 'na_straně:gen', 'na_začátek': 'na_začátku:gen', 'na_zda': 'na:loc', 'na_základ': 'na_základě:gen', 'na_základna': 'na_základně:gen', 'na_závěr': 'na_závěr:gen', 'na_újma': 'gen', 'na_úroveň': 'na_úrovni:gen', 'na_úroveň_okolo': 'na_úrovni:gen', 'na_úsek': 'na_úseku:gen', 'na_účet': 'na_účet:gen', 'na_čelo': 'na_čele:gen', 'namísto': 'namísto:gen', 'namísto_do': 'do:gen', 'napospas': 'napospas:dat', 'narozdíl_od': 'na_rozdíl_od:gen', 'navzdory': 'navzdory:dat', 'nedaleko': 'nedaleko:gen', 'než': 'než', 'nežli': 'nežli', 'následek': 'následkem:gen', 'o_jako': 'jako', 'o_o': 'o:acc', 'od': 'od:gen', 'od_počínaje': 'počínaje:ins', 'ohledně': 'ohledně:gen', 'okolo': 'okolo:gen', 'oproti': 'oproti:dat', 'po_bok': 'po_boku:gen', 'po_doba': 'po_dobu:gen', 'po_stránka': 'po_stránce:gen', 'po_v': 'po:loc', 'po_vzor': 'po_vzoru:gen', 'poblíž': 'poblíž:gen', 'pod_dojem': 'pod_dojmem:gen', 'pod_tlak': 'pod_tlakem:gen', 'pod_vliv': 'pod_vlivem:gen', 'pod_záminka': 'pod_záminkou:gen', 'pod_záminka_že': 'pod_záminkou_že', 'podle': 'podle:gen', 'podél': 'podél:gen', 'pomoc': 'pomocí:gen', 'pomocí': 'pomocí:gen', 'postup': 'postupem:gen', 'pouze_v': 'v:loc', 'počátek': 'počátkem:gen', 'počátkem': 'počátkem:gen', 'počínaje': 'počínaje:ins', 'počínat': 'počínaje:ins', 'počínat_od': 'počínaje:ins', 'pro': 'pro:acc', 'pro_aby': 'pro:acc', 'prostřednictví': 'prostřednictvím:gen', 'prostřednictvím': 'prostřednictvím:gen', 'proti': 'proti:dat', 'proto_aby': 'aby', 'protože': 'protože', 'před_během': 'během:gen', 'před_po': 'po:loc', 'přes': 'přes:acc', 'přes_přes': 'přes:acc', 'přestože': 'přestože', 'při': 'při:loc', 'při_pro': 'při:loc', 'při_příležitost': 'při_příležitosti:gen', 'ruka_v_ruka_s': 'ruku_v_ruce_s:ins', 's_cíl': 's_cílem', 's_ohled_k': 's_ohledem_k:dat', 's_ohled_na': 's_ohledem_na:acc', 's_pomoc': 's_pomocí:gen', 's_postup': 'postupem:gen', 's_přihlédnutí_k': 's_přihlédnutím_k:dat', 's_přihlédnutí_na': 's_přihlédnutím_na:acc', 's_vyloučení': 's_vyloučením:gen', 's_výjimka': 's_výjimkou:gen', 's_výjimka_z': 's_výjimkou:gen', 's_výjimka_že': 's_výjimkou_že', 's_zřetel_k': 'se_zřetelem_k:dat', 's_zřetel_na': 'se_zřetelem_na:acc', 'severně_od': 'od:gen', 'skrz': 'skrz:acc', 'směr_do': 'směrem_do:gen', 'směr_k': 'směrem_k:dat', 'směr_na': 'směrem_na:acc', 'směr_od': 'směrem_od:gen', 'směr_přes': 'směrem_přes:acc', 'směr_z': 'směrem_z:gen', 'společně_s': 'společně_s:ins', 'spolu': 'spolu_s:ins', 'spolu_s': 'spolu_s:ins', 'spolu_se': 'spolu_s:ins', 'stranou': 'stranou:gen', 'stranou_od': 'stranou:gen', 'takže': 'takže', 'takže_a': 'takže', 'tvář_v_tvář': 'tváří_v_tvář:dat', 'třebaže': 'třebaže', 'u': 'u:gen', 'u_příležitost': 'u_příležitosti:gen', 'uprostřed': 'uprostřed:gen', 'uvnitř': 'uvnitř:gen', 'v:ins': 'v:loc', 'v_analogie_s': 'v_analogii_s:ins', 'v_blízkost': 'v_blízkosti:gen', 'v_doba': 'v_době:gen', 'v_dohoda_s': 'v_dohodě_s:ins', 'v_duch': 'v_duchu:gen', 'v_důsledek': 'v_důsledku:gen', 'v_forma': 've_formě:gen', 'v_jméno': 've_jménu:gen', 'v_k': 'k:dat', 'v_kombinace_s': 'v_kombinaci_s:ins', 'v_konfrontace_s': 'v_konfrontaci_s:ins', 'v_kontext_s': 'v_kontextu_s:ins', 'v_na': 'na:loc', 'v_neprospěch': 'v_neprospěch:gen', 'v_oblast': 'v_oblasti:gen', 'v_oblast_s': 's:ins', 'v_obor': 'v_oboru:gen', 'v_otázka': 'v_otázce:gen', 'v_podoba': 'v_podobě:gen', 'v_poměr_k': 'v_poměru_k:dat', 'v_porovnání_s': 'v_porovnání_s:ins', 'v_proces': 'v_procesu:gen', 'v_prospěch': 've_prospěch:gen', 'v_protiklad_k': 'v_protikladu_k:dat', 'v_průběh': 'v_průběhu:gen', 'v_případ': 'v_případě:gen', 'v_případ_že': 'v_případě_že', 'v_reakce_na': 'v_reakci_na:acc', 'v_rozpor_s': 'v_rozporu_s:ins', 'v_rámec': 'v_rámci:gen', 'v_s_spolupráce': 've_spolupráci_s:ins', 'v_shoda_s': 've_shodě_s:ins', 'v_služba': 've_službách:gen', 'v_smysl': 've_smyslu:gen', 'v_směr': 've_směru:gen', 'v_směr_k': 've_směru_k:dat', 'v_směr_na': 've_směru_k:dat', 'v_souhlas_s': 'v_souhlasu_s:ins', 'v_soulad_s': 'v_souladu_s:ins', 'v_souvislost_s': 'v_souvislosti_s:ins', 'v_součinnost_s': 'v_součinnosti_s:ins', 'v_spojení_s': 've_spojení_s:ins', 'v_spojení_se': 've_spojení_s:ins', 'v_spojený_s': 've_spojení_s:ins', 'v_spojitost_s': 've_spojitosti_s:ins', 'v_spolupráce_s': 've_spolupráci_s:ins', 'v_srovnání_s': 've_srovnání_s:ins', 'v_srovnání_se': 've_srovnání_s:ins', 'v_stav': 've_stavu:gen', 'v_stín': 've_stínu:gen', 'v_světlo': 've_světle:gen', 'v_vztah_k': 've_vztahu_k:dat', 'v_vztah_s': 've_vztahu_k:dat', 'v_věc': 've_věci:gen', 'v_znamení': 've_znamení:gen', 'v_zájem': 'v_zájmu:gen', 'v_záležitost': 'v_záležitosti:gen', 'v_závislost_na': 'v_závislosti_na:loc', 'v_závislost_s': 'v_závislosti_s:ins', 'v_závěr': 'v_závěru:gen', 'v_úroveň': 'v_úrovni:gen', 'v_čas': 'v_čase:gen', 'v_čelo': 'v_čele:gen', 'v_čelo_s': 'v_čele_s:ins', 'v_řada': 'v_řadě:gen', 'vedle': 'vedle:gen', 'versus': 'versus:nom', 'vina': 'vinou:gen', 'vliv': 'vlivem:gen', 'vlivem': 'vlivem:gen', 'vzhledem': 'vzhledem_k:dat', 'vzhledem_k': 'vzhledem_k:dat', 'výměna_za': 'výměnou_za:acc', 'včetně': 'včetně:gen', 'vůči': 'vůči:dat', 'z': 'z:gen', 'z_důvod': 'z_důvodu:gen', 'z_hledisko': 'z_hlediska:gen', 'z_nedostatek': 'z_nedostatku:gen', 'z_oblast': 'z_oblasti:gen', 'z_strana': 'ze_strany:gen', 'z_titul': 'z_titulu:gen', 'z_začátek': 'ze_začátku:gen', 'z_řada': 'z_řad:gen', 'za_pomoc': 'za_pomoci:gen', 'za_účast': 'za_účasti:gen', 'za_účel': 'za_účelem:gen', 'zatím_co': 'zatímco', 'začátek': 'začátkem:gen', 'zásluha': 'zásluhou:gen', 'závisle_na': 'nezávisle_na:loc', 'závěr': 'závěrem:gen', 'á': 'na:acc', 'že': 'že', 'že_ať': 'ať', 'že_jako': 'že', 'že_jakoby': 'že', 'že_za': 'za:gen'}¶