serhii.net

In the middle of the desert you can say anything you want

26 Dec 2023

Ideas for annotating glosses in my Masterarbeit

Current best:

eng: the manNOM.SG saw the dogNOM.SG
ukr: чоловікman-NOM.SG побачивsaw-PST собакydog-ACC.SG

Ideas

I’d love to integrate the usual UD feats bits but they take a lot of space, and it’s either latex magic or one word per line.

  • ukr: чоловік(man): Case=Nom|Number=Sing побачив(saw) собакy(dog): Case=Acc|Number=Sing

  • $чоловік^{man}_{Case=Nom|Number=Sing}$

  • ${\underset{man}{чоловік}}^{Case=Nom|Number=Sing}$

  • $\underset{Case=Nom|Number=Sing}{чоловік^{man}}$

  • $\underset{NOM.SG}{чоловік^{man}}$

  • ${\underset{man}{чоловік}}^{Case=Nom|Number=Sing}$

  • ${\underset{man}{чоловік}}^{NOM.SG}$

  • ${\underset{man}{чоловік}}^{NOM.SG}$ ${\underset{saw}{побачив}}$ ${\underset{dog}{собаку}}^{GEN.PL}$

я I Case=Nom|Number=Sing
побачив saw
собаку saw  Animacy=Anim|Case=Acc|Gender=Masc|Number=Sing

ukr: чоловікman-NOM.SG побачивsaw-PST собакydog-GEN.PL

${\underset{man}{чоловік}}$ Case=Nom|Number=Sing ${\underset{man}{чоловік}}$ Case=Nom|Number=Sing

I think this is cool! But hell to write and parse:

$\underset{\text{NOUN.NOM}}{\overset{\text{man}}{\text{чоловік-}\varnothing}}$ $\underset{\text{PST}}{\overset{\text{saw}}{\text{побачив}}}$ $\underset{\text{NOUN-ACC}}{\overset{\text{dog}}{\text{собак-у}}}$.

$\underset{\text{NOUN.NOM}}{\overset{\text{man}}{\text{чоловік-}\varnothing}}$ $\underset{\text{PST}}{\overset{\text{saw}}{\text{побачив}}}$ $\underset{\text{NOUN-ACC}}{\overset{\text{dog}}{\text{собак-у}}}$.

Let’s play more with it:

$\underset{\text{Case=Nom|Number=Sing}}{\overset{\text{man }}{\text{чоловік}}}$ $\underset{\text{}}{\overset{\text{saw}}{\text{побачив}}}$ $\underset{\text{Case=Acc|Number=Sing}}{\overset{\text{dog}}{\text{собаку}}}$.

I can split it in diff lines: $\underset{\text{Case=Nom|Number=Sing}}{\overset{\text{man }}{\text{чоловік}}} \underset{\text{}}{\overset{\text{saw}}{\text{побачив}}} \underset{\text{Case=Acc|Number=Sing}}{\overset{\text{dog}}{\text{собаку}}}$.

$$\underset{\text{Case=Nom|Number=Sing}}{\overset{\text{man }}{\text{ЧОЛОВІК}}} \underset{\text{}}{\overset{\text{saw}}{\text{ПОБАЧИВ}}} \underset{\text{Case=Acc|Number=Sing}}{\overset{\text{dog}}{\text{СОБАКУ}}}$$

Splitting by morphemes

ukr: використовуватимуться Aspect=Imp|Number=Plur|Person=3

1 використовуватимуться використовуватися VERB _ Aspect=Imp|Mood=Ind|Number=Plur|Person=3|Tense=Fut|VerbForm=Fin 0 root _ SpaceAfter=No

ukr: використовуватимуть-сяVERB-REFL

ukr: використовуватимутьVERB -сяREFL

$\underset{\text{NOM.SG}}{\overset{\text{man }}{\text{чоловік}}}$ $\underset{\text{PST}}{\overset{\text{saw}}{\text{побачив}}}$ $\underset{\text{SG-ACC}}{\overset{\text{dog}}{\text{собак-у}}}$.

Nel mezzo del deserto posso dire tutto quello che voglio.