Přednáška 2. listopadu 2023 (Praha)

Aktuality Přednáška

Můžete se těšit na přednášku

PhDr. Šárky Zikánové, Ph.D.

Individuální porozumění jazyku jako výzva pro počítačovou lingvistiku

V současné době jsme svědky prudkého nárůstu množství dostupných digitálních jazykových zdrojů, jejichž značkování se zaměřuje na nejrůznější jazykové jevy (lemmatizace, morfologie, syntax, pojmenované entity, typy chyb, rétorická struktura textu ad.). I když se část značkovacích procesů provádí automaticky, je podstatnou složkou značkování také interpretace prováděná lidmi, např. pro kontrolu automatických procesů.

Při vytváření ručního značkování bylo dosud v počítačové lingvistice obvyklé usilovat o tzv. zlatý standard, tedy vytvořit na základě několika variant značkování od více lidí jeden značkovací koncept, který je vnímán jako základní. Tento zlatý standard pak slouží jako referenční data pro další zpracování textů. Jednota ve značkování (tzv. míra mezianotátorské shody) se také pojímá jako odraz kvality dat – čím více se anotátoři shodují, tím se značkování považuje za lepší.

V konkrétních značkovacích úkolech zejména na vyšších jazykových rovinách se však čím dál častěji ukazuje, že je obtížné dosáhnout vysoké míry mezianotátorské shody. Jednou z příčin těchto obtíží je individuální porozumění jazyku u jednotlivých anotátorů. Variabilita možných – a plně oprávněných – interpretací znesnadňuje stanovení zlatého standardu, což má podstatné metodologické důsledky pro řadu úkolů počítačové lingvistiky. Otevírá se tu prostor pro přehodnocení konceptu standardních dat; důležité impulsy pro počítačovou lingvistiku v tomto kontextu pak přináší psycholingvistika.

Prezentaci k přednášce najdete Záznamech přednášek.

Přednáška se koná v místnosti č. 18 na F UK, nám. Jana Palacha 2, Praha 1, od 17.30 hod.

JS