Fix before version 1.0

From Icelandic Parsed Historical Corpus (IcePaHC)
Revision as of 11:55, 28 September 2011 by Einarfs (Talk | contribs)

Jump to: navigation, search

Below are errors found in v0.9 that need to be dealt with.

A. Sanity checks

1. (ADVP* idoms ADV) AND (ADVP* idoms RP)

Fix: En þeir Pálnatóki og Sveinn röru út eftir (1260.JOMSVIKINGAR.NAR-SAG,.1358)

Þegar þing$ $inu sleit og þeir feðgar fóru heimleiðis heyrða ég getið eftir þeim skyggnu að líka hefði sést þar merki til að djöflagangur$ $inn hefði þá inn eftir sveimað og sést hefði (1659.PISLARSAGA.BIO-AUT,.259)

og fékk sá er þar upp á vakta skyldi sléttar þakkir fyrir umhirðing sína .-. (1791.JONSTEINGRIMS.BIO-AUT,139.1108)

ég skal reyna að staulast með þér fram eftir ,-, ef þú vilt .-. (1850.PILTUR.NAR-FIC,.1252)

maddama góð ,-, ég dróst hingað fram eftir með honum Guðmundi mínum ,-, rétt að gamni mínu ,-, (1850.PILTUR.NAR-FIC,.1356)

Við glugga þar rétt uppi yfir sat Ragnheiður litla ,-, dóttir biskups ,-, (1882.TORFHILDUR.NAR-FIC,.1444)

(PP (P Við-við)
    (NP (N-A glugga-gluggi)
        (ADVP (ADV þar-þar) (ADV rétt-rétt) (ADV uppi-uppi) (RP yfir-yfir))))

svo aftur varð ungu mönnu$ $num í dal$ $num ,-, að líta löngum augum upp eftir til hans Brands á Fossi .-. (1902.FOSSAR.NAR-FIC,.11)

B. Adverbs, particles or ...

1. Fram in fram og aftur and aftur og fram is usually tagged as RP. Is that the right way? (Similarly, I changed niður from RP to ADV in the ADVP norður og niður.)

2. There is a lot of inconsistency in how we parse hér inn, hér inni, þar inn, þar inni. Sometimes these are parsed as ADVP (hér, þar) idominated by PP (inn(i)); sometimes ADVP iprecedes RP. How do we do this?

3. How do we parse fram hjá einhverjum (hann fór fram hjá mér) and fram hjá (hann fór fram hjá)?

4.