Fix before version 1.0

From Icelandic Parsed Historical Corpus (IcePaHC)
Revision as of 20:34, 29 September 2011 by Einarfs (Talk | contribs) (bad-argument.q)

Jump to: navigation, search

Below are errors found in v0.9 that need to be dealt with.

Sanity checks

bad-advp.q

(ADVP* idoms ADV) AND (ADVP* idoms RP)

Fix: En þeir Pálnatóki og Sveinn röru út eftir (1260.JOMSVIKINGAR.NAR-SAG,.1358)

Þegar þing$ $inu sleit og þeir feðgar fóru heimleiðis heyrða ég getið eftir þeim skyggnu að líka hefði sést þar merki til að djöflagangur$ $inn hefði þá inn eftir sveimað og sést hefði (1659.PISLARSAGA.BIO-AUT,.259)

og fékk sá er þar upp á vakta skyldi sléttar þakkir fyrir umhirðing sína .-. (1791.JONSTEINGRIMS.BIO-AUT,139.1108)

ég skal reyna að staulast með þér fram eftir ,-, ef þú vilt .-. (1850.PILTUR.NAR-FIC,.1252)

maddama góð ,-, ég dróst hingað fram eftir með honum Guðmundi mínum ,-, rétt að gamni mínu ,-, (1850.PILTUR.NAR-FIC,.1356)

Við glugga þar rétt uppi yfir sat Ragnheiður litla ,-, dóttir biskups ,-, (1882.TORFHILDUR.NAR-FIC,.1444)

(PP (P Við-við)
    (NP (N-A glugga-gluggi)
        (ADVP (ADV þar-þar) (ADV rétt-rétt) (ADV uppi-uppi) (RP yfir-yfir))))

svo aftur varð ungu mönnu$ $num í dal$ $num ,-, að líta löngum augum upp eftir til hans Brands á Fossi .-. (1902.FOSSAR.NAR-FIC,.11)

Vegur$ $inn frá Grund og þangað fram er drjúgum langur ,-, (1902.FOSSAR.NAR-FIC,.866)

til þess að ræða við hann um það ,-, sem fram undan sé ,-, burtför hans úr þessum heimi ,-, er fyrir honum liggi að leiða til lykta í Jerúsalem .-. (1920.ARIN.REL-SER,.713)

og hún heimtaði að ég kæmi inn fyrir og fengi kaffi .-. (1985.MARGSAGA.NAR-FIC,.118)

og ég strauk höndu$ $num niður eftir hrygg$ $num og aftur upp (2008.MAMMA.NAR-FIC,.486)

bad-argument.q

(!IP*|VP|RRC*|FRAG iDoms *-SBJ*|*-OB[12]*)

Why is FRAG a part of this query?

This sanity check found this QTP, where the NPs were marked NP-SBJ, NP-OB1, NP-OB2. The verb gera/gjöra is probably missing but I think we can't mark these NPs as arguments without it:

Ó ,-, drottinn minn jesús kristus ,-, þakkir eg þér af öllum mætti .-. (1525.ERASMUS.NAR-SAG,.131)

This sanity check found the FS (false start) item NP-SBJ þið. According to the PPCEME guidelines, "[w]ithin a false start, internal structure is indicated as far as is feasible." However, I think this does not necessarily extend to single NPs, so I have changed FS idoms NP-SBJ to FS idoms NP.

Hvort þið ætlið þið að ég muni að heldur vilja trúa á þann krossfesta Cristum er þessi maður boðar af .-. (1525.GEORGIUS.NAR-REL,.1032)

Similarly, although this echo question clearly shows a subject and an object, the NPs cannot be tagged as arguments in the QTP.

"-" Þér beðið hennar ?-? "-" (1888.VORDRAUMUR.NAR-FIC,.444)

And although the ADJP in the following can have the dash tag -LOC (ADJP-LOC), the NP must be bare, i.e. cannot be NP-SBJ:

Skratt$ $inn fjarri mér .-. (1908.OFUREFLI.NAR-FIC,.852)

The NP in the following heading/title is obviously a subject, but still it must be parsed as NP but not NP-SBJ.

Konu saknað (1985.MARGSAGA.NAR-FIC,.708)

Another internal structure of QTP I changed (NP-OB1 > NP; NP-SBJ > NP):

- Bara ,-, Ekkert ,-, Við Tómas .-. (2008.MAMMA.NAR-FIC,.1459)

Adverbs, particles or ...

1. Fram in fram og aftur and aftur og fram is usually tagged as RP. Is that the right way? (Similarly, I changed niður from RP to ADV in the ADVP norður og niður.)

2. There is a lot of inconsistency in how we parse hér inn, hér inni, þar inn, þar inni. Sometimes these are parsed as ADVP (hér, þar) idominated by PP (inn(i)); sometimes ADVP iprecedes RP. How do we do this?

3. How do we parse fram hjá einhverjum (hann fór fram hjá mér) and fram hjá (hann fór fram hjá)? Similar problem is fram undan.

Various inconsistencies

Það fyrst as in:

Það fyrst að þér megi þetta ekki í hug vera er þú ert fulltíða. (1400.viglundur.352)
En það hið þriðja að fyrir má bíta að ég sé mín eigi ráðandi (1400.viglundur.356)