Corrections and discussion

From Icelandic Parsed Historical Corpus (IcePaHC)
Revision as of 03:34, 17 June 2011 by Einarfs (Talk | contribs)

Jump to: navigation, search

0.5

NP-SBJ idoms PRO and *ICH*: should probably be ES

0.4

IP-MAT idominates finite verb in subjunctive mood

Áður nefndur

að máli við föður sinn

0.3

\*P idoms ALSO (nær og)

Til móts við X: one constituent or two?

Skammt, e.g. in "skammt frá"

Vel, NP-MSR, ADV or ADVR modifying ADJ

ættaður

meira um vert, mikils um vert

hvar sem - needs coordination

sumir, sumur: ADJ/Q

lengi

velflestir

item

heldur en

umfram

til fundar við

Það var einn dag / Það var einn tíma

CONJP *ICH* when conjoining two words

WNP idoms WQ

vorkunn er á

BE * and position of BE in such cases where ambiguous (sometimes BE* in IP-INF where it shouldn't be)

RP iprecedes RP

PP-PRN

Quantifiers without case (NP-MSR)

Tvisvar, þrisvar

ADJ N ADJ (nýja postillu gamla); ADJ N ADJP (frómra manna, lærðra og leikra)

Frá ... til (NP-MSR)

VB idoms vilja

á bak aftur - needs to be coordinated

ADVP idoms two ADVs

BE* hasSister IP-PPL

0.2

Corrections and discussion needed before the release of 0.2

WQ hvort

CP-DEG vs IP-INF-DEG

fyrst um sinn: (PP (ADVR) (P ... ?

helstur: ADJ?

fara + NP

ástin ein (fp?)

IP-INF-PRP-XXX

IP-INF-PRN: shouldn't exist?

CODE kapítuli in Jón Steingrímssom

vel

ADJP-LOC (and þar nærri)

staddur

SPE-SBJ or SBJ-SPE?

ýmis

IP-INF-PRP (fór að ...)

fyrir utan

ADVP-LOC eftir

N*-* idoms *na-* (might be D-*)

check CP-DEG: svo varð uppgangssamt að ...; svo var prófastur ærlegur að ...

nær 'when'

IP-INF ipdoms NP-OB* *ICH* (before or after TO verb)

lifandi (RRC, IP-PPL, VAG ...)

KAP.-kapítuli XX.-...

Split upp þesskonar in FMR?

Coordinate alleinasta 'aðeins' in Jón Steingrímsson (as FP)

Aðalsteini konungi (thetubrot: konungi NPR or not?)

þegar er and skyld nauðsyn (theta10)

ættaður: VAN or ADJ?

Sentences

							  (NP-ADT (CONJ hvorki-hvorki)
								  (NP (ADJ-D grískum-grískur) (NS-D stöfum-stafur))
								  (CONJP (CONJ né-né)
									 (NP (N-D latínu-latína))))))))))
	  (. ,-,))
  (ID FIRSTGRAMMAR,.3))

Við not P but RP? svo sem = CP-CMP?

	  (ADVP-RSP (ADV þá-þá))
	  (HVPI hafa-hafa)
	  (NP-SBJ (PRO-N þeir-hann))
	  (PP (P við-við)
	      (NP (OTHERS-A aðra-annar)
		  (NS-A stafi-stafur)
		  (ADJP (ADVR svo-svo)
			(Q-A marga-margur)
			(CONJP (CONJ og-og)
			       (ADJX (ADJ-A þesskonar-þesskonar))))))
	  (CP-ADV (WADVP-2 0)
		  (C sem-sem)
		  (IP-SUB (ADVP *T*-2)
			  (NP-SBJ *pro*)
			  (VBPI þarf-þurfa))))
  (ID FIRSTGRAMMAR,.8))

þurfa=VB

				     (C er-er)
				     (IP-SUB (NP-SBJ (PRO-D mér-ég))
					     (VBDI þótti-þykja)
					     (IP-INF (NP-SBJ *T*-5)
						     (PP (P í-í)
							 (ADJP (ADJ þurfa-þurfa)))
						     (TO að-að)
						     (BE vera-vera)))))))
	  (. ,-,))
  (ID FIRSTGRAMMAR,.10))

NP-POS flesta alla?

		 (IP-MAT=1 (RP í-í)
			   (DAN gjörvir-gera)
			   (NP-SBJ (ADV mjög-mjög) (Q-N margir-margur))
			   (PP (P 0)
			       (NP (PRO-D því-það)
				   (CP-THT-PRN (C að-að)
					       (IP-SUB (NP-SBJ (NP-POS (PRO-N vor-vor))
							       (N-N tunga-tunga))
						       (HVPI hefir-hafa)
						       (NP-POS (QS-A flesta-margur)
							       (Q-A alla-allur)
							       (NP-POS (N-G hljóðs-hljóð) (CONJ eða-eða) (N-G raddar-rödd)))))))))
	  (. .-.))
  (ID FIRSTGRAMMAR,.13))

þykja til bera:

       (ADVP (ADVR svo-svo)
	     (CP-CMP-SPE (WADVP-1 0)
			 (C sem-sem)
			 (IP-SUB-SPE (ADVP *T*-1)
				     (NP-SBJ (PRO-D mér-ég))
				     (VBPI þykir-þykja)
				     (PP (NP (NS-G skulda-skuld))
					 (P til-til))
				     (VB bera-bera))))
       (. .-.))
  (ID THETUBROT,.1))

0.1

Corrections and discussion needed before the release of 0.1

Mention RANNÍS

Corrections

Look at Q mikill vs. ADJ mikill (especially in the oldest files)

D(efinite article) without case marking

What is WADV-W in the first file, piltur1.psd?

CP-THT-PRN vs. CP-THT

Fix order of dash tags (SPE should be before PRN):

CP-THT-SPE-PRN rather than CP-THT-PRN-SPE

piltur3b: IP-MAT-PRN-SPE should be IP-MAT-SPE-PRN

piltur4: Do not treat enda as CONJ

DONE piltur1: Change (NP-PRD (NP *T*-1) to *ICH*-1 in the following:

( (IP-MAT (CONJ og-og)
	  (NP-1 (N-N afbragð-afbragð))
	  (VBDI þótti-þykja)
	  (NP-SBJ (PRO-N hann-hann))
	  (NP-PRD (NP *T*-1)
		  (NP-POS (NS-G jafnaldra-jafnaldri)
			  (NP-POS (PRO-G sinna-sinn))))
	  (PP (P fyrir-fyrir)
	      (NP (NP-POS (N-G styrkleika-styrkleiki))
		  (NS-A SAKIR-SÖK)))
	  (. ,-,)))

piltur1: fix case marking (NPR-A and NPRS-G to NPR-N) in the NP-PRD:

( (IP-MAT (CONJ og-og)
	  (VBPI heita-heita)
	  (NP-SBJ (ADJS fremstu-fremri) (NS-N BÆIR$-BÆR) (D $nir-hinn))
	  (NP-PRD (NPR-A Indriðahóll-indriðahóll) (CONJ og-og) (NPRS-G SIGRÍÐARTUNGA-SIGRÍÐARTUNGA))))

Fix biðja einhvern að gera ... (einhvern sometimes parsed as NP-OB2, sometimes NP-SBJ)

Change *T*-1 to *-1:

/home/einar/icecorpus/finished/piltur3a.psd-( (IP-MAT (NP-1 (D-N Þessar-þessi) (NS-N fréttir-frétt))
/home/einar/icecorpus/finished/piltur3a.psd-	  (VBDI þóttu-þykja)
/home/einar/icecorpus/finished/piltur3a.psd-	  (NP-SBJ (NPR-D Sigríði-sigríður))
/home/einar/icecorpus/finished/piltur3a.psd:	  (IP-SMC (NP-SBJ *T*-1)
/home/einar/icecorpus/finished/piltur3a.psd-		  (NEG ekki-ekki)
/home/einar/icecorpus/finished/piltur3a.psd-		  (ADJP (ADJ-N góðar-góður)))
/home/einar/icecorpus/finished/piltur3a.psd-	  (. ,-,)))

Discussions

Það er mér heiður að ... / Það er mér sönn ánægja ...

Check CP-CMP

Consider NPR+NPR for Bjarnadóttir, Ormsson (Bjarna-dóttir, Orms-son), cf. PPCEME