[Snowball-discuss] Commented romanian stopword-list

E. Glockner eglockner at hotmail.com
Sat Aug 12 09:50:55 BST 2006


Hello Mr. Porter, hello Mr. Boulton,

we realised that the stop word list we sent you, is the non-commented 
one. In the attachment is the one with the comments. Please excuse the 
late reaction.
I personally have a question about evaluating. You get a lot of stemmers 
in different languages. I assume that you don't speak the language of 
each stemmer, do you? Though, how do you evaluate the stemmers? Do you 
just use the results which are sent in (eg. diffs.txt), or do you have 
your own way of evaluating?

With kind regards,
E. Glockner and colleagues.

-------------- next part --------------

| A Romanian stop word list. Comments begin with vertical bar. Each stop
| word is at the start of a line.

a			|to (verb infinitive partical)
abia			|only, just
acea			|that (adj sg fem)
aceasta, această	|this (adj/ pron sg fem)
aceea			|that (adj/ pron sg fem)
acelaÅŸi			|the same (adj/ pron sg masc)
aceia			|those (adj/ pron pl masc)
acel			|that (adj sg masc)
acela			|that (adj/ pron pron sg masc)
acelaÅŸi			|the same (adj/ pron sg masc)
acelea,acele		|those (adj/pron pl fem)
aceluiaÅŸi		|to the same (adj sg masc)
acest			|this (adj sg masc)
acesta			|this (adj/ pron sg masc)
aceste			|these (adj pl fem)
acestea			|these (adj/ pron pl fem)
acestei			|to this (adj/ pron sg fem)
acestor, acestora	|to these (adj/ pron pl masc)
aceÅŸti			|these (adj pl masc)
aceÅŸtia			|these (adj/ pron pl masc)
acestui			|to this (adj/ pron sg masc)
acolo			|there
acum			|now
adică			|that is, viz
ai			|have (second pers. sg.)
aia			|that (art dem/ adj/ pron sg. fem)
aici			|here
al			|(art pos sg masc)
ăla			|that (adj/ pron sg masc)
alături			|next to
ale			|(art pos pl fem)
alt			|another (adj sg masc)
alta			|another (adj sg fem)
altceva			|something else/ different
altă			|another (adj sg fem)
alte			|other (adj pl fem)
altele			|other (adj/ pron pl fem)
altfel			|otherwise/ or (else)
alţi			|other (adj pl masc)
alţii			|other (pron pl masc)
altul			|other (pron sg masc)
am			|have (I pers sg pres)
anume			|special/ certain
apoi			|then
ar			|cond aux III pers sg/ III pers pl
are			|have (III pers sg pres)
aÅŸ			|cond aux I pers sg
aÅŸa			|so, such
asemenea		|such
asta			|this (adj/ pron sg f)
astăzi			|today
astfel			|thus
asupra			|about
atare			|such
aţi			|cond aux III pers pl
atît			|so much
atât			|so much
atâta			|so much
atâtea			|so many (f pl)
atâţi			|so many (m pl)
atîti			|so many (m pl)
atâţia			|so many (m pl)
atîţia			|so many (m pl)
atunci			|then
au			|have (aux have III pers pl pres)
avea			|to have
avem			|have (I pers sg pres)
avut			|had
azi			|today
ba			|no
bine			|good, well
ca			|for, like
că			|that
cât			|how much, how many
câtă			|how much (adj/ pron f sg)
câte			|how many (adj/ pron f pl)
câţi			|how many (adj/ pron m pl)
cam			|about, approximately
care			|which
căreia			|which/ whom (f sg)
cărora			|which/ whom (pl)
căruia			|which/ whom (m sg)
către			|towards
ce			|what
cea			|that (sg f)
ceea			|that (sg f)
cei			|those (m pl)
ceilalţi		|the others (m pl)
cel			|that (m sg)
cele			|those (f pl)
celelalte		|the others (f pl)
celor			|them
ceva			|something
chiar			|even
ci			|but
cînd			|when
când			|when
cine			|who
cineva			|somebody
cît			|how much
cîte			|how many (f pl)
cîteva			|some (f pl)
cîţi			|how many (m pl)
cîţiva			|some (m pl)
cu			|whith
cui			|whom
cum			|how
cumva			|somehow
da			|yes
dacă			|if
dar			|but
de			|of, on, about etc.
deasupra		|above
deci			|therefore
decît, decât		|than
deja			|already
deÅŸi			|though
despre			|about
din			|from
dintr			|from (selective)
dintre			|from (selective)
doar			|only
după			|after
ea			|she
ei			|they (m pl)
el			|he
ele			|they (f pl)
era			|was (III pers sg past)
este			|is (III pers sg pres)
eu			|I, me
fără			|whithout
fel			|kind
fi			|be
fie			|be
fiecare			|every (adj sg fem/ masc)
fiecărui		|to every (adj/ pron sg masc)
fiecăruia		|to every (adj/ pron sg masc)
fiind			|being
fiecăreia		|(to/ of) every (pron sg fem)
foarte			|very
fost			|been
iar			|but
i-au			|pron+auxiliary perfect tense verb form
ieri			|yesterday
îi			|pron dat m pl
îl			|pron dat m sg
îmi			|pron refl I pers sg
în			|in
înainte			|before, forward
înapoi			|back
înca			|yet
încît			|so that
însă			|but
însuşi			|himself, itself (sg masc)
într			|between
între			|between
îşi			|pron refl III pers sg
îţi			|pron refl II pers sg
la			|to
l-am			|pron+auxiliary perfect tense verb form
le			|pron dat f pl
li			|pron dat m pl
lor			|them (m pl)
lui			|him
mă			|refl I pers sg
mai			|more
mare			|big
mereu			|always
mi-			|refl I pers sg
mod			|way
mult			|much
multă			|much (f quantity)
multe			|many (f )
mulţi			|many (m)
ne			|refl I pers pl
nici			|not even
niciodata		|never
nimeni			|nobody
nimic			|nothing
niÅŸte			|some
noastră			|our (sg fem)
noastre			|our (pl fem)
noi			|we
nostru			|our (sg masc)
noÅŸtri			|our
nouă			|us
nu			|no
numai			|only
o			|pron acc f sg
oarecând		|some time
oarecare		|some, nobody
oarecăruia		|(to) any
oarece			|something
oarecine		|somebody
oarecui			|to somebody
oarecum			|somehow
or			|or, but
ori			|but
orice			|every
oricum			|anyway
până			|till, untill
pe			|on
pentru			|for
peste			|over
pînă			|till
plus			|plus
poată			|can (subj. mood)
poate			|can (III pers sg pres)
prea			|too
prin			|trough
printr-o		|trough one (sg fem)
printr-un		|trough one (sg masc)
puţini			|few (m pl)
sa			|his/ her (sg)
să			|to
săi			|his/ her (m pl)
sale			|his/ her (f pl)
sau			|or
său			|his (adj sg masc)
se			|oneself (reflexive)
ÅŸi			|and
sînt			|be I pers sg pres
sîntem			|be I pers pl pres
sînteţi			|be II pers pl pres
să-ţi			|subjunctive mood conjunction + pron II pers sg
să-mi			|subjunctive mood conjucntion + pron II pers sg
să-i			|subjunctive mood conjunction + pron II pers sg
să-şi			|subjunctive mood conjunction + pron II pers sg
spre			|to
sub			|under
sunt			|be I pers sg pres
suntem			|be III pers pl pres
sunteţi			|be II pers pl pres
te			|pron II pers sg
Å£i			|pron II pers sg
toată			|all (f sg quantity)
toate			|all (f pl)
tocmai			|just
tot			|everything
toţi			|all (m pl)
totul			|everything
totuÅŸi			|still
tu			|you
tuturor			|to all
un			|a (m sg)
una			|a/ one (f sg)
unde			|where
unei			|one (f sg dat)
unele			|some (f pl)
uneori			|sometimes
unii			|some (m pl)
unor			|some (m pl dat)
unui			|one (m sg dat)
unul			|one (sg m)
va			|(he/ she) will
vă			|you (accus., dat.)
voi			|(I) will
vom			|(we) will
vor			|(they) want
vreo			|any
vreun			|any


More information about the Snowball-discuss mailing list