<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Could you give me the link to the file in the repo? I have no idea where that is.<div class=""><br class=""></div><div class="">I only did notice été, because one of our product name contains that word, but you are right about aura and avions. </div><div class=""><br class=""></div><div class="">Do we need to remove avions from the stop word, if it get changed to its singular form during analysis?</div><div class=""><br class=""></div><div class="">I am having second thought: removing été could have a great impact on the search result, someone searching for “summer” would result in finding all results containing the past tense form of “to be”: the impact is huge.</div><div class=""><br class=""></div><div class="">Is there a way to make “a été” the stop word instead?</div><div class=""><br class=""><div class="">
<div dir="auto" style="caret-color: rgb(0, 0, 0); color: rgb(0, 0, 0); letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div>--<br class="">Philippe Ouellet<br class="">Web Developer</div><div><a href="https://camellia-sinensis.com" class="">https://camellia-sinensis.com</a></div></div>

</div>

<div><br class=""><blockquote type="cite" class=""><div class="">On Apr 15, 2020, at 20:05, Olly Betts <<a href="mailto:olly@survex.com" class="">olly@survex.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div class="">On Wed, Apr 15, 2020 at 05:44:35PM -0400, Philippe Ouellet wrote:<br class=""><blockquote type="cite" class="">I propose to remove “été” and “étés” from the French stop words. It is<br class="">true that they are a form for the verb “to be”, but it also mean<br class="">“summer”, which should not be a stop word.<br class=""></blockquote><br class="">Sounds good to me.  It looks like there are other entries with the same<br class="">problem - e.g.  "aura" and "avions" are both also nouns.<br class=""><br class="">But my French is rudimentary at best.  Could you review the whole list<br class="">and open a PR against the snowball-website repo with your proposed<br class="">changes?<br class=""><br class="">I'd suggest we comment out such entries ("|" is the comment character<br class="">here) with a note as to why they are omitted.  That should help avoid<br class="">future requests to add the apparently missing entries.<br class=""><br class="">Cheers,<br class="">    Olly<br class=""></div></div></blockquote></div><br class=""></div></body></html>