Dizionario per la Ricerca di Testo in Italiano

Versione latin1

Autore: Daniele Varrazzo
Contatti: piro (alla) develer.com
Organizzazione: Develer S.r.l.
Data: 2007-07-09
Versione: 1.1
Copyright: 2001, 2002 Gianluca Turconi
Copyright: 2002, 2003, 2004 Gianluca Turconi and Davide Prina
Copyright: 2004, 2005, 2006 Davide Prina
Copyright: 2007 Daniele Varrazzo

Riassunto

Questo package fornisce un dizionario e gli altri file necessari per effettuare la ricerca full text in documenti in italiano utilizzando il database PostgreSQL insieme al package aggiuntivo Tsearch2.

La ricerca tiene in considerazione le variazioni caratteristiche della lingua italiana per restituire i documenti corrispondenti ai criteri di ricerca, ad esempio le diverse coniugazioni verbali.

Il package contiene anche uno stemmer Snowball utile come dizionario di ripiego per le parole non incluse nel dizionario.

This file is distributed under GPL license.

This file is part of the Italian dictionary for full-text search.

The Italian dictionary for full-text search is free software; you can redistribute it and/or modify it under the terms of the GNU General Public License as published by the Free Software Foundation; either version 2 of the License, or (at your option) any later version.

The Italian dictionary for full-text search is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU General Public License for more details.

You should have received a copy of the GNU General Public License along with Italian dictionary for full-text search, if not, write to the Free Software Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA

GPL license can be found at http://www.fsf.org/licenses/licenses.html

Informazioni sul pacchetto

Questo pacchetto contiene sia dizionario ISpell e una libreria di stemming per la lingua italiana.

Il pacchetto è distribuito negli encoding latin1 e utf8. In particolare questo pacchetto è in encoding latin1. Dovresti usare solo il pacchetto corrispondente all'encoding utilizzato per creare il cluster di database. Per esempio se hai creato il cluster con initdb --locale=it_IT (o qualunque altro encoding a 8 bit) usa la versione latin1. Se invece hai creato il cluster con initdb --locale=it_IT.utf8 usa la versione utf8. Se vuoi sapere il locale di un cluster esistente puoi usare il comando psql -tc "SHOW LC_CTYPE" postgres.

Prerequisiti

Il dizionario ISpell è stato provato con PostgreSQL versioni 8.1 e successive, ma dovrebbe funzionare con qualunque versione di PostgreSQL che includa il package tsearch2.

La libreria di stemming è stata provata solo con PostgreSQL 8.2. Inoltre il package tsearch2 deve essere patchato per renderlo compatibile con la versione attuale di Snowball. La patch è disponibile a http://www.sai.msu.su/~megera/postgres/gist/tsearch/V2/tsearch_snowball_82-20070504.gz

Se non intendi patchare i sorgenti puoi evitare di costruire lo stemmer e installare il solo dizionario ortografico. In questo caso leggi la sezione installazione del solo dizionario ortografico.

Per installare il dizionario in un database devi prima compilare e installare il modulo tsearch2 e caricare il file tsearch2 nel database (di solito si trova nella directory /usr/share/postgresql/contrib).

Installazione del package

Espandi l'archivio del dizionario nella directory contrib nell'albero dei sorgenti di PostgreSQL:

tar xzvf italian-fts-1.1-latin1.tar.gz

Costruisci la libreria e installa i file del dizionario:

cd italian_fts_latin1
make
make install

Carica la configurazione del dizionario nel tuo database:

psql -f italian_fts_latin1.sql mydict

Nel database verrà generata una configurazione chiamata italian_latin1.

Installazione del solo dizionario ortografico

Se non vuoi alterare il codice sorgente di tsearch2 puoi installare il solo dizionario ortografico. In questo caso le parole non riconosciute dal dizionario verranno lasciate inalterate anziché essere ridotte al solo tema.

Per installare il dizionario ortografico espandi l'archivio come specificato in precedenza ma esegui i seguenti comandi:

make SPELL_ONLY=1
make SPELL_ONLY=1 install

Poi carica la seguente configurazione del dizionario del database:

psql -f italian_fts_spell_latin1.sql mydict

Nel database verrà generata una configurazione chiamata it_spell_latin1.