[Isis-users] Problemas ABCD con diacríticos en el archivo invertido
Maribel Cuadrado
Maribel.Cuadrado at uab.es
Fri Oct 14 13:58:46 CEST 2011
Hola,
He solucionado el problema de los diacríticos utilizando la base GANSUC
(http://www.infoisis.eti.br/tools/pgacgz.htm) .
La instrucción que ha funcionado es:
mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc
actab=isisac.tab stw=@ prova.stw now -all tell=1000
Me queda por solucionar el problema de la "l·l" que se visualiza mal
("intelúlectual" en vez de "intel·lectual") en cualquier texto del
registro.
Si como dice E. Spinak se ha de preparar una tabla especial, podeis
indicarme ¿dónde y cómo?
Gracias.
Maribel Cuadrado
Universitat Autònoma de Barcelona
Al 14/10/2011 11:49, En/na spinaker ha escrit:
> La instrucción "fullinv/ansi" usa una tabla de conversión
> interna que es la estándard del cp850
> de modo que esa no va a servir, además la opción fullinv/ansi tiene
> bugs para la técnica 8 pues no limpia bien las palabras que estan
> asociadas a signos tipográficas, por ejemplo "ojos" va a extraer
> OJOS"
> hay que preparar una tabla especial,
> saludos
> Ernesto Spinak
>
>
> El 14/10/2011 6:26, Maribel Cuadrado escribió:
>>
>> He probado la opción sugerida creando el invertido con "fullinv/ansi"
>> pero el problema continua.
>> No obedece la isisuc.tab (elaborada según el ASCII 850 (latín): por
>> ejemplo especifico que el carcater 135 (ç) lo convierta en 067 (C) y
>> no lo hace.
>> ¿Alguna sugerencia más?
>>
>> Maribel Cuadrado
>> Universitat Autònona de Barcelona
>>
>>
>>
>>
>>
>>
>>
>> Al 14/10/2011 9:37, En/na De Smet Egbert ha escrit:
>>> Has intentado con la otra possibilidad para producir el index :
>>> mx prova fst=@ fullinv/ansi=prova actab=isisac.tab uctab=isisuc.tab
>>> stw=@prova.stw now -all tell=1000 ?
>>>
>>>
>>> ________________________________________
>>> From: isis-users-bounces at iccisis.org
>>> [isis-users-bounces at iccisis.org] on behalf of Maribel Cuadrado
>>> [Maribel.Cuadrado at uab.es]
>>> Sent: Friday, October 14, 2011 9:23 AM
>>> To: isis-users at iccisis.org
>>> Subject: [Isis-users] Problemas ABCD con diacríticos en el archivo
>>> invertido
>>>
>>> Hola,
>>>
>>> He instalado ABCD en el entorno localhost (windows) y he cargado una
>>> base de datos desde Winisis (en catalán)
>>> En principio todo funciona bien pero tengo problemas con algunos
>>> diacríticos en el archivo invertido (por ejemplo: ACADèMIA,
>>> CONSAGRACIó, AGRíCOLES...)
>>> Estos terminos ni se visualizan bien, ni se pueden recuperar. Sucede
>>> con: é, è, ó, ò, í, ç, ú, à, á.....
>>> También hay problemas con el caracter catalan: "l·l" que se
>>> visualiza como "lúl" y ademas el archivo invertido divide las
>>> palabras afectadas:
>>> Intel·lectual se transforma en dos entradas: "intel" y "lectual".
>>>
>>> He probado modificar els ISISUC.TAB (a través del comando
>>> UCTAB=isisuc.tab) y lanzar un GIZMO (gizmo=g850ans) pero sin
>>> resultados.
>>>
>>> La sintaxis que utilizo para lanzar la base de datos es:
>>> mx iso=archivo.iso create=prova convert=ansi -all now tell=100
>>> mx prova ifupd/create=prova actab=isisac.tab uctab=isisuc.tab
>>> fst=@prova.fst<mailto:fst=@prova.fst>
>>> stw=@prova.stw<mailto:stw=@prova.stw> now -all tell=1000
>>>
>>> Creo que hay algun error de sintaxis o planteamiento.
>>> Alguien puede ayudarme a solucionarlo?
>>>
>>>
>>> El isisuc.tab es:
>>> 000 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016
>>> 017 018 019 020 021 022 023 024 025 026 027 028 028 030 031
>>> 032 033 034 035 036 037 038 039 040 041 042 043 044 045 046 047 048
>>> 049 050 051 052 053 054 055 056 057 058 059 060 061 062 063
>>> 064 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080
>>> 081 082 083 084 085 086 087 088 089 090 091 092 093 094 095
>>> 096 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080
>>> 081 082 083 084 085 086 087 088 089 090 123 124 125 126 127
>>> 067 085 069 065 065 065 065 067 069 069 069 073 073 073 065 065 069
>>> 069 069 079 079 079 085 085 089 079 085 155 156 157 158 159
>>> 065 073 079 085 165 165 166 167 168 169 170 171 172 173 174 175 176
>>> 177 178 179 180 065 065 065 184 185 186 187 188 189 190 191
>>> 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208
>>> 209 069 069 069 213 073 073 073 217 218 219 220 221 073 223
>>> 079 225 226 079 228 229 230 231 232 085 234 085 236 237 238 239 240
>>> 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255
>>>
>>>
>>>
>>> Maribel Cuadrado
>>> Universitat Autònoma de Barcelona
>>>
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> --
> .^. .^.
> ( ) ( )
> === ===
> =[=]================================[=]=
> | | Ernesto Spinak | |
> | |spinaker at adinet.com.uy | |
> | | Montevideo, Uruguay | |
> | | tel/fax (598) 2622-3352 | |
> | | celular (598) 99612238 | |
> =[=]================================[=]=
> === ===
> ( ) ( )
> V V
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20111014/b99fd997/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20111014/b99fd997/attachment.vcf>
More information about the isis-users
mailing list