[Isis-users] ABCD y diacríticos

Maribel Cuadrado Maribel.Cuadrado at uab.es
Thu Feb 16 15:13:06 CET 2012


Hola,

Entiendo el procedimiento. He creado una base de datos gizmo (similar) a 
gansuc donde especificar el código ASCII y su equivalencia.

Por ejemplo, en GANSUC, para convertir la *Á* a *A* especifica:
V001 ! 192
v002 ! 065
V011! asc
v021! asc
v051! A mayúscula con acento grave
V052! A mayúscula

Lo que no entiendo es como puedo específicar  la L· para convertirla en 
L, ya que no está en el código ASCII extendido (sólo lo he localizado en 
el UTF8: U+013F, U+0140) ni tampoco existe en la tabla ANSI. El único 
código que aparece en el ASCII es el 250 (·) "middot".

Otra cuestión puede ser que al convertir mi base de datos a *ANSI* (MX 
iso=carga.iso create=prova *convert=ansi *-all now tell=100), creo que 
ha sustituido el código 250 de ASCCI (·) por el 250 de ANSI (ú).
Necesito indicarle que convierta el 250 (ú) por el 183 (·)

Cómo debería indicarlo?

V001! 250
V002! 183
V011! ansi
v021! ansi
v051! ú (250 de ANSI)
v052! middot (183 de ANSI)

Perdonad mi ignorancia al respecto.

Maribel Cuadrado
Universitat Autònoma de Barcelona


Al 16/02/2012 11:00, En/na spinaker ha escrit:
> Maribel
>
> El problema es que para  ascii/ansi  esa letra son dos letras, es 
> decir hay dos caracteres
> de modo que en primer lugar deberias decidir cómo se va a convertir al 
> indice
>  L-L    LÙL  LÚL   LL   etc
> entonces deberas modifiicar el gansuc o preparar un gizmo especial 
> para esa letra(s) y ponerlo en la linea de inversion del mx
>
> Saludos
> Ernesto Spinak
>
> El 16/02/2012 7:04, Maribel Cuadrado escribió:
>>
>> Hola,
>>
>> De nuevo vuelvo a plantear una cuestión, aun no resuelta:
>>
>> Se trata de la conversión correcta del diacrítico catalán (L·L, l·l) 
>> en ABCD.
>>
>> Este diacrítico es: Ldot (Latin capital letter L with middle dot) y 
>> ldot (Latin small letter l with middle dot), con los códigos U+013F i 
>> U+0140 (en HTML, Ŀ i ŀ): L. i l.
>>
>> En UTF-8:
>> L·L [0xC4 0xBF (c4bf)]
>> l·l [0xC5 0x80 (c580)]
>>
>> Cuando lanzo mi aplicación utilizo:
>> mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc 
>> actab=isisac.tab stw=@ prova.stw now -all tell=1000
>>
>> Con el uso del gizmo GANSUC 
>> (http://www.infoisis.eti.br/tools/pgacgz.htm) logré solucionar toda 
>> la problemática de acentos, pero la ele geminada (L·L y l·l) se 
>> visualiza mal (LÚL y lúl) y no se recupera en el índice.
>>
>> Por los comentarios que me hicisteis el pasado mes de octubre se 
>> había de preparar una tabla especial que recogiera este diacrítico.
>> ¿Alguien puede ayudarme o indicarme cómo elaborarla?
>>
>> Maribel Cuadrado
>> Universitat Autònoma de Barcelona
>>
>>
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> -- 
>    .^.                                .^.
>    ( )                                ( )
>    ===                                ===
>   =[=]================================[=]=
>    | |  Ernesto Spinak                | |
>    | |spinaker at adinet.com.uy         | |
>    | |  Montevideo, Uruguay           | |
>    | |  tel/fax  (598) 2622-3352      | |
>    | |  celular  (598) 99612238      | |
>   =[=]================================[=]=
>    ===                                ===
>    ( )                                ( )
>     V                                  V

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120216/be4d74ac/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120216/be4d74ac/attachment.vcf>


More information about the isis-users mailing list