[Isis-users] ABCD y diacríticos

Maribel Cuadrado Maribel.Cuadrado at uab.es
Fri Feb 17 10:08:13 CET 2012


Ernesto,

No se si te entiendo bien.

Se trata de realizar un archivo gizmo (podemos llamarlo middot) en el 
cual he de especificar:
*c:\>mx seq=con create=pepe now
·|
mfn=     1
   1  «·»
^Z

c:\>mx pepe
mfn=     1
   1  «·»

*Al lanzar mi base de datos habré de especificar .....gizmo=gansuc 
gizmo=middot....*
Pero el gizmo necesita una extension *.mst y *.xrf. porque sinó da un 
error por no localizar el *.xrf

Qué tipo de extensión he de darle al gizmo "middot" (*.in?)

*Gràcias por tu paciencia.

Maribel
Universitat Autònoma de Barcelona*


*



Al 16/02/2012 16:39, En/na spinaker ha escrit:
> Maribel
>
> No sé si sigo tu pensamiento
> si quieres convertir la L·   en  L simple, lo que hay que hacer es 
> tenero un gizmo previo
> convertir L·  --> L    y   l·   --> l
> significa que a la hora de indizar debes eliminar el "middot" del texto
>
> Alcanza con hacer un gizmo  del tipo
> mx seq=con create=middot  now
> ·|
> ^Z
> creará el archivo
>
> *c:\>mx seq=con create=pepe now
> ·|
> mfn=     1
>   1  «·»
> ^Z
>
> c:\>mx pepe
> mfn=     1
>   1  «·»
> *
> entonces si agregas al mx de indización el gizmo el middot será 
> eliminado del string y no estara en el diccionario
>
>
> Saludos
> Ernesto
>
>
>
> El 16/02/2012 12:13, Maribel Cuadrado escribió:
>>
>> Hola,
>>
>> Entiendo el procedimiento. He creado una base de datos gizmo 
>> (similar) a gansuc donde especificar el código ASCII y su equivalencia.
>>
>> Por ejemplo, en GANSUC, para convertir la *Á* a *A* especifica:
>> V001 ! 192
>> v002 ! 065
>> V011! asc
>> v021! asc
>> v051! A mayúscula con acento grave
>> V052! A mayúscula
>>
>> Lo que no entiendo es como puedo específicar  la L· para convertirla 
>> en L, ya que no está en el código ASCII extendido (sólo lo he 
>> localizado en el UTF8: U+013F, U+0140) ni tampoco existe en la tabla 
>> ANSI. El único código que aparece en el ASCII es el 250 (·) "middot".
>>
>> Otra cuestión puede ser que al convertir mi base de datos a *ANSI* 
>> (MX iso=carga.iso create=prova *convert=ansi *-all now tell=100), 
>> creo que ha sustituido el código 250 de ASCCI (·) por el 250 de ANSI (ú).
>> Necesito indicarle que convierta el 250 (ú) por el 183 (·)
>>
>> Cómo debería indicarlo?
>>
>> V001! 250
>> V002! 183
>> V011! ansi
>> v021! ansi
>> v051! ú (250 de ANSI)
>> v052! middot (183 de ANSI)
>>
>> Perdonad mi ignorancia al respecto.
>>
>> Maribel Cuadrado
>> Universitat Autònoma de Barcelona
>>
>>
>> Al 16/02/2012 11:00, En/na spinaker ha escrit:
>>> Maribel
>>>
>>> El problema es que para  ascii/ansi  esa letra son dos letras, es 
>>> decir hay dos caracteres
>>> de modo que en primer lugar deberias decidir cómo se va a convertir 
>>> al indice
>>>  L-L    LÙL  LÚL   LL   etc
>>> entonces deberas modifiicar el gansuc o preparar un gizmo especial 
>>> para esa letra(s) y ponerlo en la linea de inversion del mx
>>>
>>> Saludos
>>> Ernesto Spinak
>>>
>>> El 16/02/2012 7:04, Maribel Cuadrado escribió:
>>>>
>>>> Hola,
>>>>
>>>> De nuevo vuelvo a plantear una cuestión, aun no resuelta:
>>>>
>>>> Se trata de la conversión correcta del diacrítico catalán (L·L, 
>>>> l·l) en ABCD.
>>>>
>>>> Este diacrítico es: Ldot (Latin capital letter L with middle dot) y 
>>>> ldot (Latin small letter l with middle dot), con los códigos U+013F 
>>>> i U+0140 (en HTML, Ŀ i ŀ): L. i l.
>>>>
>>>> En UTF-8:
>>>> L·L [0xC4 0xBF (c4bf)]
>>>> l·l [0xC5 0x80 (c580)]
>>>>
>>>> Cuando lanzo mi aplicación utilizo:
>>>> mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc 
>>>> actab=isisac.tab stw=@ prova.stw now -all tell=1000
>>>>
>>>> Con el uso del gizmo GANSUC 
>>>> (http://www.infoisis.eti.br/tools/pgacgz.htm) logré solucionar toda 
>>>> la problemática de acentos, pero la ele geminada (L·L y l·l) se 
>>>> visualiza mal (LÚL y lúl) y no se recupera en el índice.
>>>>
>>>> Por los comentarios que me hicisteis el pasado mes de octubre se 
>>>> había de preparar una tabla especial que recogiera este diacrítico.
>>>> ¿Alguien puede ayudarme o indicarme cómo elaborarla?
>>>>
>>>> Maribel Cuadrado
>>>> Universitat Autònoma de Barcelona
>>>>
>>>>
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> isis-users mailing list
>>>> isis-users at iccisis.org
>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>
>>>
>>> -- 
>>>    .^.                                .^.
>>>    ( )                                ( )
>>>    ===                                ===
>>>   =[=]================================[=]=
>>>    | |  Ernesto Spinak                | |
>>>    | |spinaker at adinet.com.uy         | |
>>>    | |  Montevideo, Uruguay           | |
>>>    | |  tel/fax  (598) 2622-3352      | |
>>>    | |  celular  (598) 99612238      | |
>>>   =[=]================================[=]=
>>>    ===                                ===
>>>    ( )                                ( )
>>>     V                                  V
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> -- 
>    .^.                                .^.
>    ( )                                ( )
>    ===                                ===
>   =[=]================================[=]=
>    | |  Ernesto Spinak                | |
>    | |spinaker at adinet.com.uy         | |
>    | |  Montevideo, Uruguay           | |
>    | |  tel/fax  (598) 2622-3352      | |
>    | |  celular  (598) 99612238      | |
>   =[=]================================[=]=
>    ===                                ===
>    ( )                                ( )
>     V                                  V

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cb7423f/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cb7423f/attachment.vcf>


More information about the isis-users mailing list