[Isis-users] ABCD y diacríticos

Maribel Cuadrado Maribel.Cuadrado at uab.es
Fri Feb 17 12:52:57 CET 2012


Ernesto,

He seguido tus instrucciones y todo funciona bien (he de lanzar en este 
orden: gizmo=middot  gizmo=gansuc)

El término "Col·legi" ha pasado a ser en el diccionario "collegi".

De todas formas, no he solucionado la cuestión de la visualización de 
los términos en el registro.
Se continua viendo "Colúlegi".
Imagino que es una cuestión de la conversión a Ansi (*convert=ansi*)

Qué mes sugieres que puedo modificar?


Gracias

Maribel
Universitat Autònoma de Barcelona





Al 17/02/2012 10:31, En/na spinaker ha escrit:
> Maribel
>
> La instrucciones que muestro están generando una base pepe.mst/xrf
> cargando los datos directamente desde la consola
>
> mx seq=con   significca que los datos los ingresas de forma 
> interactiva desde la consola
> hasta que das  Ctl + Z   para terminar
>
> Saludos
> Ernesto
>
>
> El 17/02/2012 7:08, Maribel Cuadrado escribió:
>> Ernesto,
>>
>> No se si te entiendo bien.
>>
>> Se trata de realizar un archivo gizmo (podemos llamarlo middot) en el 
>> cual he de especificar:
>> *c:\>mx seq=con create=pepe now
>> ·|
>> mfn=     1
>>   1  «·»
>> ^Z
>>
>> c:\>mx pepe
>> mfn=     1
>>   1  «·»
>>
>> *Al lanzar mi base de datos habré de especificar .....gizmo=gansuc 
>> gizmo=middot....*
>> Pero el gizmo necesita una extension *.mst y *.xrf. porque sinó da un 
>> error por no localizar el *.xrf
>>
>> Qué tipo de extensión he de darle al gizmo "middot" (*.in?)
>>
>> *Gràcias por tu paciencia.
>>
>> Maribel
>> Universitat Autònoma de Barcelona*
>>
>>
>> *
>>
>>
>>
>> Al 16/02/2012 16:39, En/na spinaker ha escrit:
>>> Maribel
>>>
>>> No sé si sigo tu pensamiento
>>> si quieres convertir la L·   en  L simple, lo que hay que hacer es 
>>> tenero un gizmo previo
>>> convertir L·  --> L    y   l·   --> l
>>> significa que a la hora de indizar debes eliminar el "middot" del texto
>>>
>>> Alcanza con hacer un gizmo  del tipo
>>> mx seq=con create=middot  now
>>> ·|
>>> ^Z
>>> creará el archivo
>>>
>>> *c:\>mx seq=con create=pepe now
>>> ·|
>>> mfn=     1
>>>   1  «·»
>>> ^Z
>>>
>>> c:\>mx pepe
>>> mfn=     1
>>>   1  «·»
>>> *
>>> entonces si agregas al mx de indización el gizmo el middot será 
>>> eliminado del string y no estara en el diccionario
>>>
>>>
>>> Saludos
>>> Ernesto
>>>
>>>
>>>
>>> El 16/02/2012 12:13, Maribel Cuadrado escribió:
>>>>
>>>> Hola,
>>>>
>>>> Entiendo el procedimiento. He creado una base de datos gizmo 
>>>> (similar) a gansuc donde especificar el código ASCII y su equivalencia.
>>>>
>>>> Por ejemplo, en GANSUC, para convertir la *Á* a *A* especifica:
>>>> V001 ! 192
>>>> v002 ! 065
>>>> V011! asc
>>>> v021! asc
>>>> v051! A mayúscula con acento grave
>>>> V052! A mayúscula
>>>>
>>>> Lo que no entiendo es como puedo específicar  la L· para 
>>>> convertirla en L, ya que no está en el código ASCII extendido (sólo 
>>>> lo he localizado en el UTF8: U+013F, U+0140) ni tampoco existe en 
>>>> la tabla ANSI. El único código que aparece en el ASCII es el 250 
>>>> (·) "middot".
>>>>
>>>> Otra cuestión puede ser que al convertir mi base de datos a *ANSI* 
>>>> (MX iso=carga.iso create=prova *convert=ansi *-all now tell=100), 
>>>> creo que ha sustituido el código 250 de ASCCI (·) por el 250 de 
>>>> ANSI (ú).
>>>> Necesito indicarle que convierta el 250 (ú) por el 183 (·)
>>>>
>>>> Cómo debería indicarlo?
>>>>
>>>> V001! 250
>>>> V002! 183
>>>> V011! ansi
>>>> v021! ansi
>>>> v051! ú (250 de ANSI)
>>>> v052! middot (183 de ANSI)
>>>>
>>>> Perdonad mi ignorancia al respecto.
>>>>
>>>> Maribel Cuadrado
>>>> Universitat Autònoma de Barcelona
>>>>
>>>>
>>>> Al 16/02/2012 11:00, En/na spinaker ha escrit:
>>>>> Maribel
>>>>>
>>>>> El problema es que para  ascii/ansi  esa letra son dos letras, es 
>>>>> decir hay dos caracteres
>>>>> de modo que en primer lugar deberias decidir cómo se va a 
>>>>> convertir al indice
>>>>>  L-L    LÙL  LÚL   LL   etc
>>>>> entonces deberas modifiicar el gansuc o preparar un gizmo especial 
>>>>> para esa letra(s) y ponerlo en la linea de inversion del mx
>>>>>
>>>>> Saludos
>>>>> Ernesto Spinak
>>>>>
>>>>> El 16/02/2012 7:04, Maribel Cuadrado escribió:
>>>>>>
>>>>>> Hola,
>>>>>>
>>>>>> De nuevo vuelvo a plantear una cuestión, aun no resuelta:
>>>>>>
>>>>>> Se trata de la conversión correcta del diacrítico catalán (L·L, 
>>>>>> l·l) en ABCD.
>>>>>>
>>>>>> Este diacrítico es: Ldot (Latin capital letter L with middle dot) 
>>>>>> y ldot (Latin small letter l with middle dot), con los códigos 
>>>>>> U+013F i U+0140 (en HTML, Ŀ i ŀ): L. i l.
>>>>>>
>>>>>> En UTF-8:
>>>>>> L·L [0xC4 0xBF (c4bf)]
>>>>>> l·l [0xC5 0x80 (c580)]
>>>>>>
>>>>>> Cuando lanzo mi aplicación utilizo:
>>>>>> mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc 
>>>>>> actab=isisac.tab stw=@ prova.stw now -all tell=1000
>>>>>>
>>>>>> Con el uso del gizmo GANSUC 
>>>>>> (http://www.infoisis.eti.br/tools/pgacgz.htm) logré solucionar 
>>>>>> toda la problemática de acentos, pero la ele geminada (L·L y l·l) 
>>>>>> se visualiza mal (LÚL y lúl) y no se recupera en el índice.
>>>>>>
>>>>>> Por los comentarios que me hicisteis el pasado mes de octubre se 
>>>>>> había de preparar una tabla especial que recogiera este diacrítico.
>>>>>> ¿Alguien puede ayudarme o indicarme cómo elaborarla?
>>>>>>
>>>>>> Maribel Cuadrado
>>>>>> Universitat Autònoma de Barcelona
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> isis-users mailing list
>>>>>> isis-users at iccisis.org
>>>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>>>
>>>>>
>>>>> -- 
>>>>>    .^.                                .^.
>>>>>    ( )                                ( )
>>>>>    ===                                ===
>>>>>   =[=]================================[=]=
>>>>>    | |  Ernesto Spinak                | |
>>>>>    | |spinaker at adinet.com.uy         | |
>>>>>    | |  Montevideo, Uruguay           | |
>>>>>    | |  tel/fax  (598) 2622-3352      | |
>>>>>    | |  celular  (598) 99612238      | |
>>>>>   =[=]================================[=]=
>>>>>    ===                                ===
>>>>>    ( )                                ( )
>>>>>     V                                  V
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> isis-users mailing list
>>>> isis-users at iccisis.org
>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>
>>>
>>> -- 
>>>    .^.                                .^.
>>>    ( )                                ( )
>>>    ===                                ===
>>>   =[=]================================[=]=
>>>    | |  Ernesto Spinak                | |
>>>    | |spinaker at adinet.com.uy         | |
>>>    | |  Montevideo, Uruguay           | |
>>>    | |  tel/fax  (598) 2622-3352      | |
>>>    | |  celular  (598) 99612238      | |
>>>   =[=]================================[=]=
>>>    ===                                ===
>>>    ( )                                ( )
>>>     V                                  V
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> -- 
>    .^.                                .^.
>    ( )                                ( )
>    ===                                ===
>   =[=]================================[=]=
>    | |  Ernesto Spinak                | |
>    | |spinaker at adinet.com.uy         | |
>    | |  Montevideo, Uruguay           | |
>    | |  tel/fax  (598) 2622-3352      | |
>    | |  celular  (598) 99612238      | |
>   =[=]================================[=]=
>    ===                                ===
>    ( )                                ( )
>     V                                  V

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cf5b315/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cf5b315/attachment.vcf>


More information about the isis-users mailing list