[Isis-users] ABCD y diacríticos
Maribel Cuadrado
Maribel.Cuadrado at uab.es
Fri Feb 17 10:08:13 CET 2012
Ernesto,
No se si te entiendo bien.
Se trata de realizar un archivo gizmo (podemos llamarlo middot) en el
cual he de especificar:
*c:\>mx seq=con create=pepe now
·|
mfn= 1
1 «·»
^Z
c:\>mx pepe
mfn= 1
1 «·»
*Al lanzar mi base de datos habré de especificar .....gizmo=gansuc
gizmo=middot....*
Pero el gizmo necesita una extension *.mst y *.xrf. porque sinó da un
error por no localizar el *.xrf
Qué tipo de extensión he de darle al gizmo "middot" (*.in?)
*Gràcias por tu paciencia.
Maribel
Universitat Autònoma de Barcelona*
*
Al 16/02/2012 16:39, En/na spinaker ha escrit:
> Maribel
>
> No sé si sigo tu pensamiento
> si quieres convertir la L· en L simple, lo que hay que hacer es
> tenero un gizmo previo
> convertir L· --> L y l· --> l
> significa que a la hora de indizar debes eliminar el "middot" del texto
>
> Alcanza con hacer un gizmo del tipo
> mx seq=con create=middot now
> ·|
> ^Z
> creará el archivo
>
> *c:\>mx seq=con create=pepe now
> ·|
> mfn= 1
> 1 «·»
> ^Z
>
> c:\>mx pepe
> mfn= 1
> 1 «·»
> *
> entonces si agregas al mx de indización el gizmo el middot será
> eliminado del string y no estara en el diccionario
>
>
> Saludos
> Ernesto
>
>
>
> El 16/02/2012 12:13, Maribel Cuadrado escribió:
>>
>> Hola,
>>
>> Entiendo el procedimiento. He creado una base de datos gizmo
>> (similar) a gansuc donde especificar el código ASCII y su equivalencia.
>>
>> Por ejemplo, en GANSUC, para convertir la *Á* a *A* especifica:
>> V001 ! 192
>> v002 ! 065
>> V011! asc
>> v021! asc
>> v051! A mayúscula con acento grave
>> V052! A mayúscula
>>
>> Lo que no entiendo es como puedo específicar la L· para convertirla
>> en L, ya que no está en el código ASCII extendido (sólo lo he
>> localizado en el UTF8: U+013F, U+0140) ni tampoco existe en la tabla
>> ANSI. El único código que aparece en el ASCII es el 250 (·) "middot".
>>
>> Otra cuestión puede ser que al convertir mi base de datos a *ANSI*
>> (MX iso=carga.iso create=prova *convert=ansi *-all now tell=100),
>> creo que ha sustituido el código 250 de ASCCI (·) por el 250 de ANSI (ú).
>> Necesito indicarle que convierta el 250 (ú) por el 183 (·)
>>
>> Cómo debería indicarlo?
>>
>> V001! 250
>> V002! 183
>> V011! ansi
>> v021! ansi
>> v051! ú (250 de ANSI)
>> v052! middot (183 de ANSI)
>>
>> Perdonad mi ignorancia al respecto.
>>
>> Maribel Cuadrado
>> Universitat Autònoma de Barcelona
>>
>>
>> Al 16/02/2012 11:00, En/na spinaker ha escrit:
>>> Maribel
>>>
>>> El problema es que para ascii/ansi esa letra son dos letras, es
>>> decir hay dos caracteres
>>> de modo que en primer lugar deberias decidir cómo se va a convertir
>>> al indice
>>> L-L LÙL LÚL LL etc
>>> entonces deberas modifiicar el gansuc o preparar un gizmo especial
>>> para esa letra(s) y ponerlo en la linea de inversion del mx
>>>
>>> Saludos
>>> Ernesto Spinak
>>>
>>> El 16/02/2012 7:04, Maribel Cuadrado escribió:
>>>>
>>>> Hola,
>>>>
>>>> De nuevo vuelvo a plantear una cuestión, aun no resuelta:
>>>>
>>>> Se trata de la conversión correcta del diacrítico catalán (L·L,
>>>> l·l) en ABCD.
>>>>
>>>> Este diacrítico es: Ldot (Latin capital letter L with middle dot) y
>>>> ldot (Latin small letter l with middle dot), con los códigos U+013F
>>>> i U+0140 (en HTML, Ŀ i ŀ): L. i l.
>>>>
>>>> En UTF-8:
>>>> L·L [0xC4 0xBF (c4bf)]
>>>> l·l [0xC5 0x80 (c580)]
>>>>
>>>> Cuando lanzo mi aplicación utilizo:
>>>> mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc
>>>> actab=isisac.tab stw=@ prova.stw now -all tell=1000
>>>>
>>>> Con el uso del gizmo GANSUC
>>>> (http://www.infoisis.eti.br/tools/pgacgz.htm) logré solucionar toda
>>>> la problemática de acentos, pero la ele geminada (L·L y l·l) se
>>>> visualiza mal (LÚL y lúl) y no se recupera en el índice.
>>>>
>>>> Por los comentarios que me hicisteis el pasado mes de octubre se
>>>> había de preparar una tabla especial que recogiera este diacrítico.
>>>> ¿Alguien puede ayudarme o indicarme cómo elaborarla?
>>>>
>>>> Maribel Cuadrado
>>>> Universitat Autònoma de Barcelona
>>>>
>>>>
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> isis-users mailing list
>>>> isis-users at iccisis.org
>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>
>>>
>>> --
>>> .^. .^.
>>> ( ) ( )
>>> === ===
>>> =[=]================================[=]=
>>> | | Ernesto Spinak | |
>>> | |spinaker at adinet.com.uy | |
>>> | | Montevideo, Uruguay | |
>>> | | tel/fax (598) 2622-3352 | |
>>> | | celular (598) 99612238 | |
>>> =[=]================================[=]=
>>> === ===
>>> ( ) ( )
>>> V V
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> --
> .^. .^.
> ( ) ( )
> === ===
> =[=]================================[=]=
> | | Ernesto Spinak | |
> | |spinaker at adinet.com.uy | |
> | | Montevideo, Uruguay | |
> | | tel/fax (598) 2622-3352 | |
> | | celular (598) 99612238 | |
> =[=]================================[=]=
> === ===
> ( ) ( )
> V V
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cb7423f/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120217/1cb7423f/attachment.vcf>
More information about the isis-users
mailing list