[Isis-users] ABCD y diacríticos
Maribel Cuadrado
Maribel.Cuadrado at uab.es
Mon Feb 20 09:10:36 CET 2012
Ernesto,
Los registros son exportados a un archivo ISO desde Winisis. Después
lanzo el ISO con el MX y creo el mst y el fichero invertido:
MX iso=todo.iso create=prova convert=ansi -all now tell=100
MX prova fst=@prova.fst fullinv/ansi=prova gizmo=middot gizmo=gansuc
actab=isisac.tab stw=@prova.stw now -all tell=1000
La base de datos que resulta del proceso la copio en ABCD. Desde ABCD
vuelvo a generar el fichero inverso.
En ABCD ya no consigo ver bien las eles geminadas (l·l), veo (lúl)
Esa base de datos es la que abro desde IAH.
Maribel Cuadrado
Departament d'Història Moderna i Contemporània
Al 17/02/2012 21:20, En/na spinaker ha escrit:
> Maribel
>
> ¿Los registros son ingresados por ABCD (es deir ansi nativo) o son
> ingresados en Winisis (ascii)
> y luego convertidos a ansi para publicar en el iAH?
> Porque a mí me aparece bien el middot
> Puse unas lineas de prueba abajo al final del registro en los datos de
> Resumen con la palabra /*col-legio*/
>
>
> Saludos
> Ernesto Spinak
>
>
> El 17/02/2012 9:52, Maribel Cuadrado escribió:
>> Ernesto,
>>
>> He seguido tus instrucciones y todo funciona bien (he de lanzar en
>> este orden: gizmo=middot gizmo=gansuc)
>>
>> El término "Col·legi" ha pasado a ser en el diccionario "collegi".
>>
>> De todas formas, no he solucionado la cuestión de la visualización de
>> los términos en el registro.
>> Se continua viendo "Colúlegi".
>> Imagino que es una cuestión de la conversión a Ansi (*convert=ansi*)
>>
>> Qué mes sugieres que puedo modificar?
>>
>>
>> Gracias
>>
>> Maribel
>> Universitat Autònoma de Barcelona
>>
>>
>>
>>
>>
>> Al 17/02/2012 10:31, En/na spinaker ha escrit:
>>> Maribel
>>>
>>> La instrucciones que muestro están generando una base pepe.mst/xrf
>>> cargando los datos directamente desde la consola
>>>
>>> mx seq=con significca que los datos los ingresas de forma
>>> interactiva desde la consola
>>> hasta que das Ctl + Z para terminar
>>>
>>> Saludos
>>> Ernesto
>>>
>>>
>>> El 17/02/2012 7:08, Maribel Cuadrado escribió:
>>>> Ernesto,
>>>>
>>>> No se si te entiendo bien.
>>>>
>>>> Se trata de realizar un archivo gizmo (podemos llamarlo middot) en
>>>> el cual he de especificar:
>>>> *c:\>mx seq=con create=pepe now
>>>> ·|
>>>> mfn= 1
>>>> 1 «·»
>>>> ^Z
>>>>
>>>> c:\>mx pepe
>>>> mfn= 1
>>>> 1 «·»
>>>>
>>>> *Al lanzar mi base de datos habré de especificar .....gizmo=gansuc
>>>> gizmo=middot....*
>>>> Pero el gizmo necesita una extension *.mst y *.xrf. porque sinó da
>>>> un error por no localizar el *.xrf
>>>>
>>>> Qué tipo de extensión he de darle al gizmo "middot" (*.in?)
>>>>
>>>> *Gràcias por tu paciencia.
>>>>
>>>> Maribel
>>>> Universitat Autònoma de Barcelona*
>>>>
>>>>
>>>> *
>>>>
>>>>
>>>>
>>>> Al 16/02/2012 16:39, En/na spinaker ha escrit:
>>>>> Maribel
>>>>>
>>>>> No sé si sigo tu pensamiento
>>>>> si quieres convertir la L· en L simple, lo que hay que hacer es
>>>>> tenero un gizmo previo
>>>>> convertir L· --> L y l· --> l
>>>>> significa que a la hora de indizar debes eliminar el "middot" del
>>>>> texto
>>>>>
>>>>> Alcanza con hacer un gizmo del tipo
>>>>> mx seq=con create=middot now
>>>>> ·|
>>>>> ^Z
>>>>> creará el archivo
>>>>>
>>>>> *c:\>mx seq=con create=pepe now
>>>>> ·|
>>>>> mfn= 1
>>>>> 1 «·»
>>>>> ^Z
>>>>>
>>>>> c:\>mx pepe
>>>>> mfn= 1
>>>>> 1 «·»
>>>>> *
>>>>> entonces si agregas al mx de indización el gizmo el middot será
>>>>> eliminado del string y no estara en el diccionario
>>>>>
>>>>>
>>>>> Saludos
>>>>> Ernesto
>>>>>
>>>>>
>>>>>
>>>>> El 16/02/2012 12:13, Maribel Cuadrado escribió:
>>>>>>
>>>>>> Hola,
>>>>>>
>>>>>> Entiendo el procedimiento. He creado una base de datos gizmo
>>>>>> (similar) a gansuc donde especificar el código ASCII y su
>>>>>> equivalencia.
>>>>>>
>>>>>> Por ejemplo, en GANSUC, para convertir la *Á* a *A* especifica:
>>>>>> V001 ! 192
>>>>>> v002 ! 065
>>>>>> V011! asc
>>>>>> v021! asc
>>>>>> v051! A mayúscula con acento grave
>>>>>> V052! A mayúscula
>>>>>>
>>>>>> Lo que no entiendo es como puedo específicar la L· para
>>>>>> convertirla en L, ya que no está en el código ASCII extendido
>>>>>> (sólo lo he localizado en el UTF8: U+013F, U+0140) ni tampoco
>>>>>> existe en la tabla ANSI. El único código que aparece en el ASCII
>>>>>> es el 250 (·) "middot".
>>>>>>
>>>>>> Otra cuestión puede ser que al convertir mi base de datos a
>>>>>> *ANSI* (MX iso=carga.iso create=prova *convert=ansi *-all now
>>>>>> tell=100), creo que ha sustituido el código 250 de ASCCI (·) por
>>>>>> el 250 de ANSI (ú).
>>>>>> Necesito indicarle que convierta el 250 (ú) por el 183 (·)
>>>>>>
>>>>>> Cómo debería indicarlo?
>>>>>>
>>>>>> V001! 250
>>>>>> V002! 183
>>>>>> V011! ansi
>>>>>> v021! ansi
>>>>>> v051! ú (250 de ANSI)
>>>>>> v052! middot (183 de ANSI)
>>>>>>
>>>>>> Perdonad mi ignorancia al respecto.
>>>>>>
>>>>>> Maribel Cuadrado
>>>>>> Universitat Autònoma de Barcelona
>>>>>>
>>>>>>
>>>>>> Al 16/02/2012 11:00, En/na spinaker ha escrit:
>>>>>>> Maribel
>>>>>>>
>>>>>>> El problema es que para ascii/ansi esa letra son dos letras,
>>>>>>> es decir hay dos caracteres
>>>>>>> de modo que en primer lugar deberias decidir cómo se va a
>>>>>>> convertir al indice
>>>>>>> L-L LÙL LÚL LL etc
>>>>>>> entonces deberas modifiicar el gansuc o preparar un gizmo
>>>>>>> especial para esa letra(s) y ponerlo en la linea de inversion del mx
>>>>>>>
>>>>>>> Saludos
>>>>>>> Ernesto Spinak
>>>>>>>
>>>>>>> El 16/02/2012 7:04, Maribel Cuadrado escribió:
>>>>>>>>
>>>>>>>> Hola,
>>>>>>>>
>>>>>>>> De nuevo vuelvo a plantear una cuestión, aun no resuelta:
>>>>>>>>
>>>>>>>> Se trata de la conversión correcta del diacrítico catalán (L·L,
>>>>>>>> l·l) en ABCD.
>>>>>>>>
>>>>>>>> Este diacrítico es: Ldot (Latin capital letter L with middle
>>>>>>>> dot) y ldot (Latin small letter l with middle dot), con los
>>>>>>>> códigos U+013F i U+0140 (en HTML, Ŀ i ŀ): L. i l.
>>>>>>>>
>>>>>>>> En UTF-8:
>>>>>>>> L·L [0xC4 0xBF (c4bf)]
>>>>>>>> l·l [0xC5 0x80 (c580)]
>>>>>>>>
>>>>>>>> Cuando lanzo mi aplicación utilizo:
>>>>>>>> mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc
>>>>>>>> actab=isisac.tab stw=@ prova.stw now -all tell=1000
>>>>>>>>
>>>>>>>> Con el uso del gizmo GANSUC
>>>>>>>> (http://www.infoisis.eti.br/tools/pgacgz.htm) logré solucionar
>>>>>>>> toda la problemática de acentos, pero la ele geminada (L·L y
>>>>>>>> l·l) se visualiza mal (LÚL y lúl) y no se recupera en el índice.
>>>>>>>>
>>>>>>>> Por los comentarios que me hicisteis el pasado mes de octubre
>>>>>>>> se había de preparar una tabla especial que recogiera este
>>>>>>>> diacrítico.
>>>>>>>> ¿Alguien puede ayudarme o indicarme cómo elaborarla?
>>>>>>>>
>>>>>>>> Maribel Cuadrado
>>>>>>>> Universitat Autònoma de Barcelona
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> isis-users mailing list
>>>>>>>> isis-users at iccisis.org
>>>>>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>>>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>>>>>
>>>>>>>
>>>>>>> --
>>>>>>> .^. .^.
>>>>>>> ( ) ( )
>>>>>>> === ===
>>>>>>> =[=]================================[=]=
>>>>>>> | | Ernesto Spinak | |
>>>>>>> | |spinaker at adinet.com.uy | |
>>>>>>> | | Montevideo, Uruguay | |
>>>>>>> | | tel/fax (598) 2622-3352 | |
>>>>>>> | | celular (598) 99612238 | |
>>>>>>> =[=]================================[=]=
>>>>>>> === ===
>>>>>>> ( ) ( )
>>>>>>> V V
>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> isis-users mailing list
>>>>>> isis-users at iccisis.org
>>>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>>>
>>>>>
>>>>> --
>>>>> .^. .^.
>>>>> ( ) ( )
>>>>> === ===
>>>>> =[=]================================[=]=
>>>>> | | Ernesto Spinak | |
>>>>> | |spinaker at adinet.com.uy | |
>>>>> | | Montevideo, Uruguay | |
>>>>> | | tel/fax (598) 2622-3352 | |
>>>>> | | celular (598) 99612238 | |
>>>>> =[=]================================[=]=
>>>>> === ===
>>>>> ( ) ( )
>>>>> V V
>>>>
>>>>
>>>>
>>>> _______________________________________________
>>>> isis-users mailing list
>>>> isis-users at iccisis.org
>>>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>>>> Or contact Henk Rutten:hlrutten at xs4all.nl
>>>
>>>
>>> --
>>> .^. .^.
>>> ( ) ( )
>>> === ===
>>> =[=]================================[=]=
>>> | | Ernesto Spinak | |
>>> | |spinaker at adinet.com.uy | |
>>> | | Montevideo, Uruguay | |
>>> | | tel/fax (598) 2622-3352 | |
>>> | | celular (598) 99612238 | |
>>> =[=]================================[=]=
>>> === ===
>>> ( ) ( )
>>> V V
>>
>>
>>
>> _______________________________________________
>> isis-users mailing list
>> isis-users at iccisis.org
>> To manage your own subscription options go to:http://lists.iccisis.org/listinfo/isis-users
>> Or contact Henk Rutten:hlrutten at xs4all.nl
>
>
> --
> .^. .^.
> ( ) ( )
> === ===
> =[=]================================[=]=
> | | Ernesto Spinak | |
> | |spinaker at adinet.com.uy | |
> | | Montevideo, Uruguay | |
> | | tel/fax (598) 2622-3352 | |
> | | celular (598) 99612238 | |
> =[=]================================[=]=
> === ===
> ( ) ( )
> V V
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120220/a66a36f8/attachment.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: not available
Type: image/png
Size: 11014 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120220/a66a36f8/attachment.png>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: Maribel_Cuadrado.vcf
Type: text/x-vcard
Size: 605 bytes
Desc: not available
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20120220/a66a36f8/attachment.vcf>
More information about the isis-users
mailing list