<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
</head>
<body text="#000000" bgcolor="#ffffff">
Ernesto,<br>
<br>
He seguido tus instrucciones y todo funciona bien (he de lanzar en
este orden: gizmo=middot gizmo=gansuc)<br>
<br>
El término "Col·legi" ha pasado a ser en el diccionario "collegi".<br>
<br>
De todas formas, no he solucionado la cuestión de la visualización
de los términos en el registro. <br>
Se continua viendo "Colúlegi".<br>
Imagino que es una cuestión de la conversión a Ansi (<b>convert=ansi</b>)<br>
<br>
Qué mes sugieres que puedo modificar?<br>
<br>
<br>
Gracias<br>
<br>
Maribel<br>
Universitat Autònoma de Barcelona<br>
<br>
<br>
<br>
<br>
<br>
Al 17/02/2012 10:31, En/na spinaker ha escrit:
<blockquote cite="mid:4F3E1E7E.3020108@adinet.com.uy" type="cite">
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
Maribel<br>
<br>
La instrucciones que muestro están generando una base
pepe.mst/xrf <br>
cargando los datos directamente desde la consola<br>
<br>
mx seq=con significca que los datos los ingresas de forma
interactiva desde la consola<br>
hasta que das Ctl + Z para terminar<br>
<br>
Saludos<br>
Ernesto<br>
<br>
<br>
El 17/02/2012 7:08, Maribel Cuadrado escribió:
<blockquote cite="mid:4F3E18FD.2030307@uab.es" type="cite">
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
<title></title>
Ernesto,<br>
<br>
No se si te entiendo bien.<br>
<br>
Se trata de realizar un archivo gizmo (podemos llamarlo middot)
en el cual he de especificar:<br>
<b><font face="Courier New, Courier, monospace"><big>c:\>mx
seq=con create=pepe now<br>
·|<br>
mfn= 1<br>
1 «·»<br>
^Z<br>
<br>
c:\>mx pepe<br>
mfn= 1<br>
1 «·»<br>
<br>
</big></font></b><font face="Courier New, Courier,
monospace"><big>Al lanzar mi base de datos habré de
especificar .....gizmo=gansuc gizmo=middot....</big></font><b><font
face="Courier New, Courier, monospace"><big><br>
Pero el gizmo necesita una extension *.mst y *.xrf. porque
sinó da un error por no localizar el *.xrf<br>
<br>
Qué tipo de extensión he de darle al gizmo "middot"
(*.in?)<br>
<br>
</big></font></b><font face="Courier New, Courier,
monospace"><big>Gràcias por tu paciencia.<br>
<br>
Maribel<br>
Universitat Autònoma de Barcelona</big></font><b><font
face="Courier New, Courier, monospace"><big><br>
<br>
<br>
</big></font></b><br>
<br>
<br>
<br>
Al 16/02/2012 16:39, En/na spinaker ha escrit:
<blockquote cite="mid:4F3D231F.20300@adinet.com.uy" type="cite">
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
Maribel<br>
<br>
No sé si sigo tu pensamiento<br>
si quieres convertir la L· en L simple, lo que hay que
hacer es tenero un gizmo previo<br>
convertir L· --> L y l· --> l<br>
significa que a la hora de indizar debes eliminar el "middot"
del texto<br>
<br>
Alcanza con hacer un gizmo del tipo <br>
mx seq=con create=middot now<br>
·|<br>
^Z<br>
creará el archivo<br>
<big><br>
</big><b><font face="Courier New, Courier, monospace"><big>c:\>mx
seq=con create=pepe now<br>
·|<br>
mfn= 1<br>
1 «·»<br>
^Z<br>
<br>
c:\>mx pepe<br>
mfn= 1<br>
1 «·»</big><br>
</font></b><br>
entonces si agregas al mx de indización el gizmo el middot
será eliminado del string y no estara en el diccionario<br>
<br>
<br>
Saludos<br>
Ernesto<br>
<br>
<br>
<br>
El 16/02/2012 12:13, Maribel Cuadrado escribió:
<blockquote cite="mid:4F3D0EF2.2040105@uab.es" type="cite">
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
<br>
Hola,<br>
<br>
Entiendo el procedimiento. He creado una base de datos gizmo
(similar) a gansuc donde especificar el código ASCII y su
equivalencia.<br>
<br>
Por ejemplo, en GANSUC, para convertir la <b>Á</b> a <b>A</b>
especifica:<br>
V001 ! 192<br>
v002 ! 065<br>
V011! asc<br>
v021! asc<br>
v051! A mayúscula con acento grave<br>
V052! A mayúscula<br>
<br>
Lo que no entiendo es como puedo específicar la L· para
convertirla en L, ya que no está en el código ASCII
extendido (sólo lo he localizado en el UTF8: U+013F, U+0140)
ni tampoco existe en la tabla ANSI. El único código que
aparece en el ASCII es el 250 (·) "middot". <br>
<br>
Otra cuestión puede ser que al convertir mi base de datos a
<b>ANSI</b> (MX iso=carga.iso create=prova <b>convert=ansi
</b>-all now tell=100), creo que ha sustituido el código 250
de ASCCI (·) por el 250 de ANSI (ú).<br>
Necesito indicarle que convierta el 250 (ú) por el 183 (·)<br>
<br>
Cómo debería indicarlo?<br>
<br>
V001! 250<br>
V002! 183<br>
V011! ansi<br>
v021! ansi<br>
v051! ú (250 de ANSI)<br>
v052! middot (183 de ANSI)<br>
<br>
Perdonad mi ignorancia al respecto.<br>
<br>
Maribel Cuadrado<br>
Universitat Autònoma de Barcelona<br>
<br>
<br>
Al 16/02/2012 11:00, En/na spinaker ha escrit:
<blockquote cite="mid:4F3CD3C8.2030404@adinet.com.uy"
type="cite">
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
Maribel<br>
<br>
El problema es que para ascii/ansi esa letra son dos
letras, es decir hay dos caracteres<br>
de modo que en primer lugar deberias decidir cómo se va a
convertir al indice<br>
L-L LÙL LÚL LL etc<br>
entonces deberas modifiicar el gansuc o preparar un gizmo
especial para esa letra(s) y ponerlo en la linea de
inversion del mx<br>
<br>
Saludos<br>
Ernesto Spinak<br>
<br>
El 16/02/2012 7:04, Maribel Cuadrado escribió:
<blockquote cite="mid:4F3CC684.8070202@uab.es" type="cite">
<br>
Hola, <br>
<br>
De nuevo vuelvo a plantear una cuestión, aun no
resuelta: <br>
<br>
Se trata de la conversión correcta del diacrítico
catalán (L·L, l·l) en ABCD. <br>
<br>
Este diacrítico es: Ldot (Latin capital letter L with
middle dot) y ldot (Latin small letter l with middle
dot), con los códigos U+013F i U+0140 (en HTML,
Ŀ i ŀ): Ŀ i ŀ <br>
<br>
En UTF-8: <br>
L·L [0xC4 0xBF (c4bf)] <br>
l·l [0xC5 0x80 (c580)] <br>
<br>
Cuando lanzo mi aplicación utilizo: <br>
mx prova fst=@ prova.fst fullinv/ansi=prova gizmo=gansuc
actab=isisac.tab stw=@ prova.stw now -all tell=1000 <br>
<br>
Con el uso del gizmo GANSUC (<a moz-do-not-send="true"
class="moz-txt-link-freetext"
href="http://www.infoisis.eti.br/tools/pgacgz.htm">http://www.infoisis.eti.br/tools/pgacgz.htm</a>)
logré solucionar toda la problemática de acentos, pero
la ele geminada (L·L y l·l) se visualiza mal (LÚL y lúl)
y no se recupera en el índice. <br>
<br>
Por los comentarios que me hicisteis el pasado mes de
octubre se había de preparar una tabla especial que
recogiera este diacrítico. <br>
¿Alguien puede ayudarme o indicarme cómo elaborarla? <br>
<br>
Maribel Cuadrado <br>
Universitat Autònoma de Barcelona <br>
<br>
<br>
<br>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<br>
<pre wrap="">_______________________________________________
isis-users mailing list
<a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:isis-users@iccisis.org">isis-users@iccisis.org</a>
To manage your own subscription options go to: <a moz-do-not-send="true" class="moz-txt-link-freetext" href="http://lists.iccisis.org/listinfo/isis-users">http://lists.iccisis.org/listinfo/isis-users</a>
Or contact Henk Rutten: <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:hlrutten@xs4all.nl">hlrutten@xs4all.nl</a>
</pre>
</blockquote>
<br>
<br>
<pre class="moz-signature" cols="72">--
.^. .^.
( ) ( )
=== ===
=[=]================================[=]=
| | Ernesto Spinak | |
| | <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:spinaker@adinet.com.uy">spinaker@adinet.com.uy</a> | |
| | Montevideo, Uruguay | |
| | tel/fax (598) 2622-3352 | |
| | celular (598) 99612238 | |
=[=]================================[=]=
=== ===
( ) ( )
V V </pre>
</blockquote>
<br>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<br>
<pre wrap="">_______________________________________________
isis-users mailing list
<a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:isis-users@iccisis.org">isis-users@iccisis.org</a>
To manage your own subscription options go to: <a moz-do-not-send="true" class="moz-txt-link-freetext" href="http://lists.iccisis.org/listinfo/isis-users">http://lists.iccisis.org/listinfo/isis-users</a>
Or contact Henk Rutten: <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:hlrutten@xs4all.nl">hlrutten@xs4all.nl</a>
</pre>
</blockquote>
<br>
<br>
<pre class="moz-signature" cols="72">--
.^. .^.
( ) ( )
=== ===
=[=]================================[=]=
| | Ernesto Spinak | |
| | <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:spinaker@adinet.com.uy">spinaker@adinet.com.uy</a> | |
| | Montevideo, Uruguay | |
| | tel/fax (598) 2622-3352 | |
| | celular (598) 99612238 | |
=[=]================================[=]=
=== ===
( ) ( )
V V </pre>
</blockquote>
<br>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<br>
<pre wrap="">_______________________________________________
isis-users mailing list
<a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:isis-users@iccisis.org">isis-users@iccisis.org</a>
To manage your own subscription options go to: <a moz-do-not-send="true" class="moz-txt-link-freetext" href="http://lists.iccisis.org/listinfo/isis-users">http://lists.iccisis.org/listinfo/isis-users</a>
Or contact Henk Rutten: <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:hlrutten@xs4all.nl">hlrutten@xs4all.nl</a>
</pre>
</blockquote>
<br>
<br>
<pre class="moz-signature" cols="72">--
.^. .^.
( ) ( )
=== ===
=[=]================================[=]=
| | Ernesto Spinak | |
| | <a moz-do-not-send="true" class="moz-txt-link-abbreviated" href="mailto:spinaker@adinet.com.uy">spinaker@adinet.com.uy</a> | |
| | Montevideo, Uruguay | |
| | tel/fax (598) 2622-3352 | |
| | celular (598) 99612238 | |
=[=]================================[=]=
=== ===
( ) ( )
V V </pre>
</blockquote>
<br>
</body>
</html>