<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html;charset=ISO-8859-1" http-equiv="Content-Type">
</head>
<body bgcolor="#ffffff" text="#000000">
Estimada Renata<br>
<br>
<i>(Favor que alguien traduzca la ingl&eacute;s pues no tengo tiempo en este
momento)</i><br>
<br>
La indizaci&oacute;n est&aacute;ndard de ISIS por t&eacute;cnicas 4 y 8 recupera cadenas de
caracteres (strings) formadas por los caracteres definidos en la una
tabla isisac.tab<br>
<br>
La tabla por defecto del Isis considera <u><i>palabra </i></u>a
cualquier string de caracteres solamente alfab&eacute;ticos.<br>
Esto significa que los n&uacute;meros, espacios en blanco y caracteres
tipogr&aacute;ficos dividen las cadenas en "palabras". <br>
El problema se plantea en la definici&oacute;n de "<i><u>palabra</u></i>".<br>
<br>
Algunas soluciones que se han ofrecido es incluir los n&uacute;meros en la
lista isisac.tab, entonces tambi&eacute;n son inclu&iacute;dos como "palabras. Pero
esta soluci&oacute;n es bastante limitada. Por ejemplo tenemos el caso que
plantea t&uacute; planteas y que Alisson informa correctamente que no ha
funcionado.<br>
<br>
Ella tiene un n&uacute;mero 12589.569 y como el punto (.) es separador,
entonces se generan dos claves<br>
12589 y 569<br>
<br>
Lo mismo ocurrir&iacute;a si tuvi&eacute;ramos c&oacute;digos como los expedientes o las
leyes 10.751/12, Decreto 987/2010<br>
<br>
De modo que la modificaci&oacute;n del isisac.tab no resuelve el tema
completamente, incluso "ensucia" el archivo invertido cuando indiza
campos donde hay n&uacute;meros y no queremos que &eacute;stos se indicen. <br>
Una soluci&oacute;n "limpia" viene por otra v&iacute;a.<br>
<br>
Para eso CISIS usa los procs( ), que adem&aacute;s de ser un par&aacute;metro del MX
tambi&eacute;n es una instrucci&oacute;n del formato.<br>
<br>
Problema:<br>
tenemos los siguientes valores y queremos generar los siguientes &iacute;ndices<br>
<b><font face="Courier New, Courier, monospace"><br>
a)&nbsp; 12589.569 --&gt;&nbsp; 12589.569&nbsp;&nbsp;&nbsp; 12589569&nbsp;&nbsp; 12589&nbsp;&nbsp; 569<br>
b)&nbsp; 1234/001&nbsp; --&gt;&nbsp; 1234/001&nbsp;&nbsp;&nbsp;&nbsp; 1234&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 001</font></b><br>
<br>
supongamos que estos valores est&aacute;n en el campo 590, entonces<br>
<br>
Todas estas variantes de los n&uacute;meros son necesarios para que el usuario
en la consulta "tipo google" del IAH pueda recuperar los valores
indistintamente si usa puntos o barras o si no los usa<br>
Presentamos en forma simple y did&aacute;ctica, paso a paso, pues las
instrucciones siguientes pueden optimizarse en l&iacute;neas m&aacute;s compactas<br>
<br>
Ejemplo (a)<br>
<b><font face="Courier New, Courier, monospace">590 0 if p(v590) then
'TW_', v590 fi<br>
590 0 if p(v590) then 'TW_', replace(v590),'.','') fi<br>
590 0 if p(v590) then 'TW_', proc('Gsplit=590=.') (v590/)<br>
</font></b><br>
Ejemplo (b)<br>
<b><font face="Courier New, Courier, monospace">590 0 if p(v590) then
'TW_', v590 fi<br>
590 0 if p(v590) then 'TW_', proc('Gsplit=590=/') (v590/)</font></b><br>
<br>
tambi&eacute;n es posible extraer los n&uacute;meros de un texto usando&nbsp;
proc('Gsplit/clean=&lt;tag&gt;,numbers')<br>
hay muchas opciones que no son usadas pero muy eficientes para indizar<br>
<br>
Con tiempo daremos otros ejemplos. <br>
El comando proc( ) es indispensable para hacer FST realmente avanzadas<br>
<br>
Saludos<br>
Ernesto Spinak<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<pre class="moz-signature" cols="72">-- 
  .^.                                .^.
  ( )                                ( )
  ===                                ===
 =[=]================================[=]=
  | |  Ernesto Spinak                | |
  | |  <a class="moz-txt-link-abbreviated" href="mailto:spinaker@adinet.com.uy">spinaker@adinet.com.uy</a>        | |
  | |  Montevideo, Uruguay           | |
  | |  tel/fax  (5982) 622-3352      | |
  | |  celular  (598)  99612238      | |
 =[=]================================[=]=
  ===                                ===
  ( )                                ( )
   V                                  V </pre>
</body>
</html>