[Isis-users] Indización a Texto Completo/Full Text Indexing

Cristina Ledon Tedros cledon at caribex.cu
Thu Oct 2 16:28:52 CEST 2014


Hola, 

He configurado la FST siguiendo el ejemplo de la base Cepal, de modo que el campo "Texto Completo" aparece así:

mhu,'|TX_|',(v10|%|/)

utilizando la técnica 8 de indización.

y mhu,(v10|%|/) en otra línea, esta vez utilizando la técnica 4.

Con respecto al tamaño del texto, el mayor tiene unos 26Kb, aunque tengo previsto ingresar textos más extensos integramente, para facilitar la consulta de los usuarios.

No tengo claro donde puede estar el error ni por qué me está afectando al resto de los indices, que comienzan a salir en blanco.

Creo que el conflicto se encuentra efectivamente en los textos largos, pues al eliminar el de 26Kb, el resto de los indices y el del propio campo de texto completo comienzan a funcionar sin problema.

Les agradecería cualquier comentario que me pudiera ayudar.

Saludos cordiales,

Cristina Ledón. 


-----Mensaje original-----
De: De Smet Egbert [mailto:egbert.desmet en uantwerpen.be] 
Enviado el: jueves, 02 de octubre de 2014 3:47
Para: Cristina Ledon Tedros; isis-users en iccisis.org
Asunto: RE: [Isis-users] Indización a Texto Completo/Full Text Indexing

Hola,

un problema posible sería el tamaño del texto. Si el tamaño es más que 32Kb, tienes que usar una versión especial de CISIS (ffi) lo que permite registros hacia 1 Mb. Ya esta previsto el uso de estas versiónes especiales desde ABCD version 1.2b.
Puedes averiguar si su problema también se presenta con articulos brieves ?
Y por supuesto hay que asegurarse de que sea correcto su entrada en el FST. Si no es correcto, no va a producir las listas invertidas y estos quedan vacillas.

Egbert de Smet
Universiteit Antwerpen
________________________________________
From: isis-users [isis-users-bounces+egbert.desmet=ua.ac.be en iccisis.org] on behalf of Cristina Ledon Tedros [cledon en caribex.cu]
Sent: Wednesday, October 01, 2014 11:50 PM
To: isis-users en iccisis.org
Subject: [Isis-users] Indización a Texto Completo/Full Text Indexing

Estimados listeros:

Estoy trabajando en la versión 1.3 de ABCD, sobre el desarrollo de una base de datos a texto completo. Para ello, he creado un campo llamado Texto Completo, que declaré en la FDT como Html area, siguiendo el modelo del campo Resumen de la base de muestra Cepal.

Este campo sería indizado bajo las técnicas 4 (palabras) sin prefijo y 8 (palabras), esta última con un prefijo que declaro en la FST,no así en la FDT.

He seguido la misma configuración de la base Cepal (biblo). Al inicio me funcionó y luego de incorporar varios registros, con el texto íntegro del artículo y actualizar el archivo invertido, no solo no me funciona este campo, sino que los demás indices aparecen en blanco también.

No encuentro cuál puede ser el problema.

Por favor, les agradecería su ayuda.

Saludos cordiales,

Cristina Ledón.
Especialista en Gestión Documental.
Cuba.



-----Mensaje original-----
De: isis-users [mailto:isis-users-bounces+cledon=caribex.cu en iccisis.org] En nombre de isis-users-request en iccisis.org Enviado el: miércoles, 01 de octubre de 2014 5:00
Para: isis-users en iccisis.org
Asunto: isis-users Digest, Vol 48, Issue 1

Send isis-users mailing list submissions to
        isis-users en iccisis.org

To subscribe or unsubscribe via the World Wide Web, visit
        http://lists.iccisis.org/listinfo/isis-users
or, via email, send a message with subject or body 'help' to
        isis-users-request en iccisis.org

You can reach the person managing the list at
        isis-users-owner en iccisis.org

When replying, please edit your Subject line so it is more specific than "Re: Contents of isis-users digest..."


Today's Topics:

   1. Re: Puzzle - Dúvida (Antonio Carlos Tafari Filho)
   2. Re: Puzzle - Dúvida (Rafael Santini (Biblioshop))


----------------------------------------------------------------------

Message: 1
Date: Tue, 30 Sep 2014 16:11:31 -0300
From: Antonio Carlos Tafari Filho <actafari en gmail.com>
To: "Rafael Santini (Biblioshop)" <santini en biblioshop.com.br>
Cc: isis-users en iccisis.org
Subject: Re: [Isis-users] Puzzle - Dúvida
Message-ID:
        <CAGYE629r8CeTAd8CrraQ0Ai-E3xr6pnrCXRL64PqoTDFAtXu-Q en mail.gmail.com>
Content-Type: text/plain; charset="utf-8"

Olá.

Vamos ao que eu fiz:

A) Original
base.mst = 166,402,048 bytes
base.xrf = 398,848 bytes
MFN = 98839
Erro ASCII = 6
MFN alterados = 14

B) Apenas regerado o XRF
> del *.xrf
> mkxrf base
base.mst = 166,402,048 bytes
base.xrf = 398,848 bytes
MFN = 98839
Erro ASCII = 0
MFN alterados = 0

C) Regerado o XRF, exportada para ISO, reimportada do ISO
> del *.xrf
> mkxrf base
> mx base iso=base.iso -all now
> del base.mst
> del base.xrf
> mx iso=base.iso create=base -all now
base.mst = 61,049,856 bytes
base.xrf = 398,848 bytes
MFN = 98834
Erro ASCII = 0
MFN alterados = 0

D) Exportado e reimportado ISO pelo Winisis
> Database > Export > base.iso > output line = 0 Util > Erase Database > 
> Yes > Yes Database > Import > base.iso > input line = 0 > Options Load
base.mst = 61,046,784
base.xrf = 398,848
MFN = 98834
Erro ASCII = 6
MFN alteardos = 0

A princípio, a opção B será a melhor, por preservar a ordem dos meus MFN para análise futura.

Agradeço muito pela atenção!!!

Abraços.




Em 29 de setembro de 2014 21:23, Rafael Santini (Biblioshop) < santini en biblioshop.com.br> escreveu:

>   No caso, o arquivo MST também está corrompido.
>
> A minha sugestão a princípio é:
>
> 1. Recriar o arquivo XRF.
>
> 2. Limpar esses caracteres desses 2 registros.
>
> 3. Realizar a exportação e a importação da base.
>
> 4. Verificar esses 2 registros. Possivelmente esses foram perdidos.
>
> Se ao final houver diferença na quantidade de registros, pergunto:
> você consegue executar o seguinte comando na base original após ter 
> recriado o XRF?
>
> mx base now
>
> No caso, ele deverá mostrar todos os registros na tela.
>
>
>  *From:* Antonio Carlos Tafari Filho <actafari en gmail.com>
> *Sent:* Monday, September 29, 2014 9:07 PM
> *To:* Rafael Santini (Biblioshop) <santini en biblioshop.com.br>
> *Cc:* isis-users en iccisis.org
> *Subject:* Re: [Isis-users] Puzzle - Dúvida
>
>  Olá.
>
> Nem estava me importando com os problemas ASCII.
>
> Agora que fui olhar, as 6 ocorrências de problemas são de apenas 2 
> registros (3 de cada).
>
> Ao dar um mx na base original, para verificar estes registros:
>
> 1) o MFN 46827 está nitidamente com os campos "desalinhados", 
> misturando os dados de campos diferentes e com vários caracteres 
> especiais, provavelmente originados do cabeçalho do registro.
> 2) o MFN 93597 está direcionando para o MFN 46827.
> 3) o Oraculo reconhece o registro 93957 como sendo MFN alterado.
>
> Exemplo 1: mx base from=46827 to=46827
>
>  mfn= 46827
> 20  «é b☺♦ î f☺  î »
>   1  «å☺↓ ♀ ƒ☺♠ s Ñ☺     « «☺► ╚ ╛☺»
>   2  «► ░ ╬»
>   8  «☺► Acervo Centr»
> 25  «al343.542.5:347.635(81)(082)D»
> 40  «533iArtigo de livroDIAS, Mar»
> 30  «ia Berenice (coord.)Incesto »
> 43  «e alienaç╞o parentalBARBOSA, Gabriella Ferrares» 50 
> «eSegUniversidade de S╞o Pa»
> 55  «ulo.22.24»
> 60  «7Português23/10/2012 »
> 70  «- HA»
> 141  «F         »
> 155  «             »
>
> Exemplo 2: mx base from=93597 to=93597
>
> mfn= 46827
> 20  «é b☺♦ î f☺  î »
>   1  «å☺↓ ♀ ƒ☺♠ s Ñ☺     « «☺► ╚ ╛☺»
>   2  «► ░ ╬»
>   8  «☺► Acervo Centr»
> 25  «al343.542.5:347.635(81)(082)D»
> 40  «533iArtigo de livroDIAS, Mar»
> 30  «ia Berenice (coord.)Incesto »
> 43  «e alienaç╞o parentalBARBOSA, Gabriella Ferrares» 50 
> «eSegUniversidade de S╞o Pa»
> 55  «ulo.22.24»
> 60  «7Português23/10/2012 »
> 70  «- HA»
> 141  «F         »
> 155  «             »
>
> Abraços.
>
>
>
> Em 29 de setembro de 2014 20:07, Rafael Santini (Biblioshop) < 
> santini en biblioshop.com.br> escreveu:
>
>>   Pelo seu relato, o XRF está corrompido, visto que ao tentar acessar 
>> o MFN 1932 ele mostra o MFN 84561.
>>
>> Você conseguiu localizar e corrigir os caracteres ASCII menores que 32?
>>
>>
>>  *From:* Antonio Carlos Tafari Filho <actafari en gmail.com>
>> *Sent:* Monday, September 29, 2014 7:17 PM
>>  *To:* Rafael Santini (Biblioshop) <santini en biblioshop.com.br>
>> *Cc:* isis-users en iccisis.org
>> *Subject:* Re: [Isis-users] Puzzle - Dúvida
>>
>>   Olá Rafael.
>>
>> Primeiramente, me desculpe pelo erro de digitação...
>>
>> A base original tem 98677 registros e a base nova tem 98672, 
>> totalizando apenas 5 registros de diferença.
>>
>> Ao tentar utilizar o MX para gerar o arquivo TXT da base antiga, 
>> retorna
>> "fatal: recread/check/base". Utilizei o mkxrf para tentar corrigir, o 
>> que aparentemente de certo. Após gerei o TXT.
>>
>> - old.txt =   68.522.419 bytes
>> - new.txt = 68.518.464 bytes
>>
>> Nenhum programa está conseguindo comparar os dois arquivos deste 
>> tamanho...
>>
>> Regerei os arquivos TXT com 10 mil registros, para comprar. O que eu 
>> descobri foram diferenças naqueles registros com MFN alterados 
>> (aqueles 14).
>>
>> Então tentei ler um registro (1 dos 14 com MFN alterados), da base 
>> antiga, antes do mkxrf. O Resultado não é o MFN não é o pesquisado.
>>
>> Ex:
>> > mx base from=1932 to=1932
>> >
>> > mfn= 84561
>> >  20  «Acervo Central»
>> >  1  «340.11(430)(081)=134.3»
>> (...)
>>
>> Realizei a execução do mkxrf o resultado agora fica assim:
>>
>>  > mx base from=1932 to=1932
>> >
>> > mfn=  1932
>>  > 20  «Acervo Central»
>> > 151  «26»
>>  (...)
>>
>> Isso pode significar que o arquivo MST está com problema? Se sim, só 
>> de eu gerar um novo XRF (mkxrf) ele já consegue corrigir estes 
>> problemas? Acho que com o mkxrf estou perdendo informações.
>>
>> Obrigado.
>>
>>
>>
>>
>>
>> Em 29 de setembro de 2014 17:26, Rafael Santini (Biblioshop) < 
>> santini en biblioshop.com.br> escreveu:
>>
>>>   O percentual é relativo, pois depende da quantidade de alterações 
>>> realizadas na base de dados. De qualquer forma, a princípio você tem 
>>> um problema de fato, pois tem 98677 registros e após a importação fica 96872.
>>> Acho que a primeira coisa que deves fazer é resolver essas 6 
>>> ocorrências ASCII menos que 32 e ver se obtêm a mesma quantidade de 
>>> registros após importação. Após obter a mesma quantidade de 
>>> registros depois da importação e exportação, podes fazer uma 
>>> comparação entre as duas bases através de arquivos texto gerados pelo MX. Exemplo:
>>>
>>> mx base1 now > base1.txt
>>> mx base2 now > base2.txt
>>>
>>> Então, com algum utilitário de diferença de arquivos (eu 
>>> particularmente uso o editor de texto PSPad), você pode comparar os 
>>> dois arquivos para ver se as duas bases têm o mesmo conteúdo ou 
>>> identificar o que tem de diferente se for o caso.
>>>
>>>   *From:* Antonio Carlos Tafari Filho <actafari en gmail.com>
>>> *Sent:* Monday, September 29, 2014 5:03 PM
>>> *To:* Rafael Santini (Biblioshop) <santini en biblioshop.com.br>
>>> *Cc:* isis-users en iccisis.org
>>> *Subject:* Re: [Isis-users] Puzzle - Dúvida
>>>
>>>   Olá Rafael.
>>>
>>> O que eu não entendo é que o arquivo não ficou ligeiramente menor, 
>>> por supostamente ter suprimindo alguns caracteres ASCII e alguns 
>>> registros logicamente apagados...
>>>
>>> Ele ficou com apenas 37% do tamanho original!!!
>>>
>>> Ou o ISIS tem um sistema de inserção de registros novos de qualidade 
>>> muito duvidosa (perdendo muito espaço entre um registro e outro), ou 
>>> estou perdendo MUITA informação entre a exportação e reimportação.
>>> Eu acredito em uma terceira hipótese: que minha base esteja com 
>>> algum problema, e que este problema esteja causando esta inflação de 
>>> dados, pois é mais que o dobro de informação existente entre a base 
>>> atual e a base reimportada que efetivamente não existe.
>>>
>>> No arquivo original, o Oraculo diz:
>>>
>>> - Tamanho do MST: 164.309.504 bytes
>>> - Tamanho do XRF: 397.824 bytes
>>> - Maior MFN: 98677
>>> - 0 registros fisicamente deletados
>>> - 0 registros bloqueados
>>> - 0 registros logicamente deletados
>>> - 0 registros com erro de leitura
>>> - 14 MFN alterados
>>> - 6 ocorrências com caracteres ASCII menores que 32.
>>>
>>> Depois de exportado e reimportado:
>>>
>>> - Tamanho do MST: 60.993.024 bytes
>>> - Tamanho do XRF: 397.824 bytes
>>> - Maior MFN: 96872
>>>  - 0 registros fisicamente deletados
>>> - 0 registros bloqueados
>>> - 0 registros logicamente deletados
>>> - 0 registros com erro de leitura
>>> - 0 MFN alterados
>>> - 6 ocorrências com caracteres ASCII menores que 32.
>>>
>>> Entecipadamente, muito obrigado!!!
>>>
>>>
>>>
>>>
>>> Em 29 de setembro de 2014 13:48, Rafael Santini (Biblioshop) < 
>>> santini en biblioshop.com.br> escreveu:
>>>
>>>>   É normal que o arquivo MST fique menor após exportar e importar a 
>>>> base de dados, pois as alterações realizadas são adicionadas ao 
>>>> final do arquivo. Entretanto, os registros logicamente apagados são 
>>>> excluídos definitivamente nesse processo e se a base possuir 
>>>> caracteres ASCII menos que 32 em algum campo poderá causar perda de 
>>>> informações. Quais são os problemas que o Oráculo mostrou?
>>>>
>>>>  *From:* Antonio Carlos Tafari Filho <actafari en gmail.com>
>>>> *Sent:* Monday, September 29, 2014 1:04 PM
>>>> *To:* isis-users en iccisis.org
>>>> *Subject:* [Isis-users] Puzzle - Dúvida
>>>>
>>>>   Olá. / Hi.
>>>>
>>>> Eu tenho um base ISIS onde o arquivos MST está com 164.309.504 
>>>> bytes. / I use a ISIS base with 164.309.504 bytes of size (MST file).
>>>>
>>>> O software Oraculo diz que tenho vários registros com problemas 
>>>> (16). / The Oraculo software show me 16 MFN with problem.
>>>>
>>>> Eu exportei a base para ISO, e reimportei. / I created a exported 
>>>> ISO file and imported again.
>>>>
>>>> O arquivo MST resultante tem apenas 60.993.024 bytes. / The new MST 
>>>> file was only 60.993.024 bytes.
>>>>
>>>> Este procedimento foi apenas para teste. / This procedure was only 
>>>> for testing.
>>>>
>>>> Minha dúvida é a seguinte: O porque a diferença é tão grande? Minha 
>>>> base está se deteriorando? Ela provavelmente está com algum 
>>>> problema? / My
>>>> question: why the size difference is so large? The current MST file 
>>>> is deteriorating? It has a problem?
>>>>
>>>> Obrigado / Tks.
>>>>
>>>>
>>>> ------------------------------
>>>> _______________________________________________
>>>> isis-users mailing list
>>>> isis-users en iccisis.org
>>>> To manage your own subscription options go to:
>>>> http://lists.iccisis.org/listinfo/isis-users
>>>> Or contact Henk Rutten: hlrutten en xs4all.nl
>>>>
>>>
>>
>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20140930/f4fee850/attachment-0001.html>

------------------------------

Message: 2
Date: Tue, 30 Sep 2014 17:17:44 -0300
From: "Rafael Santini \(Biblioshop\)" <santini en biblioshop.com.br>
To: "Antonio Carlos Tafari Filho" <actafari en gmail.com>
Cc: isis-users en iccisis.org
Subject: Re: [Isis-users] Puzzle - Dúvida
Message-ID: <0D1C1564F9FD41E2AF8C4674B86DE9DB en RafaelDesktop>
Content-Type: text/plain; charset="utf-8"

No caso, se você exportar e importar, seja pelo MX ou pelo WinISIS, sempre perde 5 registros?

Você consegue executar o seguinte comando com sucesso?

mx base now

Imagino que ao recriar o XRF você esteja ficando com 5 registros vazios.

Tenho um utilitário que fez uma análise dos registros semelhante ao Oráculo e que informe os registros vazios. Segue o link para download:

https://www.dropbox.com/s/1k7zzllg6p664i3/winisutils.rar?dl=0

Descompacte o .rar numa pasta de sua preferência e execute o programa WinisUtils.exe. Abra a base pelo menu Arquivo | Abrir e depois acesse o menu Relatórios | Status dos Registros.

Acredito que o relatório irá indicar 5 registros vazios.


From: Antonio Carlos Tafari Filho
Sent: Tuesday, September 30, 2014 4:11 PM
To: Rafael Santini (Biblioshop)
Cc: isis-users en iccisis.org
Subject: Re: [Isis-users] Puzzle - Dúvida

Olá.

Vamos ao que eu fiz:

A) Original
base.mst = 166,402,048 bytes
base.xrf = 398,848 bytes
MFN = 98839
Erro ASCII = 6
MFN alterados = 14

B) Apenas regerado o XRF
> del *.xrf
> mkxrf base
base.mst = 166,402,048 bytes
base.xrf = 398,848 bytes
MFN = 98839
Erro ASCII = 0
MFN alterados = 0

C) Regerado o XRF, exportada para ISO, reimportada do ISO
> del *.xrf
> mkxrf base
> mx base iso=base.iso -all now
> del base.mst
> del base.xrf
> mx iso=base.iso create=base -all now
base.mst = 61,049,856 bytes

base.xrf = 398,848 bytes
MFN = 98834
Erro ASCII = 0
MFN alterados = 0

D) Exportado e reimportado ISO pelo Winisis
> Database > Export > base.iso > output line = 0 Util > Erase Database > 
> Yes > Yes Database > Import > base.iso > input line = 0 > Options Load
base.mst = 61,046,784

base.xrf = 398,848
MFN = 98834
Erro ASCII = 6
MFN alteardos = 0

A princípio, a opção B será a melhor, por preservar a ordem dos meus MFN para análise futura.

Agradeço muito pela atenção!!!

Abraços.




Em 29 de setembro de 2014 21:23, Rafael Santini (Biblioshop) <santini en biblioshop.com.br> escreveu:

  No caso, o arquivo MST também está corrompido.

  A minha sugestão a princípio é:

  1. Recriar o arquivo XRF.

  2. Limpar esses caracteres desses 2 registros.

  3. Realizar a exportação e a importação da base.

  4. Verificar esses 2 registros. Possivelmente esses foram perdidos.

  Se ao final houver diferença na quantidade de registros, pergunto: você consegue executar o seguinte comando na base original após ter recriado o XRF?

  mx base now

  No caso, ele deverá mostrar todos os registros na tela.


  From: Antonio Carlos Tafari Filho
  Sent: Monday, September 29, 2014 9:07 PM
  To: Rafael Santini (Biblioshop)
  Cc: isis-users en iccisis.org
  Subject: Re: [Isis-users] Puzzle - Dúvida

  Olá.

  Nem estava me importando com os problemas ASCII.

  Agora que fui olhar, as 6 ocorrências de problemas são de apenas 2 registros (3 de cada).

  Ao dar um mx na base original, para verificar estes registros:

  1) o MFN 46827 está nitidamente com os campos "desalinhados", misturando os dados de campos diferentes e com vários caracteres especiais, provavelmente originados do cabeçalho do registro.
  2) o MFN 93597 está direcionando para o MFN 46827.
  3) o Oraculo reconhece o registro 93957 como sendo MFN alterado.

  Exemplo 1: mx base from=46827 to=46827

  mfn= 46827
  20  «é b☺♦ î f☺  î »
    1  «å☺↓ ♀ ƒ☺♠ s Ñ☺     « «☺► ╚ ╛☺»
    2  «► ░ ╬»
    8  «☺► Acervo Centr»
  25  «al343.542.5:347.635(81)(082)D»
  40  «533iArtigo de livroDIAS, Mar»
  30  «ia Berenice (coord.)Incesto »
  43  «e alienaç╞o parentalBARBOSA, Gabriella Ferrares»
  50  «eSegUniversidade de S╞o Pa»
  55  «ulo.22.24»
  60  «7Português23/10/2012 »
  70  «- HA»
  141  «F         »
  155  «             »

  Exemplo 2: mx base from=93597 to=93597

  mfn= 46827
  20  «é b☺♦ î f☺  î »
    1  «å☺↓ ♀ ƒ☺♠ s Ñ☺     « «☺► ╚ ╛☺»
    2  «► ░ ╬»
    8  «☺► Acervo Centr»
  25  «al343.542.5:347.635(81)(082)D»
  40  «533iArtigo de livroDIAS, Mar»
  30  «ia Berenice (coord.)Incesto »
  43  «e alienaç╞o parentalBARBOSA, Gabriella Ferrares»
  50  «eSegUniversidade de S╞o Pa»
  55  «ulo.22.24»
  60  «7Português23/10/2012 »
  70  «- HA»
  141  «F         »
  155  «             »

  Abraços.



  Em 29 de setembro de 2014 20:07, Rafael Santini (Biblioshop) <santini en biblioshop.com.br> escreveu:

    Pelo seu relato, o XRF está corrompido, visto que ao tentar acessar o MFN 1932 ele mostra o MFN 84561.

    Você conseguiu localizar e corrigir os caracteres ASCII menores que 32?


    From: Antonio Carlos Tafari Filho
    Sent: Monday, September 29, 2014 7:17 PM
    To: Rafael Santini (Biblioshop)
    Cc: isis-users en iccisis.org
    Subject: Re: [Isis-users] Puzzle - Dúvida

    Olá Rafael.

    Primeiramente, me desculpe pelo erro de digitação...

    A base original tem 98677 registros e a base nova tem 98672, totalizando apenas 5 registros de diferença.

    Ao tentar utilizar o MX para gerar o arquivo TXT da base antiga, retorna "fatal: recread/check/base". Utilizei o mkxrf para tentar corrigir, o que aparentemente de certo. Após gerei o TXT.

    - old.txt =   68.522.419 bytes
    - new.txt = 68.518.464 bytes

    Nenhum programa está conseguindo comparar os dois arquivos deste tamanho...

    Regerei os arquivos TXT com 10 mil registros, para comprar. O que eu descobri foram diferenças naqueles registros com MFN alterados (aqueles 14).

    Então tentei ler um registro (1 dos 14 com MFN alterados), da base antiga, antes do mkxrf. O Resultado não é o MFN não é o pesquisado.

    Ex:
    > mx base from=1932 to=1932
    >
    > mfn= 84561
    >  20  «Acervo Central»
    >  1  «340.11(430)(081)=134.3»
    (...)

    Realizei a execução do mkxrf o resultado agora fica assim:

    > mx base from=1932 to=1932
    >
    > mfn=  1932
    > 20  «Acervo Central»
    > 151  «26»
    (...)

    Isso pode significar que o arquivo MST está com problema? Se sim, só de eu gerar um novo XRF (mkxrf) ele já consegue corrigir estes problemas? Acho que com o mkxrf estou perdendo informações.

    Obrigado.





    Em 29 de setembro de 2014 17:26, Rafael Santini (Biblioshop) <santini en biblioshop.com.br> escreveu:

      O percentual é relativo, pois depende da quantidade de alterações realizadas na base de dados. De qualquer forma, a princípio você tem um problema de fato, pois tem 98677 registros e após a importação fica 96872. Acho que a primeira coisa que deves fazer é resolver essas 6 ocorrências ASCII menos que 32 e ver se obtêm a mesma quantidade de registros após importação. Após obter a mesma quantidade de registros depois da importação e exportação, podes fazer uma comparação entre as duas bases através de arquivos texto gerados pelo MX. Exemplo:

      mx base1 now > base1.txt
      mx base2 now > base2.txt

      Então, com algum utilitário de diferença de arquivos (eu particularmente uso o editor de texto PSPad), você pode comparar os dois arquivos para ver se as duas bases têm o mesmo conteúdo ou identificar o que tem de diferente se for o caso.

      From: Antonio Carlos Tafari Filho
      Sent: Monday, September 29, 2014 5:03 PM
      To: Rafael Santini (Biblioshop)
      Cc: isis-users en iccisis.org
      Subject: Re: [Isis-users] Puzzle - Dúvida

      Olá Rafael.

      O que eu não entendo é que o arquivo não ficou ligeiramente menor, por supostamente ter suprimindo alguns caracteres ASCII e alguns registros logicamente apagados...

      Ele ficou com apenas 37% do tamanho original!!!

      Ou o ISIS tem um sistema de inserção de registros novos de qualidade muito duvidosa (perdendo muito espaço entre um registro e outro), ou estou perdendo MUITA informação entre a exportação e reimportação. Eu acredito em uma terceira hipótese: que minha base esteja com algum problema, e que este problema esteja causando esta inflação de dados, pois é mais que o dobro de informação existente entre a base atual e a base reimportada que efetivamente não existe.

      No arquivo original, o Oraculo diz:

      - Tamanho do MST: 164.309.504 bytes
      - Tamanho do XRF: 397.824 bytes
      - Maior MFN: 98677
      - 0 registros fisicamente deletados
      - 0 registros bloqueados
      - 0 registros logicamente deletados
      - 0 registros com erro de leitura
      - 14 MFN alterados

      - 6 ocorrências com caracteres ASCII menores que 32.

      Depois de exportado e reimportado:

      - Tamanho do MST: 60.993.024 bytes
      - Tamanho do XRF: 397.824 bytes
      - Maior MFN: 96872
      - 0 registros fisicamente deletados
      - 0 registros bloqueados
      - 0 registros logicamente deletados
      - 0 registros com erro de leitura
      - 0 MFN alterados

      - 6 ocorrências com caracteres ASCII menores que 32.

      Entecipadamente, muito obrigado!!!




      Em 29 de setembro de 2014 13:48, Rafael Santini (Biblioshop) <santini en biblioshop.com.br> escreveu:

        É normal que o arquivo MST fique menor após exportar e importar a base de dados, pois as alterações realizadas são adicionadas ao final do arquivo. Entretanto, os registros logicamente apagados são excluídos definitivamente nesse processo e se a base possuir caracteres ASCII menos que 32 em algum campo poderá causar perda de informações. Quais são os problemas que o Oráculo mostrou?


        From: Antonio Carlos Tafari Filho
        Sent: Monday, September 29, 2014 1:04 PM
        To: isis-users en iccisis.org
        Subject: [Isis-users] Puzzle - Dúvida

        Olá. / Hi.

        Eu tenho um base ISIS onde o arquivos MST está com 164.309.504 bytes. / I use a ISIS base with 164.309.504 bytes of size (MST file).

        O software Oraculo diz que tenho vários registros com problemas (16). / The Oraculo software show me 16 MFN with problem.

        Eu exportei a base para ISO, e reimportei. / I created a exported ISO file and imported again.

        O arquivo MST resultante tem apenas 60.993.024 bytes. / The new MST file was only 60.993.024 bytes.

        Este procedimento foi apenas para teste. / This procedure was only for testing.

        Minha dúvida é a seguinte: O porque a diferença é tão grande? Minha base está se deteriorando? Ela provavelmente está com algum problema? / My question: why the size difference is so large? The current MST file is deteriorating? It has a problem?

        Obrigado / Tks.



------------------------------------------------------------------------
        _______________________________________________
        isis-users mailing list
        isis-users en iccisis.org
        To manage your own subscription options go to: http://lists.iccisis.org/listinfo/isis-users
        Or contact Henk Rutten: hlrutten en xs4all.nl


-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.iccisis.org/pipermail/isis-users/attachments/20140930/2feb499e/attachment-0001.html>

------------------------------

Subject: Digest Footer

_______________________________________________
isis-users mailing list
isis-users en iccisis.org
To manage your own subscription options go to: http://lists.iccisis.org/listinfo/isis-users
Or contact Henk Rutten: hlrutten en xs4all.nl


------------------------------

End of isis-users Digest, Vol 48, Issue 1
*****************************************


_______________________________________________
isis-users mailing list
isis-users en iccisis.org
To manage your own subscription options go to: http://lists.iccisis.org/listinfo/isis-users
Or contact Henk Rutten: hlrutten en xs4all.nl




More information about the isis-users mailing list