Acervo digital

Mantendo e organizando seu acervo de documentos digitais.

11 de Abr de 2021

Esta √© uma s√©rie de artigos sobre o meu fluxo de trabalho para pesquisa e produ√ß√£o de textos. A primeira parte da s√©rie apresentou uma vis√£o geral; as demais detalham ferramentas e fun√ß√Ķes do fluxo.

Acervo digital

Qualquer que seja o seu projeto, muitas fontes escritas de informa√ß√£o estar√£o em formatos digitais ‚Äď por exemplo, artigos cient√≠ficos em formato .PDF, ou e-books em formato .EPUB. Este √© o seu acervo digital.

Como tudo em seu fluxo de trabalho, ele precisa estar organizado. Isso quer dizer que ele precisa realizar, ou facilitar, as seguintes atividades:

  1. manuten√ß√£o de c√≥pias de seguran√ßa ‚Äď por raz√Ķes que j√° mencionei na segunda parte;
  2. opera√ß√Ķes de inclus√£o, altera√ß√£o e exclus√£o de novos itens, mantendo a organiza√ß√£o existente;
  3. localiza√ß√£o da informa√ß√£o ‚Äď de nada adianta ter os melhores livros, se voc√™ n√£o os encontra;
  4. consulta ‚Äď depois de encontrar, o acesso de leitura tem que ser f√°cil;
  5. anota√ß√Ķes, parte essencial do trabalho de um pesquisador;
  6. cita√ß√Ķes e refer√™ncias, essenciais em trabalhos acad√™micos.

Leitores da área de Informática provavelmente vão reconhecer os dois itens iniciais: eles são elementos essenciais de qualquer base de dados. Não é à toa; o seu acervo digital é exatamente isso.

Este √© um caso no qual o git pode n√£o ser uma boa alternativa, por raz√Ķes que vou aprofundar mais abaixo. Na verdade, a manuten√ß√£o e uso do seu acervo demandam o uso de v√°rias ferramentas. Tr√™s s√£o especialmente importantes: Calibre, Free File Sync, e JabRef.

A base do acervo

O Calibre √© a parte mais essencial do seu acervo. Este software √© um gerenciador de cole√ß√Ķes de e-books, ou livros digitais. O Calibre n√£o tem formatos preferidos; aceita uma grande quantidade de formatos diferentes.

Eu falei, acima, que o seu acervo √© uma base de dados. O Calibre implementa isso diretamente, criando um arquivo de base de dados, com todas as informa√ß√Ķes sobre os seus livros, que por sua vez ficam organizados em um sistema de pastas pr√≥prio.

Isso traz duas consequ√™ncias importantes. A primeira: n√£o fa√ßa acesso diretamente aos arquivos do Calibre. N√£o use um gerenciador de arquivos para procurar os arquivos que lhe interessam dentro das pastas gerenciadas pelo Calibre. Use o pr√≥prio Calibre para isso. O risco √© que voc√™, inadvertidamente, fa√ßa altera√ß√Ķes que impe√ßam o uso normal do Calibre.

A segunda: enquanto o programa do Calibre est√° sendo executado, o arquivo de base de dados pode estar sendo alterado. De forma geral, considere que o arquivo de base de dados sofre altera√ß√Ķes constantes. Por outro lado, os documentos digitais, em si, mudam muito pouco. Depois que um livro em .PDF √© colocado no Calibre, por exemplo, este arquivo n√£o sofre altera√ß√Ķes.

Temos, ent√£o, um arquivo que sofre mudan√ßas frequentes, e um conjunto grande de arquivos que quase n√£o muda. N√£o h√° necessidade de controle de vers√Ķes de qualquer destes arquivos. Por isso, especialmente se o acervo √© grande ‚Äď centenas ou milhares de documentos ‚Äď, o git pode n√£o ser o mais adequado para c√≥pias de seguran√ßa e para permitir acesso remoto.

Mas usar uma ferramenta como o DropBox, juntamente com o Calibre, não é trivial como pode parecer. Justamente pelo aviso que eu dei acima: enquanto o programa está em uso, o arquivo com a base de dados está sendo constantemente modificado. Copiá-lo no meio de uma operação pode tornar a cópia inutilizável. Por isso, não coloque a pasta do seu acervo diretamente na pasta do DropBox.

Aviso importante: o GoogleDrive NÃO é compatível com o Calibre.

O procedimento recomendado √© outro. Todas as c√≥pias do seu acervo precisam ser feitas com o Calibre encerrado ‚Äď e preste aten√ß√£o para que ele n√£o esteja apenas minimizado na √°rea de sistemas. Depois que voc√™ fechar completamente o Calibre, voc√™ poder√° fazer a c√≥pia do seu acervo ‚Äď por exemplo, para a pasta do DropBox, ou mandar um commit para seu reposit√≥rio git.

Mas há aqui um detalhe. Como eu mencionei acima, o arquivo com a base de dados muda constantemente, mas os arquivos com os documentos não. Então, não vale a pena fazer uma cópia do acervo inteiro, mas apenas das partes que tenham sido modificadas.

√Č aqui que entra o Free File Sync, que eu mencionei acima. √Č uma ferramenta gratuita, que mant√©m sincronizadas duas c√≥pias de pastas, fazendo apenas as c√≥pias necess√°rias quando h√° modifica√ß√Ķes. Reitero: depois que voc√™ fechar o Calibre, use o Free File Sync para copiar seu acervo para o local da c√≥pia de seguran√ßa.

Seja no DropBox ou seja em um repositório git, lembre-se que esta é uma cópia de segurança, e não deve ser usada diretamente. Se você precisar usar seu acervo em outro equipamento, crie uma cópia no novo equipamento, a partir da cópia de segurança; mas não esqueça de ressincronizar as cópias sempre que fechar o Calibre.

Todos estes cuidados são preliminares necessárias para atender ao critério 1 da lista acima. Vamos ver o que fazer com o Calibre em si, pensando nos critérios subsequentes.

O que colocar no acervo

Inclus√£o, exclus√£o e altera√ß√£o de registros s√£o as tr√™s opera√ß√Ķes fundamentais de qualquer base de dados. Por isso, s√£o realizadas com facilidade em uma instala√ß√£o do Calibre, onde cada registro √© um documento digital ‚Äď vou chamar todos de ‚Äúlivros‚ÄĚ para simplificar.

Pouco há o que falar sobre remover livros, exceto para notar que a remoção pode ser seletiva. Por exemplo, se um mesmo livro está presente em formato .PDF e em formato .MOBI, é possível remover apenas um dos formatos.

Inclusão de livros é igualmente simples, mas pode causar um tipo de problema: a inclusão de livros que já estão na base de dados. O sistema de inclusão do Calibre faz uma verificação preliminar desta possibilidade, mas esta verificação é superficial, por motivos que esclareço melhor mais abaixo.

O ponto crucial do uso do Calibre est√° nas altera√ß√Ķes dos registros. N√£o se trata, aqui, de alterar os documentos em si ‚Äď mas de alterar os seus metadados.

Metadados s√£o informa√ß√Ķes sobre um livro: tanto as informa√ß√Ķes mais b√°sicas (autor, t√≠tulo, data de publica√ß√£o, editora) quanto informa√ß√Ķes mais elaboradas (ISBN, linguagem, sum√°rio, capa, assunto, palavras-chave, ‚Ķ).

S√£o informa√ß√Ķes absolutamente necess√°rias para qualquer trabalho mais s√©rio com estes livros. Infelizmente, de forma geral, estas informa√ß√Ķes n√£o constam de forma estruturada ou uniforme em documentos digitais.

Vejamos uma situa√ß√£o simples, bastante comum. Um artigo publicado em um congresso cient√≠fico, dispon√≠vel gratuitamente nos anais do evento, em formato .PDF. O t√≠tulo do artigo aparece em destaque na primeira p√°gina, ‚ÄúApresentando proleg√īmenos √† introdu√ß√£o de sum√°rios‚ÄĚ, seguido do nome do autor, ‚ÄúC. Marius Fulanus‚ÄĚ. O nome do arquivo .PDF, na p√°gina do evento, √© ‚Äú88321a.pdf‚ÄĚ. Os campos de ‚Äúpropriedades‚ÄĚ do arquivo .PDF (metadados b√°sicos) informam que o t√≠tulo do documento √© ‚ÄúFull paper‚ÄĚ, que o seu autor √© ‚ÄúMS Word‚ÄĚ, e outras inutilidades derivadas do processo de cria√ß√£o da vers√£o em .PDF.

O problema: quando este arquivo for inclu√≠do no seu acervo digital, o Calibre vai usar os campos de propriedades do .PDF para os metadados deste novo registro. Ent√£o, voc√™ ter√° um registro com o t√≠tulo ‚ÄúFull paper‚ÄĚ e o autor ‚ÄúMS Word‚ÄĚ.

Isto n√£o √© um problema do Calibre, mas uma consequ√™ncia de descaso dos criadores de formatos digitais. √Č claro que um humano consegue ver o t√≠tulo correto em destaque na primeira p√°gina. Ent√£o, uma tarefa absolutamente essencial em um acervo mantido pelo Calibre √© corrigir e complementar os metadados de cada documento que √© acrescentado a ele.

Ainda que um documento traga estes metadados todos, de forma correta, √© necess√°rio verificar isso, e quase certamente ser√° necess√°rio incluir informa√ß√Ķes adicionais.

Quando √© instalado, o Calibre vem configurado com alguns campos bastante √ļteis para metadados adicionais: tags (palavras-chave), coment√°rios, e uma nota (com uma a cinco estrelas). Continuando o exemplo que usei acima: depois que eu inclu√≠ o arquivo, uso a tela de edi√ß√£o de metadados para corrigir t√≠tulo e nome do autor; depois, coloco no campo de coment√°rios algo como ‚ÄúUma boa introdu√ß√£o n√£o-t√©cnica ao assunto, tem boas refer√™ncias‚ÄĚ; dou uma nota de tr√™s estrelas (indicando que n√£o √© um dos meus documentos mais importantes); e acrescento as tags ‚Äúartigo, congresso, introdu√ß√£o, sofismas‚ÄĚ.

Depois que isso est√° feito, o crit√©rio 3 ‚Äď busca de documentos em meu acervo ‚Äď fica consideravelmente mais simples. Posso usar a barra de pesquisa do Calibre, escrever ‚Äúintrodu√ß√£o n√£o-t√©cnica‚ÄĚ, e o programa retorna este artigo. Ou posso ver o registro deste artigo, clicar no nome ‚ÄúC. Marius Fulanus‚ÄĚ e ver todos os documentos do acervo com este autor. Ou ainda clicar na tag ‚Äúartigo‚ÄĚ e ver todos os documentos do acervo que t√™m esta tag.

Note que tudo isso √© poss√≠vel somente depois que voc√™, o pesquisador, colocar estas informa√ß√Ķes l√°. Este √© o an√°logo exato, em formato digital, do ‚Äúfichamento de livros‚ÄĚ t√£o endeusado em manuais de pesquisas. N√£o h√° alternativa aqui: o Calibre consegue recuperar algumas informa√ß√Ķes, mas sempre h√° informa√ß√Ķes que s√£o peculiares a cada pesquisador, a cada trabalho. Voc√™ n√£o pode delegar isso ao Calibre, voc√™ mesmo tem que escrever estas informa√ß√Ķes; em contrapartida, voc√™ vai escrev√™-las de forma que melhor fa√ßam sentido para voc√™.

E ainda h√° um pulo do gato. O Calibre permite criar novos campos de metadados. Por exemplo, o meu acervo digital inclui os campos ‚ÄúAssunto‚ÄĚ, ‚ÄúCategoria‚ÄĚ, ‚ÄúFormato‚ÄĚ, ‚ÄúProjeto‚ÄĚ e ‚ÄúSelecionado‚ÄĚ ‚Äď e o campo ‚ÄúAssunto‚ÄĚ √© um campo hierarquizado (por exemplo, ‚Äúfilosofia.jogos.temporalidade‚ÄĚ).

Este trabalho de organiza√ß√£o √© o cerne do crit√©rio 2 (inclus√£o, altera√ß√£o, exclus√£o), e ele cria a possibilidade de uso eficaz do Calibre para atender ao crit√©rio 3 (pesquisa). O crit√©rio 4 √© trivial ‚Äď basta clicar no registro encontrado.

J√° os crit√©rios 5 (anota√ß√Ķes) e 6 (cita√ß√Ķes e refer√™ncias) come√ßam no Calibre, mas n√£o se exaurem nele. Por si s√≥, o campo de coment√°rios permite anota√ß√Ķes, o que j√° √© muito √ļtil ‚Äď mas n√£o √© poss√≠vel associar coment√°rios a outros registros do acervo. E as cita√ß√Ķes e refer√™ncias v√£o usar as informa√ß√Ķes de metadados do acervo, mas n√£o √© poss√≠vel usar o Calibre diretamente para este trabalho.

Em artigos subsequentes, vamos ver como as informa√ß√Ķes do Calibre podem ser usadas por outras ferramentas. Mas reitero: √© imprescind√≠vel que os metadados estejam corretos, e somente o pr√≥prio pesquisador pode fazer isso corretamente.

Partes publicadas

  1. Fundamentos
  2. Organização
  3. Acervo
  4. Escrevendo
  5. Notas

Publicação anterior sobre o git: parte 1 e parte 2.

Somente assinantes podem enviar coment√°rios.

Assine agora!

J√° tem uma assinatura? Entre!

LC, o Quartelmestre

Tamb√©m conhecido como Luiz Cl√°udio Silveira Duarte. Escritor, poeta, pesquisador, jogador, pol√≠mata, fil√īmata... est√° bom para come√ßar.