Appunti su come chiamare i propri file

Quest’anno per un corso sulla conservazione digitale  per la fondazione Rinascimento Digitale, mi sono trovato a riflettere sulle strategie che più o meno inconsciamente metto in atto per organizzare i miei documenti.

Una questione interessante, soprattutto nei progetti in collaborazione che richiedano il continuo scambio di versioni e di modifiche, riguarda le “regole” sul file naming: detto in poche parole come chiamare i propri file.

Ovviamente non esiste una regola univoca a cui attenersi e ognuno può elaborare una propria strategia, l’importante è che questa sia coerente e che, in tutti i casi possibili, venga applicata uniformemente.

In ogni caso il nome del file non sarà l’unico appiglio nell’organizzazione dei propri documenti, ma sarà un tassello che insieme alla gerarchia delle directory, i tag etc. renderà più facile il lavoro di selezione, ordinamento etc.
Già, quali sono i requisiti funzionali in questo caso? Quali sono cioè le attività in cui il nome del file gioca un ruolo importante? Un primo elenco potrebbe essere:

  • ordinare: favorire ordinamenti (di vario tipo) all’interno di una directory
  • individuare: individuare all’interno di una directory il documento che ci interessa
  • selezionare: scegliere fra più versioni dello stesso documento ciò che ci interessa
  • trovare: trovare un documento, funzione che in buona parte non è più adempiuta dal nome dei file ma dai desktop search (come Google Desktop, Spotlight, Tracker e tanti altri)

Se per l’ultimo punto sono sufficienti il contenuto stesso del documento e i metadati non incardinati nel nome del file, per i primi tre, in assenza di un KMS (Knowledge Management System), è necessario inserire qualche informazione direttamente nel nome del file.
Quali possono essere queste informazioni?
L’elenco potrebbe essere vasto, personalmente mi baso su:

  • data di creazione/aggiornamento: posso sentire già le obiezioni sul fatto che queste informazioni sono già presenti e utilizzabili nell’ordinamento all’interno di una directory senza incatenarle nel nome del file… Questo è vero, ma l’aggiornamento del contenuto coincide con l’ultima modifica del file? Pensate se il documento è stato aperto e (auto)salvato senza modifiche o se il documento viene inviato via mail e poi salvato (in questo caso si perde la data dell’originale e se uno vuole mantenerla può essere una buona idea inviare i documenti zippati, ma su questo magari tornerò in futuro). Personalmente utilizzo la data in formato ISO8601 non segmentato (es 20101210) perché utilizo lo score “-” per separare i vari vagoncini che compongono il nome del file
  • il titolo del documento (ovvio)
  • l’autore del documento o delle modifiche
  • lo “stato” del documento,  si può pescare ad esempio dagli stadi definiti dal progetto VERSIONS, tra questi io ho ridotto la lista a:
    • draft
    • rc (release candidate)
    • final
    • revised
  • Progetto di riferimento? molte persone con cui collaboro inseriscono nel nome del file il progetto a cui quel documento afferisce… personalmente non la ritengo una buona idea sia perché credo sia meglio gestire il progetto a livello di directory sia perché lo stesso documento potrebbe essere collegato a più progetti

L’ordine dei vagoncini è importante? Direi proprio di sì, poiché determinerà quale aspetto sarà preso per primo in considerazione nell’ordinare i documenti di una directory.
Ci interessa avere i file in ordine cronologico o ci interessa averli per titolo e solo dopo per ordine cronologico per distinguere le varie versioni?

La strategia che ho scelto per i miei documenti e che usiamo anche in diversi progetti in collaborazione è:
data + titolo (con spazi sostituiti da underscore “_”) +  stato + autore
quindi se questo post fosse un’ipotetica bozza di un PDF sarebbe:
20101210-Appunti_su_come_chiamare_i_propri_file-draft-SV.pdf dove SV finale sta per Salvatore Vassallo
la bozza modificata da Pinco Pallino sarebbe 20101210-Appunti_su_come_chiamare_i_propri_file-draft-PP.pdf etc.

Come detto in apertura di post queste non sono regole, ognuno può/deve elaborare una propria strategia alternativa! (E se ne avete una particolare mi farebbe piacere conoscerla ;-))

About these ads

3 pensieri su “Appunti su come chiamare i propri file

  1. molto interessanti secondo me sono i Microservices della California Digital Library.
    sono requisiti funzionali riguardo la conservazione su filesystem, alcuni gia’ implementati
    in tool utilizzabili (python o perl).

    https://confluence.ucop.edu/display/Curation/Home

    in particolare, anche se non proprio relativi alla nominazione dei file, ma piuttosto
    alla loro organizzazione in directory, con metadati esposti attraverso filenames,
    i due formati d-flat e namaste:

    https://confluence.ucop.edu/display/Curation/D-flat
    https://confluence.ucop.edu/display/Curation/Namaste

    un’introduzione d’insieme ai microservices:
    http://lackoftalent.org/michael/blog/2009/09/27/exploring-curation-micro-services/

    • Molto interessante l’utilizzo di micro-service per tutta una serie di task riguardanti la conservazione, la persistenza e l’organizzazione dei file e del file system.

      Su un piano simile, rilancio con Archivematica http://archivematica.org/, un software open source (sviluppato da Artefactual, la stessa ditta che cura Qubit/ICA-AtoM) che implementa tutta una serie di micro-service per permettere la gestione degli oggetti digitali nelle varie fasi previste dal modello OAIS (inserimento – SIP, archiviazione – AIP e dissseminazione – DIP).

      Si tratta però di un livello un po’ più alto rispetto alla gestione personale del digitale. Anche perché le funzionalità richieste possono essere differenti.
      Ad esempio, se ricordo bene una discussione con Giovanni Bergamin, magazzini digitali utilizza gli UUID per il file naming, sconsigliando l’inserimento di metadati (che alla fine è il nocciolo di questo post) nel nome dei file.

  2. Pingback: Mettiamo ordine negli armadi: l’organizzazione del filesystem « Frammenti Semantici

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...