mercoledì 28 giugno 2023

Metadati? Si, grazie.

In quest’era che le tecnologie della comunicazione la fanno letteralmente da padrone, si sente sempre parlare dei metadati come un valore aggiunto all’efficacia comunicativa, ma spesso non se ne conoscono a fondo le loro caratteristiche e le notevoli potenzialità che possono sprigionare, specialmente nel campo dei social media che oggigiorno tutti utilizziamo.

I metadati, però, partono da lontano, quando ancora nessuno di noi sapeva cosa fossero i social media. I primi impieghi dei metadati, infatti, risalgono ai primi utilizzi del computer per catalogare ed organizzare la massa di dati e documenti cartacei che si cercavano di migrare dalla gestione analogica a quella digitale.

Il termine metadati, che letteralmente vuol dire "dati sui dati", è oggi ampiamente utilizzato in diversi contesti, ma spesso viene inteso in modi diversi dalle diverse comunità professionali che progettano, creano, descrivono, conservano e utilizzano sistemi e risorse informative. Fino alla metà degli anni '90, metadato era un termine utilizzato principalmente dalle comunità coinvolte nella gestione e interoperabilità dei dati geospaziali e nella gestione dei dati e nella progettazione e manutenzione dei sistemi in generale. Per queste comunità, il termine si riferiva a una suite di standard industriali o disciplinari, nonché a documentazione interna ed esterna aggiuntiva e altri dati necessari per l'identificazione, la rappresentazione, l'interoperabilità, la gestione tecnica, le prestazioni e l'uso dei dati contenuti in un sistema informativo.

I metadati oggi sono definiti come i dati che forniscono informazioni su uno o più aspetti dei dati, e che sono raggruppati in record e salvati su di un file o un database. 

Il termine metadati viene utilizzato nell’ambito delle tecnologie informatiche per riassumere le informazioni di base sui dati che possono facilitare il tracciamento e l'utilizzo di dati specifici. In altre parole, i metadati sono informazioni utilizzate per descrivere i dati che sono contenuti all’interno di un contenitore, come una pagina Web, un documento o un file. Un altro modo di pensare ai metadati è di vederli come una breve spiegazione o un riassunto di che tipo di dati si tratta.

Facciamo qualche esempio pratico per capire meglio di cosa si tratta.

I metadati che troviamo in ogni documento non sono altro che le informazioni che si riferiscono alla data apposta sul documento, oppure all'indicazione del soggetto che lo ha prodotto, sia esso una persona fisica, un'azienda o un ente. Potrebbe includere una raccolta di informazioni come l'autore, la dimensione del file, la data di creazione del documento e le parole chiave per descrivere il documento. 

I metadati di un file musicale potrebbero includere il nome dell'artista, l'album e l'anno di pubblicazione.

I metadati dei libri, ad esempio, sono il titolo, una lista di autori, una prefazione, un insieme di capitoli, a loro volta suddivisi in paragrafi.

Infine, ogni documento può essere descritto da informazioni non direttamente presenti al proprio interno, ma che sono tuttavia necessarie per caratterizzarlo. 

Si pensi, ad esempio ad una Biblioteca Digitale contenente le foto di quadri. Ogni singola foto ha bisogno di essere descritta tramite informazioni aggiuntive, quindi metadati, quali l’autore del quadro, il titolo, la data di produzione, il luogo nel quale viene conservato, etc.

Per i file del computer, i metadati possono essere archiviati all'interno del file stesso o altrove, come nel caso di alcuni file di libri EPUB  che conservano i metadati in un file ANNOT  associato.

I metadati, quindi, sono informazioni strutturate relative ai dati, interpretabili da parte di un computer al fine di effettuare una serie di operazioni volte alla catalogazione, ricerca e tracciamento dei dati.

Possiamo pensare ai metadati come alla somma totale di ciò che si può dire in un dato momento su qualsiasi oggetto digitale a qualsiasi livello di aggregazione.

In generale, tutti gli elementi digitali, indipendentemente dalla forma fisica o intellettuale che assumono, hanno tre caratteristiche: il contenuto, il contesto e la struttura, che possono e devono essere riflesse attraverso i metadati:

Il contenuto si riferisce a ciò che l'oggetto contiene o riguarda ed è intrinseco a un oggetto informativo;

Il contesto indica il chi, cosa, perché, dove e come, ossia quegli aspetti associati alla creazione dell'oggetto e alla vita successiva, ed è estrinseco a un oggetto informativo;

La struttura si riferisce all'insieme formale di associazioni all'interno o tra i singoli oggetti di informazione e può essere intrinseca, estrinseca o entrambi.

Tutti gli oggetti portano con sé determinati metadati che derivano in modo innato dalle circostanze della loro creazione, gestione e utilizzo. Tuttavia, i professionisti dell'informazione sul patrimonio culturale come i registrar dei musei, i catalogatori di biblioteche e gli archivisti, spesso applicano il termine metadati alle informazioni a valore aggiunto che creano per organizzare, descrivere, tracciare e in altro modo migliorare l'accesso agli oggetti informativi e agli oggetti fisici e alle collezioni relativi a quegli oggetti. 

Tali metadati sono spesso regolati da standard e migliori pratiche sviluppati e promossi dalla comunità al fine di garantire qualità, coerenza e interoperabilità. I linguaggi di markup come HTML e XML e una varietà di schemi e formati di metadati, forniscono modi standardizzati per strutturare ed esprimere questi standard per l'elaborazione, la pubblicazione e l'implementazione della macchina.

I metadati dunque rappresentano informazioni dietro le quinte che vengono utilizzate ovunque, da ogni settore, in molteplici modi. È onnipresente nei sistemi informativi, nei social media, nei siti Web, nei software, nei servizi musicali e nella vendita al dettaglio online. 

Ad esempio, un'immagine digitale può includere metadati che descrivono la dimensione dell'immagine, la profondità del colore, la risoluzione, quando è stata creata, la velocità dell'otturatore e altri dati. 

I metadati di un documento di testo possono contenere informazioni su quanto è lungo il documento, chi è l'autore, quando il documento è stato scritto e un breve riassunto del documento. 

I metadati all'interno delle pagine Web possono anche contenere descrizioni del contenuto della pagina, nonché parole chiave collegate al contenuto. Questi collegamenti sono spesso chiamati "Metatag" , che sono stati utilizzati come fattore principale per determinare l'ordine di una ricerca sul Web fino alla fine degli anni '90.

Ora è più chiaro che i metadati arricchiscono i dati con informazioni che ne facilitano la ricerca, l'utilizzo e la gestione. Ad esempio, i tag HTML definiscono il layout per i lettori umani. I metadati semantici aiutano i computer a interpretare i dati aggiungendo riferimenti a concetti in un grafico della conoscenza.

Un altro esempio tipico di metadati è costituito dalla scheda del catalogo di una biblioteca, la quale contiene informazioni circa il contenuto e la posizione di un libro, cioè dati riguardanti più dati che si riferiscono al libro. Un altro contenuto tipico dei metadati può essere la fonte o l'autore dell'insieme di dati descritto, oppure le modalità d'accesso con le eventuali limitazioni.

Un metadato può essere anche un dato aggiunto all'insieme delle informazioni per altri scopi. Ad esempio, se alla scheda del libro della biblioteca aggiungo un ID, ossia un identificatore univoco, quest'ultimo è un metadato.

Fondamentalmente, i metadati sono ovunque, sono la traccia digitale di tutto ciò che facciamo nello spazio delle informazioni. 

Cosa non sono i metadati

I metadati sono dati che descrivono i dati, ma non sono i dati stessi. I metadati dell'autore e della data di creazione archiviati in un documento Microsoft Word, ad esempio, non sono l'intero documento, ma solo alcuni dettagli sul file.

Poiché i metadati non sono i dati effettivi, di solito possono essere resi pubblici in sicurezza perché non consentono a nessuno di accedere ai dati grezzi. Conoscere i dettagli di riepilogo su una pagina web o un file video, ad esempio, è sufficiente per capire cos'è il file ma non abbastanza per vedere effettivamente l'intera pagina o riprodurre l'intero video.

Pensate ai metadati come a un file di una scheda nella vostra biblioteca d'infanzia che contiene informazioni su un libro; i metadati non sono il libro stesso. Potete imparare molto su un libro esaminando il suo file della scheda, ma dovete poi aprire il libro per leggerlo.

Dott. Nicola Amato


venerdì 23 giugno 2023

L’importanza del backup dei dati



Cominciamo con una domanda la cui risposta potrebbe sembrare scontata: che cos'è un backup e che cosa non è?

Può sembrare banale una domanda del genere, lo so, ma alla fine vedrete che non lo è per nulla, anzi. Infatti, seppure in questo mondo di globalizzazione delle conoscenze informatiche, più o meno tutti gli utilizzatori dei computer, a qualsiasi livello, si sono ritrovati davanti, almeno una volta nella vita, il termine “backup”, e quindi ormai quasi tutti sanno cosa vuol dire. Ce ne sono altri invece che hanno dei dubbi in merito, o forse non sanno neanche di averli in quanto le loro certezze sono erronee, dubbi che è meglio chiarire subito prima di affrontare altri argomenti più complessi correlati al backup.

Il backup è un processo di creazione di una copia dei dati del proprio sistema e la sua successiva archiviazione, spesso su di un altro supporto  informatico, in modo da poterlo utilizzare in seguito per il ripristino dei dati, nel caso in cui i dati originali vadano persi o danneggiati. In pratica, attraverso dei software specifici, viene eseguita periodicamente una copia dei propri dati e dei sistemi e salvata su di un supporto, meglio se esterno al proprio sistema, in modo che in caso di guasto al computer e/o di perdita dei dati, c’è sempre una copia di riserva disponibile per ripristinare i dati originari.

In un modo o nell'altro, tutte le aziende e le organizzazioni proteggono i propri dati con operazioni costanti di backup, soprattutto quei dati considerati critici, rendendoli i componenti chiave del piano di ripristino di emergenza e della strategia di continuità delle operazioni aziendali. Di conseguenza, il backup dei dati sta diventando sempre più importante, direi vitale, per qualsiasi tipo di organizzazione che intenda salvaguardare i propri dati e i sistemi da eventuali attacchi hacker o semplicemente da malfunzionamenti del sistema o cancellazioni erronee di dati.

Pertanto, diventa molto importante per ogni azienda designare un amministratore di backup o comunque un responsabile informatico che si occupi di gestire l'intera strategia di backup, comprese le soluzioni e gli strumenti di backup e ripristino. A tal fine, è estremamente importante che tutte le aziende dispongano di una strategia e di una soluzione di backup efficace. Copiare e incollare semplicemente i file e le cartelle su un'altra unità non è un backup, anche se forzatamente potrebbe essere considerato tale.

Si tratta di una questione importante che spesso crea confusione, che è meglio chiarire subito, ossia quella inerente alla differenza tra il backup dei dati e un archivio dei dati. Molte persone sono un po’ confuse al riguardo, quindi è meglio chiarire la differenza tra questi due sistemi di salvataggio dei dati.

I backup, che fanno parte di un piano di ripristino di emergenza, hanno lo scopo di fornire un modo rapido per ripristinare i dati che sono andati perduti o che si vogliono comunque ripristinare. Un backup ha due scopi principali: ripristinare i dati dopo che sono stati persi e recuperarli prendendoli da una data specifica di un backup precedente all’eventuale disastro.

L'archiviazione dei dati, invece, è progettata per il salvataggio dei dati a lungo termine; parliamo anche di decenni. In genere i dati sono salvati in maniera sequenziale, cartella dopo cartella e file dopo file, e senza alcun particolare ordine strutturale. I dati, in pratica, vengono accantonati e conservati come copia di riserva per le ricerche storiche per esempio, o per avere comunque una copia dei propri dati. Inoltre, mentre il ripristino rapido ed efficace è importante per un backup, la velocità e l’efficacia di accesso ai dati non è poi così importante per un archivio.

Per farvi un esempio, infine, se succede che dovete ripristinare i dati per un qualsiasi motivo, mentre una copia di backup rimette tutti i dati al loro posto originale e il sistema è pronto a ripartire, una semplice copia di file li mette alla rinfusa perché non saprebbe dove andare a salvarli, a meno che non ce li mettete voi a mano, perché viene a mancare tutta una serie di elementi che un software di backup e ripristino ha, quali indici e collegamenti e relazioni varie. Anche ricopiandoli a mano ad uno ad uno ho i miei dubbi che il vostro sistema funzionerebbe in tal caso.

Pianificazione della strategia di backup

Prima di iniziare a pianificare una strategia di backup, vi suggerisco caldamente di acquisire una conoscenza completa e approfondita delle apparecchiature hardware e delle applicazioni di backup e ripristino dei dati che intendete utilizzare sul vostro server o computer. Leggete attentamente i loro manuali d'uso, e cercate di comprenderne bene il funzionamento in tutti i loro aspetti peculiari.

Detto questo, che mi sembrava doveroso fare, iniziamo ora a parlare di come pianificare e progettare una strategia di backup ottimale ed efficace, che nella prima fase dovrebbe rispondere almeno a queste tre domande importanti:

1. Quali dati devono essere sottoposti a backup?
2. Dove salvare il backup?
3. Quando eseguire il backup? 

La pianificazione di una strategia di backup è un processo che dovrebbe definire i requisiti e i vincoli dei backup, ad esempio la frequenza con cui eseguire il backup dei dati o se sono necessarie copie aggiuntive dei dati di backup su set di supporti aggiuntivi.

Tuttavia, la pianificazione di una strategia di backup non è solo una questione di cosa, dove e quando eseguire il backup, ma è anche necessario definire gli obiettivi e i vincoli della strategia di backup, che include, ad esempio, la risposta ad altre domande importanti, come quelle che seguono:

Quali sono le vostre politiche aziendali di backup e ripristino sei dati?
Quali sono i tipi di dati di cui è necessario eseguire il backup?
Quanto è il tempo massimo di inattività per il ripristino dei dati che la vostra azienda riuscirebbe a  sostenere senza grossi danni per l’organizzazione?
Per quanto tempo devono essere conservati i dati secondo la loro specificità?
Come devono essere archiviati e gestiti i supporti con i dati di backup?
Quanti set di supporti devono essere utilizzati durante il backup dei dati?
Quanti dati devono essere sottoposti a backup?
Qual è la crescita in percentuale prevista per i dati?
Quanto tempo può richiedere un backup?
Con quale frequenza bisogna eseguire il backup dei dati?
Quali sono i fattori che possono influenzare la vostra strategia di backup?

Sono un bel po’ di domande a cui dare risposta, lo so, ma ce ne sono ancora delle altre da soddisfare prima di arrivare ad implementare un’adeguata pianificazione della strategia di backup, la cui implementazione dipende dalle risposte che darete a tutte queste domande.

Backup e cybersecurity

Il backup dei propri sistemi e dei dati rappresenta certamente una contromisura per difendersi da eventuali attacchi. Anche perché, sebbene molti attacchi hacker siano perpetrati con lo scopo di copiare i vostri dati per poi chiedere un riscatto, pena la loro divulgazione in Rete, quegli stessi dati in tal caso rimarrebbero comunque nelle vostre mani. Tuttavia, in caso di attacco, non avete la certezza che i vostri dati non siano stati danneggiati, anche effettuando tutte le verifiche del caso, perché molti danni ai dati saltano fuori a distanza di tempo. E non avete neanche la certezza che addirittura non sia stato inserito all’interno dei dati un malware. Per cui, il consiglio è di fare regolarmente dei backup dei vostri sistemi e dei dati, seguendo una strategia di backup ad hoc secondo le vostre esigenze, e naturalmente dovete fare assolutamente un ripristino dei dati non appena vi accorgete che i vostri sistemi sono stati danneggiati, dopo ovviamente aver chiuso tutte le porte da cui si suppone siano entrati gli hacker.

Se volete approfondire in maniera dettagliata l’argomento dei backup, vi consiglio un libro recente dal titolo “Guida alle strategie di backup dei dati: Uno strumento prezioso e sempre disponibile ogni volta che si rende necessario mettere le mani su di una policy di backup o un piano strategico”.

Lo potete trovare su https://www.amazon.it/dp/B09WPZVVBQ


Dott. Nicola Amato