Di tutto il rumore che sentiamo ogni giorno sull'Intelligenza Artificiale, c'è un tema del quale non si parla mai abbastanza: i dati. Al di là di imparare a utilizzare strumenti come ChatGPT e di capire quali sono i rischi e le opportunità, il punto fondamentale di tutto questo mondo rimane sempre questo.
Nei software che utilizziamo nelle nostre attività digitali, come Office, Adobe, Calc o simili, la caratteristica principale è che i dati li mettiamo noi, o li creiamo noi: scriviamo testi, creiamo immagini o video, analizziamo tabelle. Ma l'input è nostro.
Se invece utilizziamo un applicativo che include componenti di AI, quelle componenti hanno già al proprio interno una knowledge base di informazioni fatta in un certo modo, in base a determinati dati. Quindi, oltre al nostro input o prompt, per produrre l'output c'è una base dati interna che viene utilizzata e della qual non sappiamo nulla o quasi.
Elena Simperl, direttrice della ricerca dell'Open Data Institute - l'istituto fondato da Tim Berners-Lee - pone l'accento proprio su questo aspetto: conoscere i dati usati per allenare un sistema di AI e poter avere accesso ad essi, è l'unico modo per prevedere i "suoi" comportamenti e capirne le potenzialità, correggere i bias, rendere l'AI più sicura ed efficiente.
Lo fa in un articolo pubblicato di recente, in cui pone l'accento non tanto sugli AI robots che secondo alcuni conquisteranno il mondo a discapito degli esseri umani, ma sulle infrastrutture di dati che fanno funzionare questi sistemi. Se queste infrastrutture fossero aperte e accessibili, avremmo un controllo più diffuso e partecipato di questi strumenti, cosa che oggi non accade, dice Simperl.
Per questa ragione l'Open Data Institute ha costruito il Data-centric AI programme, uno strumento (che è anche una strategia) che in un mondo ideale dovrebbe essere in cima a tutti i ragionamenti sull'utilizzo dell'Intelligenza Artificale. È bene tenere a mente questo strumento e queste linee guida, perché si tratta di una delle pochissime bussole davvero efficaci in questa nuova rivoluzione tecnologica che stiamo attraversando, che ancora una volta è basata sui dati e sulle competenze necessarie per comprenderli e usarli.
|