Categoria: Senza categoria

  • Oltre la Comfort Zone dell’AI: Il Mio Diario per Automatizzare l’Impossibile

    Oltre la Comfort Zone dell’AI: Il Mio Diario per Automatizzare l’Impossibile

    Premessa: Da Esecutore a Partner Proattivo

    Sono un professionista IT. Da anni, l’Intelligenza Artificiale è per me quello che un multimetro è per un elettricista o un IDE per uno sviluppatore: uno strumento fondamentale. L’ho usata per analizzare log, per generare codice, per ottimizzare query, per scrivere documentazione. L’AI, per come la conosciamo oggi, è un compagno di lavoro eccezionale, un esecutore instancabile che ha reso il mio lavoro più veloce e, in molti casi, migliore.

    Eppure, da qualche tempo, sento che stiamo tutti usando solo una frazione del suo potenziale. Ci siamo abituati a “chiedere” all’AI di fare qualcosa — scrivere, riassumere, disegnare, calcolare — e lei risponde. Ma cosa succederebbe se l’AI potesse non solo rispondere, ma anche agire? Se potesse prendere iniziative, gestire processi e risolvere problemi in autonomia nel nostro ambiente digitale?

    Con questa serie di post, voglio inaugurare un “diario di bordo”. Un viaggio personale e trasparente oltre la mia comfort zone professionale. L’obiettivo è esplorare l’uso dell’AI per scopi meno tradizionali, per quelle attività che richiedono non solo intelligenza, ma anche azione. Condividerò tutto, passo dopo passo: le intuizioni, gli strumenti che proverò, le strategie e, soprattutto, gli inevitabili fallimenti, perché è da lì che si impara davvero.

    Non escludo, ogni tanto, di condividere anche casi di successo più “classici”, se penso possano essere d’aiuto a chi si avvicina a questo mondo o di ispirazione per chi, come me, è sempre a caccia di nuove idee.

    La Prima Missione: Automatizzare un Processo Senza API

    Oggi iniziamo con un problema concreto, frustrante e molto comune. Nella mia azienda rivendiamo licenze per un servizio di terze parti. Periodicamente, un mio collega deve collegarsi al portale del fornitore, accedere con le credenziali, navigare attraverso tre o quattro schermate e verificare a occhio lo stato di utilizzo di una licenza per un nostro cliente.

    È un’operazione da pochi minuti, ma è manuale, ripetitiva e soggetta a errori. Il problema? Il portale non ha API. Non esiste un modo “pulito” per automatizzare questo processo. È un sistema chiuso, un’isola digitale refrattaria a qualsiasi script tradizionale.

    Questa è la sfida perfetta per la nostra prima esplorazione. Vogliamo insegnare a un’AI a compiere questa operazione per noi. Ma prima di mettere le mani in pasta, dobbiamo capire i concetti e il linguaggio di questa nuova frontiera.

    Le Basi per Capirci: Agentic AI e i Protocolli del Futuro

    Quando parliamo di un’AI che “naviga un sito” e “prende decisioni”, non parliamo più di AI generativa, ma di Agentic AI (o, in italiano, di Agenti AI).

    Pensatela così:

    • L’AI Generativa (ChatGPT, Midjourney) è come un consulente geniale. Gli fai una domanda e ti dà una risposta brillante, un testo, un’immagine. Ma resta nella sua stanza.
    • Un Agente AI è come un project manager proattivo. Non solo risponde alle tue domande, ma si alza dalla sedia, va negli altri uffici (le altre app, i siti web), raccoglie informazioni, compila moduli e ti porta il lavoro finito. Ha autonomia, capacità decisionale e, soprattutto, può compiere azioni.

    Ma per creare un mondo in cui questi agenti possano collaborare efficacemente, servono degli standard, delle regole comuni. Proprio come il protocollo TCP/IP ha permesso a computer diversi di parlarsi per creare Internet, oggi stanno nascendo i protocolli per far parlare gli agenti AI tra loro e con il mondo. Due nomi su cui tenere gli occhi puntati sono A2A e MCP.

    1. Google e la Lingua Comune degli Agenti: Il Protocollo A2A

    Al recente Google I/O, si è parlato molto di un futuro multi-agente. Immaginate di chiedere al vostro assistente: “Organizzami un viaggio di lavoro a Milano per martedì prossimo”. Un singolo AI non può fare tutto. Serve un team di agenti specializzati: uno che cerca i voli (Agente Viaggi), uno che controlla la vostra agenda (Agente Calendario) e uno che prenota l’hotel (Agente Prenotazioni).

    Il protocollo Agent2Agent (A2A) di Google è la lingua comune che permette a questi agenti di parlarsi, coordinarsi e collaborare per portare a termine la vostra richiesta. È l’infrastruttura di comunicazione che abilita progetti complessi come Project Mariner, il sistema di Google capace di gestire decine di attività in parallelo.

    2. Anthropic e la Connessione Universale: Il Protocollo MCP

    Se A2A è la lingua per far parlare gli agenti tra loro, il Model Context Protocol (MCP) proposto da Anthropic (i creatori di Claude) è lo standard per farli parlare con il resto del mondo.

    L’MCP punta a diventare una specie di porta USB-C per l’intelligenza artificiale. Invece di dover costruire un connettore su misura per ogni sito, database o applicazione con cui l’AI deve interagire (specialmente quelli senza API, come nel nostro caso!), l’MCP fornirebbe un modo standardizzato per “collegare” l’agente a qualsiasi fonte di dati esterna. Questo abbasserebbe drasticamente la complessità e aprirebbe le porte a un’automazione davvero universale.

    (Nota a margine sulla sicurezza: è rassicurante notare che aziende come Anthropic non stanno solo costruendo i motori, ma anche i freni. La loro Responsible Scaling Policy (RSP) è un framework che li impegna a monitorare e fermare lo sviluppo di IA qualora diventassero troppo rischiose, un aspetto fondamentale di cui parleremo magari più avanti).

    Pronti a Partire

    Ora che abbiamo un’infarinatura dei concetti chiave, siamo pronti a iniziare la nostra missione. L’obiettivo è chiaro: usare i principi dell’Agentic AI per creare un “agente” che possa autonomamente accedere a quel maledetto portale e recuperare le informazioni che ci servono.

    Nel prossimo post di questo diario, inizieremo a esplorare gli strumenti pratici per costruire il nostro primo, semplice agente. Sarà un percorso di tentativi, errori e, spero, di qualche piccola, grande vittoria.

    Seguitemi in questa avventura.

    tornando al caso in oggetto, ieri ho aperto un task interno sulla nostra “social bacheca aziendale” per un task di tipo R&D

    Poco dopo, però, mi sono detto: ma se utilizzassi https://manus.im/ ?

    Questa piattaforma di stata lanciata su invito il 5 marzo 2025 (a proposito se vuoi provarla usa questo link Jhttps://manus.im/invitation/TMAUQ1LY1ASJ6KJ che ci garantirà 500 crediti a testa 😎) ma l’avevo utilizzata ancora poco (vi racconterò in un altro post come l’ho utilizzata per organizzare il mio prossimo viaggio in Apple UK a Londra ed i problemi che ho avuto nell’usarla).

    A differenza di altri servizi, già a marzo offriva delle interessanti integrazioni di tipo Agentic AI con la possibilità di interagire con siti e fare azioni.

    Short Story

    In meno di 30 minuti ho creato un flusso che ogni ultimo sabato del mese mi scarica l’elenco di tutti i siti che usano i due plugin e me lo mando via email (ma questo è solo l’inizio!!!).

    Come funziona il processo

    Ho creato questo prompt con un paio di tentativi

    PROMPT PER ESTRAZIONE SITI GRAVITY FORMS – PROCESSO COMPLETO

    Obiettivo

    Estrarre l’elenco dei siti attivi dalle licenze Gravity Forms e Gravity SMTP, creando due file Excel/CSV separati.

    Istruzioni per Manus

    Devi accedere al sito Gravity Forms, fare login e navigare a due pagine specifiche per estrarre i siti attivi, poi creare due file separati.

    Step 1: Login

    •Naviga a: https://www.gravityforms.com/wp-login.php

    •Richiedi all’utente di completare il login manualmente (oppure usa le credenziali salvate nel browser se disponibili)

    Step 2: Estrazione Prima Licenza (Gravity Forms Elite)

    •Naviga a: https://www.gravityforms.com/my-account/licenses/?action=manage-sites&license_key=6fb5c7ef08e43d6350df804d51c38b78

    •Estrai ESATTAMENTE 20 siti attivi (non includere siti di sviluppo/staging)

    •Salva i dati temporaneamente

    Step 3: Estrazione Seconda Licenza (Gravity SMTP Core)

    •Naviga a: https://www.gravityforms.com/my-account/licenses/?action=manage-sites&license_key=049ca881a1045eb07f5112aff11eeebe

    •Estrai ESATTAMENTE 8 siti attivi

    •Salva i dati temporaneamente

    Step 4: Creazione File Separati

    Crea DUE file separati (non un file unico):

    File 1: gravity_forms.xlsx e gravity_forms.csv

    •Contiene i 20 siti della licenza Gravity Forms Elite

    •Colonne: Nome_Sito, URL, Ultimo_Utilizzo, Tipo_Licenza, Licenza

    File 2: gravity_smtp.xlsx e gravity_smtp.csv

    •Contiene gli 8 siti della licenza Gravity SMTP Core

    •Colonne: Nome_Sito, URL, Ultimo_Utilizzo, Tipo_Licenza, Licenza

    Step 5: Consegna

    •Fornisci entrambi i file all’utente

    •Se richiesto, invia i file via email a: franco.farnedi@f.technology

    Note Importanti

    •I siti devono essere SOLO quelli attivi (non revocati)

    •Non includere siti di sviluppo/staging per Gravity Forms

    •Verificare sempre i conteggi: 20 siti per Gravity Forms, 8 per Gravity SMTP

    •Creare sempre file separati, mai un file unico con fogli multipli

    Automazione

    Per automatizzare questo processo mensilmente, configurare un task ricorrente per l’ultimo sabato di ogni mese alle 8:00 con invio automatico via email.

    Ora vediamo in esecuzione (video)