I modelli di intelligenza artificiale come GPT-4o di OpenAI sono in grado di comprendere il contenuto sia del testo che delle immagini. Possiamo quindi usare questa loro capacità multimodale per fare domande ed estrarre informazioni in maniera automatica da foto e documenti. Per ridurre i costi, possiamo sempre ricorrere a OpenCV, da usare localmente per pre-elaborare l’immagine, così che al servizio venga inviata solo la parte “interessante”