27 novembre 2023

En quin punt estem de la IA generativa: Una explicació tècnica per a advocats

Elen IrazabalPer Elen Irazabal

En el següent article, abordaré la IA generativa i el seu estat actual, tal com acostumo a fer a les meves classes d'Intel·ligència Artificial per a advocats. Per als que vulguin aprofundir, recentment he llançat un curs actualitzat als nous desenvolupaments en aquest camp: https://advocatusai.com/

La IA generativa es refereix a sistemes d'intel·ligència artificial que genera contingut d'alt valor, com ara text, àudio o imatges. El que és innovador d'aquesta última època de la IA generativa que no l'havíem vist abans, és que ara poden fer diverses tasques alhora (et resumeix un text com et pot generar un article), quan abans feien tasques molt específiques. Quan va sortir ChatGPT el nerviosisme del sector jurídic venia perquè és capaç de fer diverses tasques una mateixa aplicació (encara que calgui supervisió).

El nucli de la IA generativa és laprenentatge automàtic, en particular, les xarxes neuronals.

Aquests algorismes estan dissenyats per emular la manera com el cervell humà processa la informació. Mitjançant un procés conegut com a “entrenament”, les xarxes neuronals analitzen grans volums de dades, aprenent patrons i característiques. Com més gran és la quantitat de dades proporcionades, més precises i eficients es tornen en la generació de nous continguts. En resum, la principal habilitat de la IA actual és aprendre a partir de les dades que rep.

En l'àmbit dels textos jurídics, com ara sentències, contractes i lleis, que es troben en espanyol (o en qualsevol altre idioma, com l'anglès), hi intervé el Processament de Llenguatge Natural (PLN). El PLN és una branca de la Intel·ligència Artificial que permet a les màquines aprendre i processar llenguatges naturals com l'espanyol. Així, veiem IAs generatives com ChatGPT, que aprenen sobre diferents idiomes per produir resultats. Aquest aprenentatge es fa a través de les xarxes neuronals.

Aquest aprenentatge, però, no implica una entesa de les paraules en el context del món real. Tot i la seva avançada tecnologia, les IA generatives tenen limitacions significatives. Aprenen patrons i estructures de dades, però no comprenen les connexions del món real de la manera com ho fan els humans. Per exemple, una IA pot generar un article sobre física quàntica basat en textos existents, però no “entén” realment els conceptes de física quàntica, cosa que pot portar a errors bàsics de lògica o de sentit comú.

En definitiva, com assenyala Yann LeCun, Chief AI Scientist de Meta (1), hi ha una manca completa de comprensió del món físic per part d'aquestes IAs.

La fortalesa de la IA actualment resideix en la seva habilitat per processar grans quantitats de dades de manera ràpida. Mentre que a una persona li portaria diverses vides analitzar un milió de textos legals, la IA ho pot fer amb rapidesa. Aquesta rapidesa, però, no equival a una comprensió profunda del que ha processat. Per il·lustrar aquesta limitació, considerem l'exemple següent: un nen pot aprendre a identificar objectes en el seu entorn amb relativa rapidesa, bastant-lo veure'ls unes quantes vegades. En canvi, perquè una IA identifiqui, per exemple, un gat en una imatge, cal que sigui entrenada amb milers d'exemples.

ChatGPT, igual que qualsevol altre model de processament de llenguatge natural, presenta limitacions inherents, especialment en relació amb les dades amb què ha estat entrenat. Aquest model aprèn i genera respostes basant-se en l'extens conjunt de dades proporcionades durant la fase d'entrenament. Això no obstant, la seva capacitat per respondre està directament limitada per l'amplitud i la diversitat d'aquestes dades. En altres paraules, ChatGPT no pot adquirir coneixements ni aprendre informació que no estigui inclosa en el seu conjunt d'entrenament. No té la capacitat d''aprendre del no-res' ni d'adquirir coneixements per si mateix més enllà de la base de dades preexistent.

Per tant, la qualitat i la varietat de les dades utilitzades per entrenar ChatGPT són fonamentals. Com més ampli i divers sigui el conjunt de dades, més informat i versàtil serà el model en les respostes. Això implica que si se us proporcionen dades que abasten una àmplia gamma de temes, estils i perspectives, ChatGPT pot aprendre a generar respostes més precises, rellevants i contextualment adequades. En canvi, si les dades són limitades, esbiaixades o no representatives, les respostes de ChatGPT reflectiran aquestes deficiències, cosa que podria resultar en respostes menys precises o fins i tot errònies.

Com podem superar les limitacions de ChatGPT a l'àmbit jurídic? Atès que ChatGPT té un coneixement general però no específic de la documentació jurídica, una solució viable per als despatxos d'advocats seria afegir una capa addicional d'informació especialitzada a partir de la documentació. Això implica utilitzar la base ja entrenada de GPT i, sobre aquesta, desenvolupar un model de GPT especialitzat en llenguatge jurídic utilitzant dades jurídiques pròpies. Daquesta manera, es podria crear una eina més afinada a les necessitats específiques de làmbit legal.

Una altra limitació important de la IA generativa, incloent-hi models avançats com ChatGPT, és la seva manca de capacitat per discernir la veritat de la falsedat. Aquests sistemes no tenen un sentit inherent del que és veritable o fals. En canvi, operen mitjançant algorismes que processen i generen contingut basant-se en la probabilitat estadística, derivada dels patrons i tendències en les dades amb què van ser entrenats. Aquest aspecte és crucial per comprendre tant el funcionament d'aquests sistemes com les possibles implicacions, especialment en camps on la precisió i la veracitat de la informació són fonamentals.

Aquesta característica de la IA generativa comporta implicacions significatives. D'una banda, permet a aquests sistemes crear contingut coherent i fluid, sovint indistingible del generat per humans, com és el cas a la generació de text. D'altra banda, però, pel fet que el seu 'coneixement' es deriva únicament de les dades existents i no d'una comprensió real del món, aquests sistemes poden generar informació que, encara que sembli plausible o convincent, no sempre és precisa o veritable.

Per il·lustrar de manera senzilla el que la IA generativa pot fer avui dia, recorro a un exemple del curs 'IA Generativa per a Tothom' d'Andrew Ng a Coursera (2): És possible que algú generi un text nou seguint instruccions específiques? Aplicant-ho al context jurídic: Podria un advocat en pràctiques redactar una demanda seguint instruccions detallades? La resposta és sí, encara que no sense errors. De manera semblant, la IA pot generar un text sota directrius específiques, però també amb possibles errors. Aquí és on entra en joc la supervisió de l'advocat, que ha de revisar i corregir la feina feta per la IA.

[1] https://twitter.com/ylecun/status/1728496457601183865?t=ASXWTG1t7uwFe4eTboZFjw&s=35

[2] https://www.coursera.org/learn/generative-ai-for-everyone/home/welcome

Comparteix: