09 febrer 2026

El mite trencat: quan fer servir IA no és suficient

Alex DantartPer Alex Dantart

Durant mesos repetim un mantra tranquil·litzador: «La IA no et substituirà, et substituirà algú que la faci servir». Avui he d'expressar una cosa incòmode: aquesta frase ja està obsoleta.

I queda més clar encara després d'analitzar un estudi empíric amb 2.700 casos reals que demostra una cosa que molts intuíem però ningú no havia mesurat: no n'hi ha prou amb utilitzar IA. Cal saber quin tipus dIA utilitzar, o el remei serà pitjor que la malaltia.

L'experiment que ho canvia tot

Es van avaluar 12 dels millors models del mercat (GPT-5, Claude, Gemini…) redactant 75 tasques jurídiques reals: recursos, oposicions a mesures cautelars, fonamentació jurisprudencial. Tres escenaris diferents:

  1. IA pura: preguntant directament a un d'aquests models genèrics.
  2. IA amb fonts bàsiques: passant abans per corpus privat.
  3. IA amb verificació avançada: amb corpus privat i tècniques de verificació.

Els resultats són demolidors, i pot treure el son a més dun. Quan un advocat demana a ChatGPT o Claude que redacti un recurs «de memòria», gairebé 3 de cada 10 cites que genera són falses. Sentències inexistents, atribucions incorrectes, doctrina inventada. El 26.8% de taxa d'error en cites i un 15.6% en fets fabricats.

Sona a exageració? Potser no tanta per a aquell lletrat sancionat pel Tribunal Constitucional per presentar 19 cites inexistents. O als col·legues de professió italians i argentins recentment amonestats pel mateix.

Però n'hi ha més: cada document generat així requereix 35 minuts de mitjana de revisió per corregir-ho, de manera que no és un esborrany útil, sinó un passiu informatiu que fa perdre més temps del que es guanya.

La solució no és deixar de fer servir IA

Aquí hi ha el gir: quan aquestes mateixes IAs treballen sobre fonts verificades (cosa que s'aconsegueix amb la tecnologia RAG), l'error baixa al 8.3%. I amb sistemes avançats de verificació, pràcticament desapareix: 0.046%. A més, el temps de revisió es redueix de 35 minuts a… 1.2 minuts.

La diferència no és «usar més IA». Està en entendre que hi ha dos tipus d'IA jurídica radicalment diferents:

L'oracle creatiu (IA generativa pura) que:

  • Dóna respostes fluides i convincents
  • Inventa quan no ho sap
  • El seu objectiu és coherència, no veracitat
  • És com contractar algú brillant… però mitòman

L'arxiver expert (IA consultiva) que:

  • Cerca primer, sintetitza després
  • Cita fonts verificables
  • Admet quan no troba alguna cosa
  • És com tenir un col·laborador meticulós que ho anota tot

Per què això canvia el paradigma professional

Tornem a la idea de l'inici: «Et substituirà algú que faci servir IA.” Doncs no. Perquè a final d'any probablement tots la farem servir. Word incorporarà IA de sèrie, les bases de dades jurídiques la integraran, els jutjats la implementaran, les solucions legaltech en viuen. La veritable divisió no serà entre qui utilitza IA i qui no. Serà entre:

  • Els arquitectes destratègia: professionals que entenen quin tipus de IA necessiten per a cada tasca, que saben auditar-la, verificar-la, dirigir-la. Que usen tecnologia consultiva per accelerar la investigació, però mantenen el criteri humà al centre.
  • Els operaris de tasques: professionals que deleguen el pensament a la màquina, que assumeixen que si sona bé, ha de ser correcte. Que queden atrapats en un bucle de «generar-revisar-corregir» que destrueix l'eficiència que buscaven suposadament.

Tres preguntes que ens hem de fer avui

  1. L'eina que faig servir em diu d'on treu la informació? Si no es pot verificar cada afirmació en 10 segons, s'està fent servir un oracle i no un arxiver.
  2. 2. Passo més temps corregint que el que guanyo generant? Si és així, el paradigma que es fa servir està trencat.
  3. 3. La meva feina s'està convertint en una llista de tasques o una cadena de decisions? Perquè les tasques s'abarateixen, però la decisió s'encareix.

L'única assegurança professional vàlida

Aquest estudi demostra una mica revelador: la competència digital ja no és suficient. Necessitem competència arquitectònica: saber distingir quan necessitem creativitat i quan necessitem rigor absolut. No es tracta de tenir por de la IA. Es tracta de tenir por de utilitzar-la malament.

Perquè quan el Tribunal Constitucional sanciona, no pregunta quin model vas fer servir. Pregunta per què no es va verificar. I «ho va generar la IA» no és una defensa sinó més aviat un agreujant.

La professió no es jugarà en qui utilitza IA, sinó en qui entén quin tipus d'IA necessita a cada moment.

I en qui conserva alguna cosa que cap màquina no pot replicar: la capacitat de posar el nom i la responsabilitat darrere de cada decisió.

Nota: L'estudi complet «Fiabilitat per disseny» amb els 2.700 casos analitzats està disponible a arxiv.org. Inclou el dataset JURIDICO-FCR per a replicació.

(Enllaç: https://arxiv.org/abs/2601.15476)

Comparteix: