Eines gratuïtes per anonimitzar PDFs: comparativa honesta 2026

24 d’abril del 2026

Anonimitzar un PDF de forma gratuïta és perfectament possible. La qüestió és si la tècnica gratuïta que facis servir resulta realment irreversible i si deixa un log d’auditoria suficient per demostrar compliment RGPD davant l’AEPD. Aquesta guia analitza les opcions gratuïtes més utilitzades el 2026, explica les seves limitacions reals i assenyala quan té sentit passar a una eina professional.

Què significa “anonimitzar” un PDF a la pràctica

Molts processos que es venen com a anonimització només ho són a efectes visuals. Un autèntic procés d’anonimització sobre un PDF hauria de:

  1. Eliminar el text subjacent, no només col·locar un rectangle negre damunt d’ell.
  2. Netejar les metadades de l’arxiu (autor, programa, historial de revisions).
  3. Eliminar adjunts i capes ocultes que alguns PDFs conserven.
  4. Processar les imatges incrustades si contenen text amb dades personals (p. ex. un DNI escanejat).
  5. Generar un fitxer de sortida nou, no sobreescriure l’original.
  6. Deixar un registre auditable de què s’ha eliminat i quan.

Amb aquest checklist al cap, analitzem les eines gratuïtes més comunes.

1. Adobe Acrobat Reader (gratuït) + edició manual

El que se sol fer: obrir el PDF, afegir rectangles negres sobre les dades personals, desar.

El problema: Adobe Reader en la seva versió gratuïta no inclou l’eina de redacció. Els rectangles afegits són anotacions gràfiques sobre el PDF, però el text original continua existint per sota. Qualsevol pot seleccionar el text ocult amb Ctrl+A → copiar → enganxar en un altre document i recuperar-lo.

Veredicte: inacceptable com a anonimització. És la causa número u de fuites de dades en documents suposadament depurats.

2. Adobe Acrobat Pro (versió de pagament, 23 €/mes aprox.)

No és gratuïta, però es menciona perquè és l’eina “oficial” en moltes organitzacions.

Inclou: eina de redacció real que elimina el text subjacent; eina de neteja de metadades separada.

Limitacions:

  • Cal aplicar redacció i neteja de metadades en dos passos diferents; saltar-se’n un és freqüent.
  • No detecta automàticament què s’ha de redactar: l’usuari marca a mà cada ocurrència.
  • No reconeix identificadors propis del context espanyol (DNI, NIE, CCC, NUSS) com a patrons automàtics.
  • No genera log d’auditoria exportable per presentar davant l’AEPD.

Veredicte: tècnicament és anonimització real, però el procés és lent i propens a error humà — és fàcil oblidar ocurrències o no depurar metadades.

3. LibreOffice Draw

El que es pot fer: obrir el PDF a Draw (si és editable), eliminar objectes de text corresponents a dades personals, exportar a PDF.

Avantatges: gratuït, sense limitacions de documents al mes.

Limitacions:

  • Només funciona amb PDFs editables (no escanejats).
  • No hi ha mode “redacció”: elimines el text manualment, un per un.
  • No neteja metadades del PDF exportat (queden al XMP).
  • Inviable per a lots de documents.
  • Els canvis no queden registrats per a auditoria.

Veredicte: útil per a casos molt puntuals (un contracte solt), inviable per a processos repetitius.

4. Eines en línia gratuïtes (tipus PDF24, Smallpdf, iLovePDF)

El que ofereixen: pujar el PDF, aplicar eina de redacció en línia, descarregar el resultat.

Avantatges: no requereixen instal·lació. Algunes redacten correctament el text subjacent.

Limitacions serioses:

  • Els fitxers es pugen a servidors de tercers, habitualment fora del control de l’usuari. Si contenen dades personals, la pujada en si mateixa és un tractament que requereix contracte d’encàrrec amb el proveïdor i, probablement, avaluació d’impacte.
  • La majoria d’aquestes eines no tenen servidors a la UE ni signen encàrrecs de tractament RGPD.
  • Límits de mida i nombre de documents al dia en la versió gratuïta.
  • No generen log d’auditoria exportable.

Veredicte: jurídicament problemàtic per a documents amb dades personals reals. Si es fan servir, hauria de ser sobre documents ja anonimitzats prèviament, mai amb els originals.

Anonimitza PDFs amb dades espanyoles en segons

anonimiza.do reconeix DNI, NIE, IBAN, matrícules i altres identificadors del sistema espanyol. Servidors a AWS EU-Frankfurt. Prova 3 documents gratis.

Provar gratis

5. Scripts de Python amb PyPDF2, pdfplumber, pikepdf

El que es pot fer: programar un script que obri el PDF, detecti patrons de dades personals (regex o NLP), els reemplaci per buits o X i desi un PDF net.

Avantatges:

  • Control total sobre el procés.
  • Reproduïble i auditable si es dissenya bé.
  • Gratuït si ja tens un desenvolupador disponible.

Limitacions:

  • Requereix coneixements de programació i temps de desenvolupament.
  • Construir un detector d’identificadors espanyols amb alta precisió (diferenciar un DNI d’un número qualsevol en el text) no és trivial.
  • Els PDFs tenen estructures molt diverses: un script que funciona amb un tipus pot fallar amb un altre.
  • Manteniment continu si canvien els formats de document.

Veredicte: raonable només si ja disposes d’equip tècnic i el volum justifica el desenvolupament. Per al 95% de les empreses, pagar per una eina especialitzada surt més barat que mantenir un script intern.

6. pdf-redact-tools (eina open source de la Freedom of the Press Foundation)

Avantatges: FOSS, enfocada al periodisme, aplica redacció real i converteix les pàgines en imatges per eliminar capes ocultes.

Limitacions:

  • No detecta automàticament què redactar; cal combinar-la amb una altra eina de detecció.
  • En convertir a imatge, el document perd la selecció de text (menys accessibilitat).
  • Requereix línia de comandes.
  • Inactivitat de desenvolupament: pocs commits recents.

Veredicte: excel·lent per a redacció “de seguretat màxima” tipus Snowden leaks, però excessiu per al flux empresarial típic.

Taula resum

EinaRedacció realElimina metadadesDetecta autoFunciona en escanejatsLog auditoriaRGPD sense fricció
Adobe Reader gratuït
Adobe Acrobat ProManual✅ amb OCRParcial
LibreOffice DrawManualParcial
En línia (PDF24, Smallpdf…)DepènDepèn❌ UE
Script PythonSí si s’implementaSí si s’implementaSí si s’entrenaSí amb OCRSí si s’implementa✅ (in-house)
pdf-redact-tools✅ (in-house)
anonimiza.do✅ (IA en espanyol)✅ OCR integrat✅ UE + DPA

Quan té sentit invertir en una eina professional

Les eines gratuïtes són adequades quan:

  • Processes menys de 5-10 documents a l’any.
  • Els documents són editables i senzills.
  • Disposes de temps per revisar manualment cada resultat.
  • No tens obligació específica de documentar el procediment davant l’AEPD.

Hauries de considerar una eina professional (gratuïta o de pagament) quan:

  • Processes desenes o centenars de documents al mes.
  • Treballes amb documents escanejats que requereixen OCR.
  • Necessites detectar identificadors propis del sistema espanyol (DNI, NIE, número de col·legiat, etc.).
  • Necessites log d’auditoria per demostrar compliment.
  • Tens obligació professional (advocats, metges, assessors) de garantir confidencialitat.
  • La teva organització ja ha tingut un incident o un requeriment de l’AEPD.

Com es posiciona anonimiza.do

anonimiza.do va néixer precisament per cobrir el buit entre les eines generalistes i els scripts tècnics:

  • 3 documents gratuïts al mes sense targeta, suficient per a molts casos esporàdics.
  • Reconeixement específic del sistema espanyol: DNI amb lletra, NIE, NUSS, IBAN espanyol, matrícules, codis postals.
  • OCR integrat per a documents escanejats.
  • Servidors a la UE (AWS Frankfurt) i contracte d’encàrrec RGPD disponible.
  • Log d’auditoria descarregable amb cada document processat.
  • Perfils per sector (RH, legal, sanitari) amb criteris diferenciats.

Preguntes freqüents

Puc anonimitzar un PDF amb Microsoft Word?

Pots obrir-lo a Word (si el PDF és editable), eliminar les dades i exportar a PDF, però Word deixa metadades pesades i no garanteix que l’historial de canvis no es conservi. És millor opció que Adobe Reader gratis, però pitjor que qualsevol eina específica.

Els PDFs escanejats es poden anonimitzar sense eina especialitzada?

Només si els converteixes abans a text mitjançant OCR. Sense OCR, l’única cosa que pots fer és cobrir amb rectangles negres aplanats sobre les imatges, i has d’assegurar-te que el resultat és un PDF no editable on els rectangles formin part de la imatge, no anotacions.

Hi ha risc en fer servir serveis en línia gratuïts per a dades reals?

Sí. Pujar documents amb dades personals a un servidor de tercers és un tractament subjecte al RGPD. El servei passa a ser un encarregat de tractament i s’hauria de signar el corresponent contracte. La majoria de serveis gratuïts no l’ofereixen.

Es pot automatitzar l’anonimització en Python amb IA?

Sí, fent servir models de NER (reconeixement d’entitats nomenades) entrenats en espanyol. El problema és el cost d’entrenament i manteniment: un model ben afinat per al sistema espanyol requereix centenars de milers d’exemples etiquetats i afinat continu.

Conclusió

Les eines gratuïtes per anonimitzar PDFs existeixen i són vàlides per a casos molt concrets, però gairebé cap cobreix el procés complet (redacció real + neteja de metadades + detecció automàtica + OCR + log). Per a qualsevol volum seriós de treball professional, l’opció sensata és una eina especialitzada.

Si vols provar com una anonimització professional s’integra en el teu flux, prova anonimiza.do. Tres documents al mes gratis i sense targeta, suficient per avaluar si encaixa amb el teu cas d’ús.

Anonimitza els teus documents sense perdre hores

Prova anonimiza.do gratis — 3 documents al mes sense targeta. Elimina dades personals de contractes, nòmines i informes en segons, amb plena conformitat RGPD.

Prova-ho gratis!