Fact Checking

ChatGPT nasconde caratteri invisibili nel suo testo? Sì, ma non intenzionalmente

Un nuovo problema per i “copioni dell’AI” è raffigurato dai vari post per cui ChatGPT nasconde caratteri invisibili nel suo testo. Post che definiscono tali caratteri un watermark antiplagio.

ChatGPT nasconde caratteri invisibili nel suo testo? Sì, ma non intenzionalmente

Per quanto ciò sarebbe una funzione utilissima, si tratta di un bug e non di una funzionalità, almeno secondo quanto riportato da ITC.

ChatGPT nasconde caratteri invisibili nel suo testo? Sì, ma non intenzionalmente

Abbiamo provato a girare la domanda a ChatGPT 4o, ricevendo la seguente risposta

In generale ChatGPT non inserisce intenzionalmente caratteri Unicode invisibili nei testi che genera. Tuttavia, possono verificarsi eccezioni in alcune situazioni:

Caratteri Unicode “invisibili” comuni

Alcuni caratteri Unicode sono tecnicamente validi ma non visibili e possono apparire accidentalmente, ad esempio:

  • U+200B (Zero Width Space)
  • U+200C (Zero Width Non-Joiner)
  • U+200D (Zero Width Joiner)
  • U+FEFF (Byte Order Mark)
  • U+2060 (Word Joiner)

Questi possono essere introdotti:

  • da un copia/incolla di testo da fonti esterne (es. web),
  • durante l’elaborazione da parte del browser o dell’applicazione che riceve il testo (ad esempio, un editor di codice o di testo),
  • oppure a volte da bug o comportamenti non intenzionali nel sistema di generazione.

[…]

Cosa fare se ne trovi

Se noti questi caratteri e ti danno problemi:

  • Puoi rimuoverli automaticamente con uno script;
  • oppure chiedermi di “ripulire” un testo specifico che hai, e lo farò per te.

Sostanzialmente, buona parte delle ricerche su ChatGPT nascono da un copincolla che trasferisce caratteri Unicode, standard usato per la creazione di testo, legati alla formattazione, oppure questi caratteri vengono introdotti in generazione.

Non significa che sia una funzione intenzionale ma comporta comunque che ci siano ulteriori indizi alla riconoscibilità di un testo con AI, oltre una sintassi a trattti ripetitiva e imbastita di “Fammi sapere se hai bisogno di aiuto!” e “Lo farò per te”.

Per questo oltre a tool come Smodin e ZeroGPT che si offrono di “riconoscere e umanizzare il testo” sono nati anche tool che cercano caratteri “rimasuglio” in Unicode. O può farlo direttamente ChatGPT.

Condividi
Pubblicato da

Articoli recenti

No, questi non sono immigrati che protestano contro il Natale a Bruxelles

Ci segnalano i nostri contatti un post che dovrebbe raffigurare immigrati che protestano contro il Natale a Bruxelles. Il post…

4 giorni fa

Quando un segnale proveniente dal cosmo diventa una scoperta epocale nei titoli (ma non nella realtà)

Quando si leggono titoli come "dopo 100 anni potremmo averla finalmente vista" riferiti alla materia oscura, è legittimo nutrire qualche…

4 giorni fa

La cometa 3I/ATLAS: perché Loeb sbaglia ad attaccare la NASA

La comunità scientifica assiste incredula alla deriva retorica di Avi Loeb, astrofisico di Harvard che ha trasformato il dibattito sulla…

4 giorni fa

Il sedano è un alimento a calorie negative?

Chiunque abbia mai cercato consigli per dimagrire online potrebbe essersi imbattuto nella teoria dei "cibi a calorie negative".  L'idea è…

4 giorni fa

E così siete caduti nella burla di Nuela imprenditore alimentare (delle carote?)

Sanremo 2026 si avvicina a grandi passi, ed è tempo di burle come in un moderno Carnevale, il più grande…

4 giorni fa

Preghiere per far crescere le piante. La storia dell’uomo che sussurrava ai fagioli.

Scienza e religione difficilmente vanno d’accordo, ma ci sono stati casi in cui, timidamente, hanno cercato di darsi la mano.…

4 giorni fa