Question 1

Se încarcă PDF-ul meu undeva?

Accepted Answer

Nu. PDF-ul este deschis și analizat de propriul tău browser cu o copie locală a motorului pdf.js. Fișierul nu părăsește niciodată dispozitivul tău, deci e sigur pentru contracte, facturi și orice este confidențial.

Question 2

De ce să convertești un PDF în Markdown pentru IA?

Accepted Answer

Modelele mari de limbaj citesc text simplu, nu machete de pagină. Markdown îi oferă modelului titlurile, listele și pauzele de paragraf de care are nevoie ca să urmărească documentul tău, și costă mult mai puțini tokeni decât a lipi un PDF brut sau prost copiat.

Question 3

Funcționează cu PDF-uri scanate?

Accepted Answer

Doar dacă PDF-ul are un strat de text real. O pagină scanată sau fotografiată este doar o imagine, deci nu există nimic de extras — asta necesită OCR, pe care nu îl rulăm aici. Dacă o pagină revine goală, instrumentul îți spune.

Question 4

Cum sunt detectate titlurile?

Accepted Answer

Într-un PDF nu sunt stocate titluri, așa că le deducem din dimensiunea fontului: liniile vizibil mai mari devin titluri Markdown. Este un bun punct de pornire, dar parcurge rezultatul și corectează tot ce a derutat macheta.

PDF în Markdown

De la o machetă de pagină la text pe care un model îl poate citi

De ce Markdown este formatul potrivit pentru IA

Local, privat și gratuit

Întrebări frecvente

Utilitare similare