Question 1

Feltöltődik valahova a PDF-em?

Accepted Answer

Nem. A PDF-et a saját böngésződ nyitja meg és dolgozza fel a pdf.js motor helyi példányával. A fájl soha nem hagyja el az eszközödet, így biztonságos szerződésekhez, számlákhoz és bármilyen bizalmas anyaghoz.

Question 2

Miért konvertáljak PDF-et Markdownba az MI-hez?

Accepted Answer

A nagy nyelvi modellek sima szöveget olvasnak, nem oldalelrendezést. A Markdown megadja a modellnek a címsorokat, listákat és bekezdéseket, amelyekre szüksége van a dokumentum követéséhez, és sokkal kevesebb tokenbe kerül, mint egy nyers vagy rosszul másolt PDF-szöveg.

Question 3

Működik szkennelt PDF-eken?

Accepted Answer

Csak akkor, ha a PDF-nek van valódi szövegrétege. Egy beszkennelt vagy lefényképezett oldal csak kép, így nincs mit kinyerni — ahhoz OCR kell, amit itt nem futtatunk. Ha egy oldal üresen jön vissza, az eszköz jelzi.

Question 4

Hogyan ismeri fel a címsorokat?

Accepted Answer

A PDF nem tárol címsorokat, ezért a betűméretből következtetünk rájuk: a feltűnően nagyobb sorok Markdown-címsorrá válnak. Jó kiindulópont, de fusd át az eredményt, és javítsd, amit az elrendezés megtévesztett.

PDF Markdownba

Oldalképből szöveg, amit a modell elolvas

Miért a Markdown a megfelelő formátum az MI-hez

Helyi, privát és ingyenes

GYIK

Kapcsolódó eszközök