„Tesseract.js“ perkelia vaizdų OCR vertimą į naršykles

OCR vertimas vis dar nėra tobulas, tačiau pastaraisiais metais jis gerokai pagerėjo. Vedantis kelią yra „Tesseract“ vertimo variklis šiuo metu atidarytas C++.

Nors tai yra neįtikėtina biblioteka, tačiau tik programinė įranga. Laimei, kažkas padarė „Tesseract“ uostą į „JavaScript“, kuri vadinama „Tesseract.js“. Tai palaiko iki 60 kalbų ir nors tai tikrai nėra tobula, tai gerai atlieka darbą.

Įrengimas ir diegimas yra vėjas, kur galite nukreipti bet kokį vaizdo elementą puslapyje ir paleiskite Tesseract.recognize () funkcija. Tai gali užtrukti bet kokio tipo vaizdą ir jis bus automatiškai suspausti ir versti tiesiai naršyklėje.

Jūs galite gauti daug sudėtingesnį, bet grožis kaip galite paleisti OCR su viena kodo eilute.

Jei norite matyti tiesioginę demonstraciją, apsilankykite Tesseract.js nukreipimo puslapyje. Tai veikia tiesiai naršyklėje, kurioje galite nuvilkite bet kokį nuskaitytą teksto vaizdą, kad gautumėte automatinį OCR vertimą.

Šį pavyzdį taip pat galite atsisiųsti vietiniu būdu per „GitHub“ puslapį arba galite sukurti savo programą įtraukdami „Tesseract.js“ scenarijų tiesiai iš CDN.

Paprasčiausias kodo pavyzdys atrodo taip, kur myImage yra tiesioginė nuoroda į HTML vaizdo elementą:

 Tesseract.recognize (myImage) .en (funkcija (rezultatas) console.log (results));

Bet kuriuo atveju ši biblioteka yra labai naudinga, kad galėtumėte judėti su OCR žiniatinklyje. Tai toli gražu ne tobula, bet taip pat geriausias ištekliai žiniatinklio kūrėjams, kurie nori dinaminio puslapio OCR funkcionalumo.

Jei norite sužinoti daugiau, apsilankykite „Tesseract.js GitHub“ puslapyje, kuriame galite peržiūrėti tiesioginį demonstravimą ir naršyti internete pateikiamoje dokumentacijoje.