Якія фарматы файлаў падтрымлівае сістэма OCR для загрузкі?


Сістэмы OCR падтрымліваюць загрузку файлаў у розных фарматах, каб карыстальнікі маглі гнутка пераўтвараць дакументы з розных крыніц у тэкст, які можна рэдагаваць. Ніжэй прыведзены некаторыя агульныя фарматы файлаў, якія могуць падтрымлівацца сістэмамі OCR:
Фармат выявы:
JPEG/JPG: Шырока выкарыстоўваны фармат сціску выявы, прыдатны для фатаграфій і адсканаваных дакументаў.
PNG: фармат сціснутага малюнка без страт, які падтрымлівае празрыстасць і звычайна выкарыстоўваецца для вэб-малюнкаў і значкоў.
TIFF/TIF (у тым ліку шматстаронкавы TIFF): высакаякасны фармат выявы, які звычайна выкарыстоўваецца ў паліграфічнай і выдавецкай індустрыі і падтрымлівае шматстаронкавыя дакументы.
BMP: стандартны фармат выявы ў сістэмах Windows, які не сціскаецца, мае высокую якасць, але вялікі памер файла.
GIF: фармат выявы, які падтрымлівае анімацыю і празрыстасць. Хоць ён у асноўным выкарыстоўваецца для вэб-малюнкаў, сістэмы OCR таксама могуць яго падтрымліваць.
Фармат дакумента:
PDF: партатыўны фармат дакумента, які шырока выкарыстоўваецца для абмену і друку дакументаў, такіх як электронныя кнігі, справаздачы і кантракты. Сістэмы OCR звычайна здольныя распазнаваць адсканаваны тэкст у файлах PDF.
Хаця сістэмы OCR здольныя апрацоўваць файлы ў розных фарматах, файлы ў розных фарматах могуць мець розныя эфекты распазнавання ў працэсе OCR. Напрыклад, файлы TIFF з высокай якасцю сканавання і выразнымі выявамі звычайна лягчэй распазнаць дакладна, чым файлы JPEG. Такім чынам, выбіраючы загрузку файлаў, карыстальнікі павінны рабіць выбар зыходзячы са сваіх патрэбаў і якасці файлаў.