TH-OCR文字識(shí)別系統(tǒng)介紹
一.TH-OCR
TH-OCR是英文Optical Character Recognition的縮寫(xiě),意思為光學(xué)字符識(shí)別,通稱(chēng)為文字識(shí)別,它的工作原理為通過(guò)掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,利用各種模式識(shí)別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲(chǔ)在文本文件中,由此可以看出,OCR實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動(dòng)輸入。它是一種快捷、省力、高效的文字輸入方法。
TH-OCR的突出特點(diǎn):
◇ 漢英雙語(yǔ)同時(shí)混排,識(shí)別率最高,居世界領(lǐng)先水平。
◇ 可以識(shí)別黑白、灰度、彩色圖像,可以讀取多種圖像格式。
◇ 首創(chuàng)對(duì)識(shí)別結(jié)果進(jìn)行電子文檔版面復(fù)原功能,所見(jiàn)即所得。
◇ 首創(chuàng)日文、韓文、日英混排、韓英混排識(shí)別功能,識(shí)別率98%以上。
TH-OCR的幾大優(yōu)勢(shì):
1. 是唯一可以識(shí)別2萬(wàn)多漢字的多體文字識(shí)別系統(tǒng),漢字識(shí)別國(guó)內(nèi)最優(yōu)。
2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時(shí)識(shí)別。
3. 漢字識(shí)別率最高。文通TH-OCR經(jīng)過(guò)"863"智能專(zhuān)家組對(duì)數(shù)十萬(wàn)字的指標(biāo)評(píng)測(cè)和中國(guó)軟件評(píng)測(cè)中心對(duì)產(chǎn)品的嚴(yán)格測(cè)試,識(shí)別正確率超過(guò)99.5%,代表了目前印刷體文字識(shí)別的最高水平。
4. 支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個(gè)地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過(guò)鍵盤(pán)輸入進(jìn)行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識(shí)別字符集。
二.漢王OCR文本王
漢王文本王。漢王文本王是漢王公司采用最新的印刷體字符識(shí)別技術(shù),集成文本閱讀校對(duì)開(kāi)發(fā)的一套高效輸入、快捷辦公的精品軟件系統(tǒng)。漢王文本王識(shí)別率高,識(shí)別速度快,并且為用戶定制了多種簡(jiǎn)捷的工作模式:自動(dòng)、單步智能工作模式和專(zhuān)業(yè)批量工作模式自由選擇。相信會(huì)成為您辦公的好助手。
技術(shù)指標(biāo):
● 識(shí)別字符:
簡(jiǎn)體字符集:國(guó)標(biāo)GB2312-80的全部一、二級(jí)漢字6800多個(gè)。
純英文字符集。
簡(jiǎn)繁字集:除了簡(jiǎn)體漢字外,還可以混識(shí)臺(tái)灣繁體字5400多個(gè)以及香港繁體字。
● 識(shí)別字體種類(lèi):
能識(shí)別宋體、仿宋、楷、黑、魏碑、隸書(shū)、圓體、行楷等一百多種字體,并支持多種字體混排。
● 識(shí)別字號(hào):
初號(hào)——小六號(hào)字體。
● 表格識(shí)別:
可以自動(dòng)判斷、識(shí)別各種通用型印刷體表格。電子表格還原準(zhǔn)確精美,輸出的電子表格可隨意編輯。
● 正確識(shí)別率:
一般的識(shí)別條件下,對(duì)印刷體文稿都能達(dá)到很高的識(shí)別正確率。
● 識(shí)別速度:
在PII-233計(jì)算機(jī)上,印刷文稿識(shí)別速度達(dá)120字/秒。
產(chǎn)品特點(diǎn):
1.智能識(shí)別,準(zhǔn)確無(wú)誤:全智能化識(shí)別核心,識(shí)別速度快,識(shí)別效率高
2.一鍵掃入,WORD輸出:用戶操作簡(jiǎn)單快捷,與WORD無(wú)縫連接,只需輕松按下一鍵,文檔自動(dòng)輸出到WORD
3.多種模式,任君選擇:用戶可根據(jù)工作需要或個(gè)人習(xí)慣選擇自動(dòng)、單步智能工作模式或?qū)I(yè)批量工作模式
4.復(fù)雜版面,自動(dòng)分析:智能分析各種中、英、繁、表、圖混排格式的文本,無(wú)需過(guò)多人工干預(yù)
5.表格輸入,輕松實(shí)現(xiàn):多樣化的表格判識(shí),完美精確的表格還原,瞬間即可轉(zhuǎn)化成為可任意編輯的電子表格
6.批量輸入,快速高效:大批量的文件掃描,全自動(dòng)化的文字識(shí)別,速度快,效率更高
7.版面還原,原文重現(xiàn):精確保留了原版面格式,準(zhǔn)確恢復(fù)文本原貌
8.文件保存,多種格式:識(shí)別完的文檔可以保存為多種格式(PDF、HTML、RTF、XLS、TXT)的文件,方便實(shí)用
9.工程管理,更加輕松:工程文件方便管理,工作進(jìn)度隨時(shí)保存,打開(kāi)工程文件即可繼續(xù)工作
10.文本朗讀、翻譯,省時(shí)省力:漢王閱讀小精靈,避免眼睛疲勞,讓您隨心所欲聽(tīng);翻譯軟件助您跨越語(yǔ)言障礙
三維掃描儀相關(guān)文章:三維掃描儀原理
評(píng)論