新聞中心

EEPW首頁(yè) > 模擬技術(shù) > 設(shè)計(jì)應(yīng)用 > TH-OCR文字識(shí)別系統(tǒng)介紹

TH-OCR文字識(shí)別系統(tǒng)介紹

作者: 時(shí)間:2012-07-23 來(lái)源:網(wǎng)絡(luò) 收藏

一.

  是英文Optical Character Recognition的縮寫(xiě),意思為光學(xué)字符識(shí)別,通稱(chēng)為,它的工作原理為通過(guò)掃描儀或數(shù)碼相機(jī)等光學(xué)輸入設(shè)備獲取紙張上的文字圖片信息,利用各種模式識(shí)別算法分析文字形態(tài)特征,判斷出漢字的標(biāo)準(zhǔn)編碼,并按通用格式存儲(chǔ)在文本文件中,由此可以看出,OCR實(shí)際上是讓計(jì)算機(jī)認(rèn)字,實(shí)現(xiàn)文字自動(dòng)輸入。它是一種快捷、省力、高效的文字輸入方法。

  的突出特點(diǎn):

  ◇ 漢英雙語(yǔ)同時(shí)混排,識(shí)別率最高,居世界領(lǐng)先水平。

  ◇ 可以識(shí)別黑白、灰度、彩色圖像,可以讀取多種圖像格式。

  ◇ 首創(chuàng)對(duì)識(shí)別結(jié)果進(jìn)行電子文檔版面復(fù)原功能,所見(jiàn)即所得。

  ◇ 首創(chuàng)日文、韓文、日英混排、韓英混排識(shí)別功能,識(shí)別率98%以上。

  TH-OCR的幾大優(yōu)勢(shì):

  1. 是唯一可以識(shí)別2萬(wàn)多漢字的多體系統(tǒng),漢字識(shí)別國(guó)內(nèi)最優(yōu)。

  2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時(shí)識(shí)別。

  3. 漢字識(shí)別率最高。文通TH-OCR經(jīng)過(guò)"863"智能專(zhuān)家組對(duì)數(shù)十萬(wàn)字的指標(biāo)評(píng)測(cè)和中國(guó)軟件評(píng)測(cè)中心對(duì)產(chǎn)品的嚴(yán)格測(cè)試,識(shí)別正確率超過(guò)99.5%,代表了目前印刷體的最高水平。

  4. 支持多種環(huán)境接口。文通TH-OCR支持WINDOWS環(huán)境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內(nèi)碼,可以用于 WINDOWS NT和WINDOWS 98/2000/XP,適合全球各個(gè)地區(qū)使用。TH-OCR還具有自學(xué)習(xí)功能,不論什么生僻字,都可以通過(guò)鍵盤(pán)輸入進(jìn)行學(xué)習(xí),大大拓寬了OCR系統(tǒng)的識(shí)別字符集。

  二.漢王OCR文本王

  漢王文本王。漢王文本王是漢王公司采用最新的印刷體字符識(shí)別技術(shù),集成文本閱讀校對(duì)開(kāi)發(fā)的一套高效輸入、快捷辦公的精品軟件系統(tǒng)。漢王文本王識(shí)別率高,識(shí)別速度快,并且為用戶定制了多種簡(jiǎn)捷的工作模式:自動(dòng)、單步智能工作模式和專(zhuān)業(yè)批量工作模式自由選擇。相信會(huì)成為您辦公的好助手。

技術(shù)指標(biāo):

  ● 識(shí)別字符:

  簡(jiǎn)體字符集:國(guó)標(biāo)GB2312-80的全部一、二級(jí)漢字6800多個(gè)。

  純英文字符集。

  簡(jiǎn)繁字集:除了簡(jiǎn)體漢字外,還可以混識(shí)臺(tái)灣繁體字5400多個(gè)以及香港繁體字。

  ● 識(shí)別字體種類(lèi):

  能識(shí)別宋體、仿宋、楷、黑、魏碑、隸書(shū)、圓體、行楷等一百多種字體,并支持多種字體混排。

  ● 識(shí)別字號(hào):

  初號(hào)——小六號(hào)字體。

  ● 表格識(shí)別:

  可以自動(dòng)判斷、識(shí)別各種通用型印刷體表格。電子表格還原準(zhǔn)確精美,輸出的電子表格可隨意編輯。

  ● 正確識(shí)別率:

  一般的識(shí)別條件下,對(duì)印刷體文稿都能達(dá)到很高的識(shí)別正確率。

  ● 識(shí)別速度:

  在PII-233計(jì)算機(jī)上,印刷文稿識(shí)別速度達(dá)120字/秒。

  產(chǎn)品特點(diǎn):

  1.智能識(shí)別,準(zhǔn)確無(wú)誤:全智能化識(shí)別核心,識(shí)別速度快,識(shí)別效率高

  2.一鍵掃入,WORD輸出:用戶操作簡(jiǎn)單快捷,與WORD無(wú)縫連接,只需輕松按下一鍵,文檔自動(dòng)輸出到WORD

  3.多種模式,任君選擇:用戶可根據(jù)工作需要或個(gè)人習(xí)慣選擇自動(dòng)、單步智能工作模式或?qū)I(yè)批量工作模式

  4.復(fù)雜版面,自動(dòng)分析:智能分析各種中、英、繁、表、圖混排格式的文本,無(wú)需過(guò)多人工干預(yù)

  5.表格輸入,輕松實(shí)現(xiàn):多樣化的表格判識(shí),完美精確的表格還原,瞬間即可轉(zhuǎn)化成為可任意編輯的電子表格

  6.批量輸入,快速高效:大批量的文件掃描,全自動(dòng)化的文字識(shí)別,速度快,效率更高

  7.版面還原,原文重現(xiàn):精確保留了原版面格式,準(zhǔn)確恢復(fù)文本原貌

  8.文件保存,多種格式:識(shí)別完的文檔可以保存為多種格式(PDF、HTML、RTF、XLS、TXT)的文件,方便實(shí)用

  9.工程管理,更加輕松:工程文件方便管理,工作進(jìn)度隨時(shí)保存,打開(kāi)工程文件即可繼續(xù)工作

  10.文本朗讀、翻譯,省時(shí)省力:漢王閱讀小精靈,避免眼睛疲勞,讓您隨心所欲聽(tīng);翻譯軟件助您跨越語(yǔ)言障礙

三維掃描儀相關(guān)文章:三維掃描儀原理


關(guān)鍵詞: TH-OCR 文字識(shí)別

評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉