現在位置 : ホーム > 製品情報 > .NET 製品一覧 > LEADTOOLS 16.5J Document OCR 製品仕様

製品情報

.NET 製品

LEADTOOLS 16.5J Document OCR

LEADTOOLS 16.5J Document OCR

[リードツール]
帳票や文書に付加価値を与えビジネスドキュメントに

  • バージョン : 16.5J
  • 標準価格 : 567,000円 (本体価格:540,000円)
  • 販売形態 : パッケージ
  • ライセンス : 要ランタイムライセンス
  • 発売日 : 2010/6/30
製品概要
LEADTOOLS16.5J Document OCRは、さまざまなファイル形式の画像の読み込みと保存、画像処理、多彩な表示機能に加えOCR機能を搭載したVisual Studio用文書処理コンポーネントです。
FAXやスキャナから読み込んだ画像データや各種画像ファイルに含まれる文字、表、図を自動判別し、文字部分をテキストデータとして取得できます。製造現場でシリアル番号を認識する品質管理システム、農作物の生産情報を管理するトレーサビリティシステムなど、さまざまな用途のアプリケーション開発が可能です。また、紙上のデータをスムーズにデジタル化できるため、帳票や各種申請フォームなど紙媒体で行われている業務フローに大きな変更を加えることなくシステム化することもできます。
上位エディションの「LEADTOOLS 16.5J Document OCR with Plug-Ins」では、フォーム認識やバーコード認識、マーク認識といったOCR機能を拡張する各種プラグインが付属しています。

Document シリーズ一覧




各エディション情報
エディション名 .NETコントロール WPFコントロール ネイティブ関数(C++)
Document Imaging
Document OCR
Document OCR with Plug-Ins
主な特長
認識言語の切り替えが可能なOCR
英語のみ、日本語のみ、両方の言語を使用というように認識させる言語を切り替えることが可能です。英語のみを指定することで、英語のみのドキュメントを読み取るときに誤った日本語に変換されるといった誤認識を防げます。
言語の切り替え
▲ 英語のみ、日本語のみの言語の切り替え

認識領域の自動判別と調整
FAXやスキャナから読み込んだ画像データや各種画像ファイルに含まれるテキスト、表、図や画像を自動的に区別して認識できます。各領域の設定は個別に調整して再認識させることも可能です。
認識領域の自動判別と調整
▲ 認識領域

認識領域の自動判別
▲ テキスト、画像、表領域を自動的に判別

認識領域のテンプレートの保存と読み込み
判別した認識領域の情報を簡易的なテンプレートとして保存できます。同じサイズ、レイアウトの文書を連続でOCR認識する場合にこのテンプレートを読み込み、認識領域の情報を再利用できます。
認識領域のテンプレートの保存・読み込み
▲ 認識領域のテンプレートの保存・読み込み

マルチページ認識対応
複数ページに対して一度に認識領域の自動判別を実施し、OCR処理を実行することができます。
マルチページ認識対応
▲ マルチページ認識対応

豊富な出力フォーマット
認識した文字データは次のファイル形式で出力することが可能です。
TEXT、EMF、RTF、HTML、XML、DOC、DOCX、XPS

プラグイン製品 【Document OCR Plug-In】
LEADTOOLS 16.5Jでは、Document OCRの機能を拡張するプラグイン製品を用意しています。

  • フォーム認識 Plug-In
    フォーム認識 Plug-Inを利用すると、帳票や伝票といった定型的なレイアウトの文書にOCR処理を実行する領域を自由に設定しテンプレート化できます。認識時にはテンプレートで指定した領域だけにOCR処理を行い、データを取得します。また、複数のテンプレートから対象文書とマッチングするものを自動的に選択して認識するため、大量の伝票類を処理するシステムでも効率よくデータを取得できます。さらに、テンプレートと対象文書のサイズが異なったり、傾いたりしていても文書画像を補正し、正確なOCR処理を施します。FAXなどで受け取った紙帳票からのデータ入力が不要となるため、受発注システムなどでの入力作業を省きコスト削減を図ることができます。フォーム認識
    ▲ いろいろな文書フォーマットに対応


    テンプレートの作成
    フォーム認識 Plug-Inにはテンプレートを作成するための専用GUIデザイナが付属しています。OCR処理をかけたい文書をプレビュー表示させ、画像上の任意の領域を指定するだけでテンプレートを設計できます。認識領域にはデータタイプの設定も可能です。数字、テキスト、イメージ、バーコード、チェックボックスやマークシートを指定できます。帳票や伝票、アンケートや請求書などデータ入力業務で需要の高い定型文書をテンプレート化しておくことで業務の効率化を図れます。
    フォームデザイナ
    ▲ フォームデザイナ

    イメージやチェックボックス、バーコードのフォーム
    ▲ イメージ、チェックボックスやマークシート、バーコードも認識


    テンプレートの自動選択
    帳票や伝票を認識する際に、複数のテンプレートから対象の文書と一致するレイアウトのテンプレートを自動的に判別して文書を認識し、OCR処理を実行できます。認識時に対象文書のサイズがテンプレートと異なっていたり傾いていたりしても、コンポーネントが内部的な補正処理をして正確な認識を行います。
    フォームテンプレート
    ▲ 読み込んだ文書に一致するテンプレートを自動で選択

    フォーム認識
    ▲ テンプレート内の認識フィールドと一致している部分に含まれる文字データを取得します。

    フォームに含まれるマークおよびバーコードの認識
    マーク認識 Plug-In、Barcode Plug-Inとあわせて利用することでフォーム内のチェックボックスやマークシート、1次元バーコードと2次元コードを認識できます。
    OMR
    ▲ チェックボックスのデータを取得します。

    Barcode
    ▲ バーコードのデータを取得します。


  • OCR PDF出力 Plug-In
    OCR処理で認識したテキストデータをPDFに埋め込むことにより、検索可能なPDFドキュメントファイルを作成できます。

  • マーク認識 Plug-In
    アンケートやテストなどで利用されるマークシートやチェックボックスをOMR処理して入力データを認識します。チェックマーク(レ)、✕、線、塗りつぶしまで認識できます。マークシート、チェックボックスの形状は、四角、円、および楕円をサポートしています。

  • Barcode Plug-In(1次元バーコード Plug-In/2次元バーコード Plug-In)
    フォーム認識 Plug-Inと併用することでOCR処理時に文書に含まれるバーコードを認識できます。日本の業務システムでよく利用されるJANコード、一般消費財の流通用に標準化される予定のGS1 データバーなど主要な1次元バーコードに加え、製造分野のトレーサビリティ(製造履歴管理)に使用されているQRコードやDataMatrixといった2次元コードまで幅広くサポートしています。

  • コストパフォーマンスに優れた「Document OCR + プラグインのセット」
    Document OCRでは、OCR機能をさらに幅広いシーンでご利用いただくために機能拡張用のプラグイン製品をご用意しています。今回、このプラグインをあらかじめ追加したエディション「Document OCR with Plug-Ins」をご用意しました。Document OCR with Plug-Insでは、プラグインをそれぞれ追加購入した場合に比べて非常に優れたコストパフォーマンスを実現しています。

    Document OCR Document OCR
    with Plug-Ins
    OCRを利用した文字データの認識
    テンプレートを利用したフォームの認識
    (フォーム認識 Plug-In)
    ※1
    OMRを利用したチェックボックスおよびマークシートの認識
    (マーク認識 Plug-In)
    ※2
    フォーム認識を利用したバーコードの認識
    (Barcode Plug-In)
    ※3
    OCRの認識結果をPDFファイルとして出力
    (OCR PDF出力 Plug-In)
    ※4
    ※1 フォーム認識 Plug-Inが必要です。
    ※2 マーク認識 Plug-Inが必要です。
    ※3 フォーム認識 Plug-InおよびBarcode Plug-Inが必要です。
    ※4 OCR PDF出力 Plug-Inが必要です。
    主な機能
    文書のクリーンアップ
    ざらついた文字のスムージング、FAXやスキャナから取り込んだドキュメントに発生する細かい点や枠線といったノイズの除去や不要な余白の除去、さらにドキュメントにあったパンチ穴の除去を行うクリーンアップ機能を提供します。
    文字のスムージング
    ▲ 文字のスムージング

    パンチ穴の除去
    ▲ パンチ穴の除去

    線、点の除去
    ▲ 線、点の除去

    シミや汚れといったノイズの除去
    ▲ シミや汚れといったノイズの除去

    境界、余白の除去
    ▲ 境界、余白の除去

    文字の白黒反転
    ▲ 文字の白黒反転

    傾きの自動補正
    画像を回転させて傾きを補正できます。FAXやスキャナでの読み取り時に傾いてしまった画像を自動補正し、OCRやOMR処理、バーコード認識時に識字率を向上させます。
    傾きの自動補正
    ▲ 傾きの自動補正

    カラー画像の自動2値画像変換
    カラー画像を2値画像(白黒画像)に変換します。しきい値はスキャナやカメラなどの入力機器に合わせて調整することが可能で、不明瞭なドキュメントを読みやすくするのに最適です。OCR、バーコード、OMRの認識結果を向上させる場合に役立ちます。
    カラー画像を2値画像に変換
    ▲ カラー画像を2値画像に変換

    空白ページの検出
    複数ページの文書をマルチページとしてスキャンする場合、空白ページが含まれていることがあります。ページに含まれるノイズ、裏写り、および線の有無を高速かつ高精度に検出し、それにもとづいてスキャン画像が空白ページかどうかを判定します。
    空白ページの検出

    グレースケール表示
    FAXやスキャナから取り込んだドキュメントは「2値画像」と呼ばれる1ビットの白黒画像で保存されるため、そのままでは文字のかすれが目立ち、可読性が悪い場合があります。2値画像の拡大/縮小表示時に、グレースケール表示することで文字がなめらかになり可読性を高めます。
    白黒表示
    ▲ 白黒表示
    グレースケール表示
    ▲ グレースケール表示

    TWAIN/WIAスキャン
    TWAINおよびWIAをサポートするスキャナやデジタルカメラからの画像の取り込みを制御します。スキャン時の解像度、用紙サイズ、白黒やグレースケール、フルカラーなどのピクセル深度(色深度)、明るさ、コントラスト、ADF(オートシートフィーダ)の使用などの設定を行えます。
    構成製品
    Document OCR

    標準価格: 567,000 円 (本体価格: 540,000 円)


    Document OCR Plug-In

    フォーム認識 Plug-In 標準価格: 147 ,000 円 (本体価格: 140,000 円)
    マーク認識 Plug-In 標準価格: 115 ,500 円 (本体価格: 110,000 円)
    OCR PDF出力 Plug-In 標準価格: 210 ,000 円 (本体価格: 200,000 円)


    Document OCR with Plug-Ins

    標準価格: 756,000 円 (本体価格: 720,000 円)

    注意事項
    コンポーネントの種類
    Windowsフォーム/ASP.NET/WPF用コンポーネント/ネイティブ関数

    サポート言語
    Visual Basic、C#(Windowsフォーム/ASP.NET/WPFコントロール)
    C++(ネイティブ関数)

    ライセンス
    LEADTOOLS 16.5J Document OCR、Document OCR with Plug-Ins、各種プラグイン製品を使用して作成したアプリケーションを配布する場合、ランタイムライセンス(配布ライセンス)が必要です。詳しくは、こちらをご覧ください。
    必要システム
    開発環境
    .NETコントロール
    開発ツール Visual Studio 2005/2008/2010 日本語版
    開発言語 Visual Basic、C#
    Webサーバー Internet Information Services(必須ではありません)
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    WPFコントロール
    開発ツール Visual Studio 2008/2010 日本語版
    開発言語 Visual Basic、C#
    デザインツール Expression Blend 2/3 日本語版(必須ではありません)
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    ネイティブ関数
    開発ツール Visual Studio 2005/2008/2010 日本語版
    開発言語 Visual C++
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    運用環境
    .NETコントロール(Windowsアプリケーション利用時)
    フレームワーク .NET Framework 2.0/3.0/3.5/4/4 Client Profile
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    .NETコントロール(Webアプリケーション利用時)
     サーバー
    フレームワーク .NET Framework 2.0/3.0/3.5/4
    Webサーバー Internet Information Services
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版
     クライアント
    ブラウザ Internet Explorer 6/7/8

    WPFコントロール
    フレームワーク .NET Framework 3.0/3.5/4/4 Client Profile
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    ネイティブ関数
    OS
      32ビット(x86) 64ビット(x64)
    Windows XP 日本語版
    Windows Vista 日本語版
    Windows 7 日本語版
    Windows Server 2003 日本語版
    Windows Server 2008 日本語版
    Windows Server 2008 R2 日本語版

    ソフトウェア認証
    製品の使用にはソフトウェア アクティベーション(ライセンス認証)が必要です。
    ライセンス認証についての詳細はこちらへ
    機能比較表