• 締切済み

tesseractの内部データの一致率を取得したい

tukunetoの回答

  • tukuneto
  • ベストアンサー率26% (12/45)
回答No.3

結局どうなりました? Githubからソースコードを見てみましたか?

関連するQ&A

  • OCRのtesseractで文字の一致率を出したい

    OCRソフトのtesseractを使ってそれぞれの文字の一致率を出したいのですがどうしたらいいでしょうか。 ご存知の方いましたら教えていただけないでしょうか。

  • 文字の一致率を出せる高性能なOCRソフト

    高性能なOCRソフトで文字の一致率が何%だったのか取得できるものはないでしょうか。 日本語、英語、数字が認識できるものがいいです。 できれば無料のものがいいです。体験版でできるものでも可です。 どなたか教えていただけないでしょうか。

  • いろいろな挨拶の返答の仕方について教えてください。

    英会話ができるようにと英会話スクールに通ってる者です。授業の始めにいろいろなフレーズで挨拶されます。が、意味合いがピンとこなくて、とりあえずお決まりのgood、I'm good!になっちゃいます。日本語に訳するのが間違いと指摘する方もいらっしゃると思いますが、私には置き換えたほうが返事に感情移入しやすく、同じgoodでもfeelingが変って来ます。 また最近what's upに対して→good は間違いもしくは△と知りました。not muchが普通との事。日本語でも挨拶のパターンみたいのがあって「調子どうよ?」「いいんじゃん」「ぼちぼち」などあると思います。 このように、挨拶の核となってるのは何なのか挨拶事に教えてほしいです。またその返答のポピュラーなものも合わせてお願いします。 例)how are you? good! how's it going? pretty good what's up? not much 他いろいろです。上記もコアとなる尋ねられてることがわかりません。だから返事も棒読みになっちゃいます。   長くなりましたが質問の意味を理解していただけたでしょうか?よろしくお願いします。

  • 英訳をお願いします

    大学生です。以下の英訳を考えています。 「私の成績表には『良』が多い。」 簡単な英語だと思います。何が気になっているかと言いますと、『良』の複数の言い方です。 大学の成績表は、優、良、可、不可で表示されます。英語で言えば、excellent, good, ok, failureでしょうか。となると、goodが多い、となり、goodsとなると思うのですが、こうなると「品物」とかそんな意味に変わってしまうと思います。だからと言って、much goodness というのもおかしいと思います。 My sheet has many "good"s. 意図的に" " を付けています。 という英語ではダメなのでしょうか。 よろしくお願いします。

  • チェックボックスの英語表記

    英文のチッェクリストを作成して居ます。 キー入力、データー比較の2つのチェックボックスが必要です。 名称はKey Entry、 Data Compareとする予定です。 チッェクボックスはキー入力(入力されたの意味)とデーター一致としようとして居ます。 文字ではチッェクボックスが出来ませんので、[]で代用しますと以下の様にしたいのです。 Key Entry Data Compare [] Key 1 Entry [] Data 1 Match [] Key 2 Entry [] Data 2 Match ここで、 入力された事を確認するチッェクボックスですから、 Key 1 Enteredとした方が良いのでしょうか。 同様に Data 1 Matchedの様にチェックボックスの項目名は過去形にした方が良いのでしょうか。 又、"一致"はMatchで良いでしょか。 宜しくお教え下さい。

  • CSVファイルを , で句切って出力する

    同じ質問になってしまってすみません。 困り度を2ではなく3にしたかったので再掲示してしまいました。 よろしくお願いいたします。 次のような課題が出たのですが教えていただきたく書き込みしました。 皆様のお力をお貸しください。 (1)適当なフォルダにファイルを用意する(ファイルにはCSV形式で文字列が書いてある) (2)最初に文字列をキーボードから入力させる(文字列は半角で5文字まで、それ以外ならば繰り返し入力させる) ※ 指定したファイルがない場合は堤外を出力(try,catch) (3)フォルダのファイル読み込み、(2)で入力した文字列が含まれているCSVのカラムをファイルに出力(ファイルは新規作成 public class Match { public boolean matchString (String[] args) { // マッチング対象の文字列です。 String str = "​http://iwamode.net/index.html";//​ Pattern p = Pattern.compile("^https?://"); // 正規表現のコンパイル Matcher m = p.matcher(str); // 正規表現エンジンの生成 if (m.find()) { // java.util.regex.Matcher#find()メソッドは部分一致するかを判断します。 System.out.println("「http://」または「https://」から始まる文字列です。"); } else { System.out.println("「http://」または「https://」から始まる文字列ではありません。"); } Pattern p2 = Pattern.compile("\\.com"); Matcher m2 = p2.matcher(str); if (m2.find()) { return true; } return false; } } ----------------------------------------------------------- try{ File csv = new File("Kadai10.csv"); // CSVデータファイル BufferedReader br = new BufferedReader(new FileReader(csv)); // 最終行まで読み込む while (br.ready()) { String line = br.readLine(); // 1行をデータの要素に分割 StringTokenizer st = new StringTokenizer(line, ","); while (st.hasMoreTokens()) { // 1行の各要素を区切りで表示 System.out.println(st.nextToken() + ","); } System.out.println(); } br.close(); } catch (FileNotFoundException e) { // Fileオブジェクト生成時の例外捕捉 e.printStackTrace(); } catch (IOException e) { // BufferedReaderオブジェクトのクローズ時の例外捕捉 e.printStackTrace(); } -------------------------------------------------------------- System.out.println("半角5文字までの文字列を入力してください"); BufferedReader r = new BufferedReader(new InputStreamReader(System.in)); String str = r.readLine(); if(str.length() <= 5 && str.matches("[0-9a-zA-Z]")) { 上記の3つの部分ソースを使いプログラムを完成させたいんですがどのようにしたらいいでしょうか?

    • ベストアンサー
    • Java
  • 「読んdeココVer.12」で困っています

    こんにちは いつもお世話になっています。 「読んdeココVer.12」からカラーメモの除去で認識率アップと聞いたので購入したのですが期待に反した結果で困っています。 認識精度が上がっても限界があるのでPDFの透明テキストで使っている人が多いと思いますが、V.12のOCRファクトリーではカラーメモ除去の強度をコントロールできず「強」でかかってしまうみたいです。結果的にPDFの文字(イメージ)が薄くて使用に耐えません。バージョンアップした意味がない感じです。 V.12でカラーメモ除去をつかって、使用できる範囲のPDFにする方法を教えてください。 (原稿は数百ページに渡ることが多いためOCRファクトリーを使わざるを得ません) 関連情報でもかまいません。 Adobe Acrobat Standard 6.0を使用中です。 よろしくお願いします。

  • データの一致性を調べるには?

    ある試験による測定値 サンプル1 10 サンプル2 20 サンプル3 30 と、もう一方で他者による測定値とのデータ サンプル1 20 サンプル2 30 サンプル3 40  の一致性を調べたいと思います。 最初は相関係数だろうと思ったのですが、これって違いますよね? (他者によるデータが一律して高いなどの状況を数字で説明したいのですが・・) 各試験によるサンプルでの差を求めて標準偏差とかをみるのでしょうか? よろしくお願いします。

  • データの不一致の出し方について

    約100個のEXCELファイルのデータをひとつにまとめて、前週のデータと突合して、差分(どれが増えて、どれが減ったか)を最終的にだしたいのですが、すべて違う人間が入力している為に、データの形がバラバラの為、どのようにすればいいのか思いつきません。 例えば A列---B列--C列---D列--E列----F列 会社CD-会社名-支店CD-支店名-営業所CD-営業所名 というデータの構造になっていますが、 「エービーシー」という会社名が「ABC」、「エー・ビー・シ」と半角全角バラバラだったり、長い会社名が省略したりとかなりバラバラです。会社CDと会社名が間違っていたり、A,B,Cは合っているけれど、Dが微妙に違ったり、A,B,C,D,Eは合っているけどFが違ったりしています。 Accsessで最初は単純に不一致クエリウィザードを使って、言われるがままに操作したのですが、何かが足りないのか、結果が全く違っていました。 複数のフィールドではできないかと思い、"&"でつないで一つのフィールドにして、不一致クエリで今週と前週の差分と、前週と今週の差分を出したのですが、本来出したい差分データの他に単純な間違いデータが多量に出てしまい、そのデータを目で見比べて削除し、残ったデータを差分として出した為、非常に時間と手間がかかってしまいました。。。 残ったデータ(一度つなげてしまったもの)を分割する方法がわからず、一つずつ、ひたすらコピペという非効率的な作業を繰り返してしまいました。。。 頭がこんがらがってしまい、考えるよりひたすら手を動かせ状態に陥ってしまい、何も思いつきません(><) うまく説明できませんが、よろしくお願いいたします。m(_ _)m

  • データ型が一致しない?

    エクセルのVBAでユーザーフォームから、アクセスのデータを取得して ユーザーフォームのテキストボックス、コンボボックスに取得させたデータ を表示させようとしています。 TextBox1に顧客IDを0001234のように7桁の数字を入力すると、アクセスの 「T_メイン」テーブルからIDが一致するレコードを取得して、フィールド「クライアント名」、 フィールド「営業所」、フィールド「担当者」のデータをテキストボックスや コンボボックスに表示させたいのです。 それで、以下のようなコードを記入しました。 Private Sub TextBox1_Change() Dim cn As ADODB.Connection Dim rs As ADODB.Recordset Dim SelCmd As String If Len(TextBox1.Value) = 7 Then Set cn = New ADODB.Connection cn.ConnectionString = "Provider=Microsoft.jet.OLEDB.4.0;" _ & "Data Source=D:\管理表.mdb" cn.Open SelCmd = "SELECT * FROM T_メイン " _ & "WHERE 顧客ID = " & TextBox1.text Set rs = New ADODB.Recordset rs.Open SelCmd, cn, adOpenKeyset, adLockOptimistic TextBox2.Value = rs!クライアント名 ComboBox2.Value = rs!営業所 ComboBox3.Value = rs!担当者 rs.Close Set rs = Nothing cn.Close Set cn = Nothing End If End Sub しかし、これを実行させると、 rs.Open SelCmd, cn, adOpenKeyset, adLockOptimistic の部分でエラーがでてしまいます。 「抽出条件でデータ型が一致しません」のエラーメッセージです。 アクセス側の顧客IDの部分はテキスト型ですし、TextBoxもテキスト ですから、一致しているのでないでしょうか? なぜなんでしょう? 参考書とかネットとか見様見真似でやってるので、ものすごく変な部分が あるのかもしれませんが、どうかご教授願います。