• ベストアンサー

書類の整理(テキスト、PDFetc)

chieffishの回答

  • chieffish
  • ベストアンサー率44% (1149/2554)
回答No.2

データベースソフトを使えばできますよ。 私はFilemakerしか使っていませんし、一つの目的で使うには高いけど。

shounika
質問者

お礼

御礼が大変遅れました。 ファイルメーカーは、以前友人に教わり文献整理に使っていました。 しばらくは良かったのですが、バージョンアップや書類のリンク切れなど有り、また、すぐに聞ける友人も近くにいなくなりハードルが高くなってしまいました。 もう一度やってみる価値はありそうですが。 簡単に文献や画像等に検索キーワードが紐付け出来るソフトを探しています。 出来れば、スキャンして題名を付け、キーワードを大量に紐付け出来ると良いのですが。 ありがとうございました。

関連するQ&A

  • PDFのテキスト化

    以前にも類似の質問をしましたが、別の観点から質問させてください。 とあるPDFの文字部分をコピーし、検索窓に貼り付けると 文字が化けてしまいます。(画像) これをWordなどに貼り付けた場合も□□などと表示されます。 しかしながら化けたまま検索をかけても、正しい検索が なされたのでダミーテキストではないと考えています。 ちなみにここに貼ると􀲵􃙚􁏒 とでます。(「函館市」の部分) もちろん解決方法があれば教えていただきたいのですが、 今回お聞きしたいのは、PDFを作成する際に、テキストコピーを 制限する機能が存在するかということです。 印刷禁止などパスワードをかけられることは知っていますが、 この手の制限は存在するのでしょうか。 アイディアを頂けるとありがたいです。

  • PDFファイルに表示されているテキスト検索は可能ですか?

    ホームページを作成する際に、ページのリンクボタンからPDFファイルにリンクさせ、そのPDFファイルのテキストのキーワードを検索できるようにしたいと考えています。 AcrobatのPDFファイルに表示されているテキストを検索することはできるのかどうか教えてください。 1.ブラウザ上でできるのか。 2.ブラウザ上に表示させているPDFファイルのテキストのキーワードを検索しようとした場合、ASPやJavaScript等プログラムを作成すれば検索は可能となるのか。 質問が下手ですみませんが、ヒントでもいいので是非教えてください。宜しくお願いします。

  • PDFファイル中のテキストデータを簡単に削除する方法

    PDFファイル中のテキストデータを簡単に削除する方法はありませんでしょうか? 具体的には、スキャナーによって取り込んだ画像ファイルをPDFファイルにまとめてあり、そこに、後からテキストオブジェクトとしてヘッダー、フッターが追加されているPDFファイルがあります。 このPDFファイル中のヘッダー、フッターを全て削除したいのです。 現状では、Acrobat の TaouchUpテキストツールを使って、1ページずつ削除するしか方法が思いつきません。 ページ数が膨大なので、この方法はあまりにも現実的ではありません。 何か良い方法、または、便利なツールなどご存知でしたら教えてください。 なお、トリミングでヘッダー、フッター部分を全て隠してしまおうともしたのですが、元のスキャン画像が、その部分にまでかぶっているページも多いので、それは断念しました。 よろしくお願いします。

  • PDFファイルを一括して透明テキスト付PDFファイルにするソフトはありませんか?

    書類をスキャンした数千のPDFファイルがあります。このファイルを管理するために、透明テキスト付きにしてデスクトップ検索ソフトを使いたいと思います。 複数のPDFファイルをOCRにかけて一気に透明テキスト付きにしてくれるソフトはありませんか。 キーワードを引っかけられればいいので、認識精度をうるさくは言いませんが、斜めにスキャンされたものを自動修正して文字認識してくれるようであれば最高だなぁと思います。

  • 画像付きファイルの検索

    ファイル検索について 画像が挿入されたファイルのみを検索したいのですが、検索方法として何か方法がないでしょうか? ファイルは、Office製品・PDFになります。 ファイルの容量でソートし、容量の大きいものから、1つ1つ見ていく方法は、思いついたのですが、数が多いために、何かの方法で 特定できないのかな…と考えております。 よろしくお願いします。

  • 複雑なテキストファイルのソート方法

    UNIX上で以下の様なテキストファイルがあります。 1 subckt keyword1 2 : 3 ends keyword1 4 subckt keyword2 5 : 6 ends keyword2 7 subckt keyword3 8 : 9 ends keyword3 10 M0(net1 net2 net3 net4) keyword4 11 M1(net5 net6 net7 net8) keyword5 subckt~endsはひとつのブロックです。(よって、1~3、4~6、7~9はひとつのブロックとしてあつかいます。) ブロックとしての記述と10、11行目のように1行で記述されたものが混在しているファイルです。 この様なフォーマットのファイルをサンプルのテキストファイルで記述されているkeywordでソートしたいのですが いい方法はないでしょうか? ブロックとして記述されている部分をばらけさせると意味がないのでブロックで記述されている部分はブロック毎 ソートしないと意味がありません。 スクリプトのようなものを組むしかないようにも思うのですが、いい方法が思いつきません。 どなたか御指南お願いします。

  • 【PDF】テキスト化できない…

    以前にも同じ質問をしていますが、どうにも解決しないので改めて…。 すみません。 とあるPDFの文字をコピーして、Wordなどに貼り付けると文字化けしてしまいます。 試しにここに貼ってみると、「􁏒」のように表示されます。 ちなみに、下の画像は検索窓に貼ってみたところです。 ただし、そのまま検索をかけると正しく検索されるため、ダミーテキストではないはずです。 ---------------------- これまでの回答で、 ・PDFの制限 ・フォントの問題   の可能性との指摘をいただきました。 PDFについて、 Adobe Acrobatの「セキュリティプロパティの表示」によると全項目「許可」になっています。 (Readerでは一部「許可しない」になっていますが) フォントについて、 同プロパティの別のタブで「MS-Mincho」などと表示されています。 半ば諦めているので、せめて原因だけでも教えていただけるとスッキリします。 よろしくお願いいたします。

  • サイト内のファイル検索

    サイト内のファイルを検索できるcgiを探しています。 ページ内の文字列に対しての検索ではなく、ファイルそのものの検索ができるようにしたいのです。 ページ内にテキストとしてのキーワードがなく、検索対象になるページ数も多いので、どうして良いのか困っています。 例えば「HPの閲覧者からは見えないように、各ページにキーワードをMETAタグのように埋め込んで検索する」もしくは「簡易データベースを作る」という方法になるのでしょうか? もしくはCGIだけでなく、Java Scriptでもできるのでしょうか? ちなみに検索の対象になるファイルは500ページを越えています。 CGI初心者が設置するには難しいのかもしれませんが、どなたかご教授をお願いします。 また、参考になりそうなHPがありましたら、教えていただけないでしょうか? よろしくお願いします。

    • 締切済み
    • CGI
  • jQueryのテキストボックスのすかし文字に付いて

    Twitterの右上の@ユーザ名/名前などのようにすかし文字と同じ文字を入力しても 送信出来るようにするにはどうすれば良いのでしょうか? Web上のサンプルやプラグインは見た限り全てすかし文字に指定した文字を入力すると 入力した文字が消えると言うもので、「キーワード」というすかし文字を設定していて どうしても「キーワード」という言葉を入力して検索したいという場合この仕様だと キーワードという文字を入力してフォーカスが外れた時に文字列がすかし文字と同じか という判定をしていたら判定を処理してすかし文字に書き換えてしまうのでどうすれば 良いのか判断に困っています。 現状CSSですかし画像を入れてごまかしていますが、この方法だとテキストボックスの デザインがなんだか変になる(borderがごつく付く)ので普通の方法で対処したいと思っています。 何か良い方法はないのでしょうか?

  • 長文テキストを指定文字数で分割して保存する方法

    日ごろからDEEPLを利用していますが、海外の文献など翻訳する時に DEEPL(無料版)では、1回につき翻訳できる文字数が5000文字に制限されているので不便です。 テキストエディターを利用して長文テキストを指定文字数で分割して保存する方法があれば教えてください。 たとえば、4900文字毎に分割して  連番ファイル名(01_new.txt,02_new_text 等)を付けて保存する 文の途中で分割されないように 文章の末尾で区切られる(分割される)事を希望します。