• 締切済み

う~ん。。

あるファイル中からshell scriptで要素名(またはタグ)を抽出する方法とはどんなのがあるでしょうか? 教えてください。

みんなの回答

  • 100Gold
  • ベストアンサー率27% (284/1018)
回答No.2

sgrepを使用するといいんじゃないでしょうか。

  • ykkw_2001
  • ベストアンサー率26% (267/1014)
回答No.1

awk とか sed のストリーム処理系のコマンドを利用するのをお勧めします。 場合によっては、スクリプトを組まなくても、1行で済むこともあります。 具体的には、そのファイルの例とやりたいことを具体的に補足したほうがいいです。 #その昔、awk やsed 使いは、ちょっと尊敬されてました。(ホンのちょっとだけね)

chamax
質問者

補足

回答ありがとうございます。 そうですね、補足します。 例えば、 <DOCTYPEHTMLPUBLIC "//W3C//DTDHTML4.0Transitional//EN"> <HTML> <HEAD> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-2022-JP"> このようなHTMLファイルを作った時に、このファイルで指定している要素名を抽出するようなshell scriptを 作ってみるとかしたいんですが。。。いかがでしょう?

関連するQ&A

  • XML要素をテキストファイルに出力するようにするには?

    お世話になります。 Perlを使って以下のようなXMLドキュメントを読み込み、テキストファイルの出力を行いたいと思って、正規表現等を使ってプログラムを作ってはいましたが、なかなかうまく行かず、行き詰まってしまいました。 ~~読み出すファイルのタグ~~ <info num = 1> <name>namae1</name> <nunber>10</number> </info> <info num =2> <name>namae2</name> <nunber>25</number> </info> ・ ・ ~~終了~~ 上記で読み出したい要素は、それぞれの<info>タグ内の<name>と、<nunber>のタグ内の要素です。 そして、その要素をテキストファイルに出力する。というようなプログラムを考えております。 事情により、出来れば、Perlのモジュールを使わずに正規表現などにて取り出したいと思っていますが、楽な方法が有ればその方法もおしえていただければと思います。 使用目的は、ローカル上でXMLドキュメント内のデータを抽出することです。 何か良い方法が有れば、ご教授いただけると助かります。 よろしくお願いします。

  • SHELLを使ったファイル起動について

    現在、JavascriptからSHELLを使って Excelファイルを起動さようと思っています。 ファイル名が英数字だと起動できるのですが 日本語だと起動できません。 「指定されたファイルがみつかりません」という スクリプトエラーが表示されます。 ---------------------------------------------- function wshell(){ wshshell=new ActiveXObject("WScript.Shell"); wshshell.run("T:\\sample.xls"); } ---------------------------------------------- 原因、対処方法をご存知の方、 教えていただけませんでしょうか。 よろしくお願いいたします。

  • Mysqlコマンドラインからデータを取得する方法について

    mysqlに入らず、コマンドラインからデータを取得したいのですが。 shell>mysql アカウント パスワード DB名 < script > 出力ファイル名 上記のようにスクリプトを使用するのではなく、直接sql文を書いて取得するのはどのようにやるのでしょうか。 どなたたかご存知の方、よろしくお願いします。

    • ベストアンサー
    • MySQL
  • JS読み込み場所について

    JS読み込み場所について 下記のように聞いたのですが、 >>> <script>要素を記述する場所は、大きく以下のように分類できます。 (1)<body>要素の配下(任意の位置) <script>要素での処理結果を、ページに直接出力するために利用します。昔はよく見かけた書き方ですが、コンテンツとコードとが混在するのは、ページの可読性/保守性の観点からも望ましくありません。現在ではほとんど使われることはありませんし、また、一部の例外を除いては使うべきではありません。 (2)<body>要素の配下(</body>閉じタグの直前) 一般的なブラウザーでは、スクリプトの読み込みや実行が完了するまで、以降の描画を行いません。このため、読み込みや実行に時間がかかるスクリプトは、そのままページ描画の遅れに直結します。巨大なスクリプトがある場合にはなおさらです。 そこで、ページ高速化の手法としてページの末尾(</body>の直前)に、<script>要素を配置することがよく行われます。これによって、ページの描画を終えたあと、おもむろにスクリプトを読み込み/実行できるので、見た目の描画速度が改善します。 一般的に、JavaScriptによる処理は、ページがすべて準備できてから行うべきものであるはずなので、これによる弊害もほぼありません。 (3)<head>要素の配下 ただし、(2)でまかなえないケースがあります。JavaScriptでは、「関数(Chapter 4)を呼び出すための<script>要素よりも、関数定義の<script>要素を先に記述していなければならない」というルールがあるためです(関数の定義、呼び出しがひとつの<script>要素にまとまっていても構いません)。たとえば、<body>要素の配下で呼び出す必要があるような関数は、<head>要素の配下で事前に読み込んでおく必要があります。 また、スクリプトからスタイルシートを出力するような状況でも、本文の出力に先立って<head>要素の配下で<script>要素を記述すべきです。 まずは(2)を基本とし、それでまかなえない場合にだけ(3)を利用する、と理解しておけばよいでしょう(本書でもそのルールに沿っています)。くり返しですが、(1)を利用する状況は、外部のウィジェットを埋め込むなどの状況を除けば、ほとんどありません。(1)を使いたくなったら、まずはほかの方法でまかなえないかを検討すべきです。 改訂版JS本格入門より ・同じJSファイル内であれば関数の定義と呼び出しは順番はどちらでも良いが、 別ファイルとして<script>タグで読み込む場合は定義が入ったファイルが呼び出しのファイルより先に記載されていないといけないということでしょうか? ・ >>> たとえば、<body>要素の配下で呼び出す必要があるような関数は、<head>要素の配下で事前に読み込んでおく必要があります。 これは具体的にどんなケースだと思いますか? sectionなどのbody内の要素の高さをjqueryで取得設定するときなどで消化? ・最後に良くCSSを当てるjsがDOMを読み込み終わってから実行されてガッタンとなることがあるのですが、このような場合はどこに書くべきなのでしょうか?

  • フォルダ内の複数のテキストファイルから指定行の抽出

    あるフォルダ内に入っているテキストファイルの2行目を全て抽出して一つのファイルにまとめたいのですが、どのような方法があるのでしょうか? perlなどのスクリプトを教えてもらえればと思います。

    • ベストアンサー
    • Perl
  • XMLファイルからの条件付抽出

    初めまして。 私はPHPの初心者なのですが、あるスクリプトを組むことになり、どうしてよいかわからずこちらに質問させていただきます。 スクリプトの内容としては あるWEBサイトにて、最新の情報を表示させるというものです。 『最新の情報』というものがディレクトリ./TESTに対しXMLファイルとして配信されます。 ところが厄介なことにこのファイルは『表示すべき情報以外』の場合も有ります。 表示させるべきか表示させないかのKeyはこのファイルの全てを読み込み、タグ<test></test>というタグに囲まれた文字列がkeywordになります。もしマッチした文字列がある場合はこのtestタグ要素と同じツリー上にある要素・属性部分を抜き出して表示させるということになります。 あと、keywordが送られてきたファイル内に無い場合は echo "現在情報はありません";と入れたく思っております。 サーバー環境はPHP4.3.10です。 DOMはサーバーの仕様で使用できないです。 指針や流れ等でも結構ですので、情報があればお願いいたします。

    • ベストアンサー
    • PHP
  • <div id="AA">の時、<form id="BB">内のselect要素などすべての要素をdisableにしたい。

    ▼次のようにページ内のdivタグのidの名前によって、formタグ内の要素をdisableにすることはJava scriptによって可能でしょうか? <div id="AA">のとき、別の場所にある<form id="BB">内のselect要素などすべての要素をdisableにする。 また同時に、id="BB"に指定したスタイルシートの記述を書き換えることは可能でしょうか? 何かよい方法をご存知でしたら教えてください。よろしくお願いいたします。

  • Javaの質問です。

    ファイルの中身を抽出し それをmysqlのテーブルの中の要素にそれぞれ登録する といった処理をおこなっています。 現在はArrayListでファイルの中身を一行ずつ抽出することができましたがそれぞれ 抽出した要素を適切なカラムにインサートする といった方法が分かりません。 例: 抽出するファイルの中身    INSERTするテーブルのカラムはidとnameがあります 001,山田              002,田中 現在はカンマ区切りで1つずつList内に格納できています。 このファイルの中身の001をidへ、山田をnameへとINSERTしたいです。

  • XXXXXX では空要素タグを `<TAG />`

    ソース内でonclick 属性を使っているので http://www2010.chin3.net/tech/html/009.html を参考に、 <meta http-equiv="content-script-type" content="text/javascript" /> を入れたのですが、 Another HTML Lintでソースをチェックしたときに 75. XXXXXX では空要素タグを `<TAG />` と書くことはできません。 *5* XHTML以外では、空要素タグを /> で閉じることはできません。 というエラー内容になりました。 <meta http-equiv="content-script-type" content="text/javascript" /> の何がダメなのでしょうか? そもそも「XXXXXX では」の「XXXXXX」の意味が不明だし、 「空要素タグ」とは、何を指してるのでしょうか?

    • ベストアンサー
    • HTML
  • 大量の xmlファイルをエクセルに読み込ませたい

    10万以上ある同じ形式の xmlファイル(4KBくらい)から特定のタグだけを取得して、エクセル2007で読み込む方法はありませんか。 ファイル名は規則性(数字が100毎に増える)があるのでスクリプトを書けばうまくいきそうですがファイルが大量にあるためとても時間がかかりそうです。使える言語は PHP ですが、あまり使いこなせていません。PHP でなくても単独で使えるツールなどはあるでしょうか。 環境は win7 と linux です。

    • ベストアンサー
    • XML