締切済み

awkのパターンマッチングについて。

2011/08/09 22:52

特定web siteからfileをdownload後にファイルのmd5値およびsha-1値をtextに抽出(出力)させたいと考えてます。全体の流れとしては以下になります。 (1)web pageをfileとして保存 (2)htmlをtxtに変更しtext editerにてgrep ※grepに使用するキーはhttpsにすると下記情報が一行ずつ出力されます。 <tr><td><a href="https://download.xxxxxxxxxxxxxxxx"> href="#" title="MD5|xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" href="#" title="SHA-1|xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" (3)上記をキーとしてawkからテキストに出力ご質問させていただきた点は(3)のawkの部分です。 Forawk.exeを使用して実行したいのですがパターンマッチングが分かりません。以下key選択方法についてご教示の程お願いします。 (1) httpsから始まるリンクを$1 (2) "MD5|"から始まる32行の乱数を$2 (3) "sha-1|"から始まる40行の乱数を$3 print $1 " " $2 " " $3 でうまく表示できるのではないかと考えています。その他良い案等ありましたら合わせてご提示の程お願いします。

cosac
お礼率0% (0/3)

その他（プログラミング・開発）
回答数3
ありがとう数6

みんなの回答 （3）
専門家の回答

みんなの回答

sakusaker7
ベストアンサー率62% (800/1280)

2011/08/10 12:07 回答No.3

> 2)htmlをtxtに変更しtext editerにてgrep > ※grepに使用するキーはhttpsにすると下記情報が一行ずつ出力されます。とありますが、貼り付けられている出力例は一行には見えません。本当に貼り付けられている通りに出力されるのなら >href="#" title="MD5|xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" >href="#" title="SHA-1|xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" はひっかからないですよね。また、前処理としてエディターでgrepかけないでも直接awkでやっちゃえば良いように思うのですが。 >ご質問させていただきた点は(3)のawkの部分です。自分が質問する立場のときは「ご質問」とはしないんじゃないですかね。

sholmes
ベストアンサー率81% (89/109)

2011/08/10 00:26 回答No.2

forawkというものは知りませんが、gawk前提ツールのようなのでgawkを使いました。 http://ideone.com/arTJ9 正規表現や行番号等は、利用される環境や正式なデータに適宜合わせて下さい ※このやり方が良いかどうかは自分でもわかりません。

noname#194317

2011/08/09 23:28 回答No.1

パターンマッチだと文字列を見つけることはできても、取り出すことはできないので、そこはコードに頼らざるを得ません。見た目にきれいではないですが、matchかindex関数でhttpsなりの位置を調べ、そこを起点にsubstr関数で取り出すしかないでしょう。特に(2)(3)は長さが決まっているため、ベタに固定長で引っぱって来られますから簡単です。問題はURLですが、これはhttpsが含まれる行の長さを見るか、行末の">の位置を調べるかのいずれかで取り出す長さの特定が可能です。 $1,$2はawkによってシステム変数FS（デフォルトはスペース）で指定されたキーごとに分解された語が格納される変数なので、今回はそんなものを書いても通用しないです。

awkのパターンマッチングについて。

みんなの回答

関連するQ&A

awkで特定の範囲の行を削除したい

awkで可変文字列をマッチング

URLの抜きだしをしたいです。

AWKスクリプト作成法200606

awkのBEGINについて

grep,sedコマンドについて

awk詳しい方へ

awkでの複数のファイルへの出力

awkでのsh処理について

awkを用いて、特定の文字を含む以下の行を抜き出す

awkによる日付編集

awkでファイルから特定の行を抽出する方法

【シェル】whileコマンドについて

sed,awkでのデータ抽出方法

sed、awk、または perl:行末判定

awkの入力ファイルをリダイレクト先にする方法

awkで改行を除いて文字列を抜きだす

grepを使用して、対象テキスト内容を以下に結果のように出力したいので

[awk]２つのファイルを参照して１つのファイルに出力する方法

awkで二つのファイルを比較し出力する方法

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

awkのパターンマッチングについて。

みんなの回答

関連するQ&A

awkで特定の範囲の行を削除したい

awkで可変文字列をマッチング

URLの抜きだしをしたいです。

AWKスクリプト作成法200606

awkのBEGINについて

grep,sedコマンドについて

awk詳しい方へ

awkでの複数のファイルへの出力

awkでのsh処理について

awkを用いて、特定の文字を含む以下の行を抜き出す

awkによる日付編集

awkでファイルから特定の行を抽出する方法

【シェル】whileコマンドについて

sed,awkでのデータ抽出方法

sed、awk、または perl:行末判定

awkの入力ファイルをリダイレクト先にする方法

awkで改行を除いて文字列を抜きだす

grepを使用して、対象テキスト内容を以下に結果のように出力したいので

[awk]２つのファイルを参照して１つのファイルに出力する方法

awkで二つのファイルを比較し出力する方法

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録