ベストアンサー

文字列抽出についてご質問です。

2010/07/10 16:56

文字列抽出についてご質問です。 csvファイルの中に、http://hoge.com/◎◎/goods_parts/◎◎/数字1～5桁/◎◎・・・のようなデータがずらっと1000行くらいあって、このURLの中にある数字1～5桁が、別ファイルの1～5桁の数字だけがあるファイルと合致したら、出力のようにしたいです。そこで、phpかexcelvbの正規表現で、・数字のみを抽出するサンプルコードをおしえていただけないでしょうか。なにとぞよろしくお願いいたします。

uff-n
お礼率54% (47/87)

PHP
回答数1
ありがとう数3

みんなの回答 （1）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

yambejp
ベストアンサー率51% (3827/7415)

2010/07/10 17:52 回答No.1

質問が微妙でイメージがわかないのですが。前後にスラッシュがあって1～5文字の数字を含む行を抽出するならこんな感じ <? $str=<<<eof test//test test/1/test test/12345/test test/12345678/test eof; $pattern="/^.*\/([0-9]{1,5})\/.*$/m"; preg_match_all($pattern,$str,$matches); print_r($matches); ?>

関連するQ&A

SED等で文字列を抽出したい
MacOS X 10.6のターミナルを使って文字列を加工して抽出する方法の質問です。次のような複数行からなるテキスト（ファイル名を 1.txt とします）があります。 <a href="./hoge/82111.310.12345000.htm" target="_blank"> <a href="./hoge/42403.310.33345025.htm" target="_blank"> <a href="./hoge/22154.310.50873323.htm" target="_blank"> ... このテキスト（1.txt）から、sed（?もっと適切なものがあれば別のものでも）コマンドを用いて 82111.12345000.htm 82401.33345025.htm 82111.50873323.htm ... といった具合に、 hoge/ のあとから始まり htmで終わる文字列から .310を取り除いた文字列を抜き出してファイル一覧のテキスト（2.txt）に書き出す方法を教えてください。なお、1.txtの行数は不定で変動し、その行数に応じて2.txtも行数が増えていきます。また htmのファイル名のところは　5桁のランダムな数字.310.8桁のランダムな数字.htm という規則になっています。（.310 と.htm の部分は固定です）よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
文字列の抽出がうまくできません
こんにちは。Perl初心者です。みなさんのお力をお借りしたく、初めて投稿させていただきました。よろしくお願いします。現在、ファイルから特定した行を抽出し、その行に含まれる文字列を抽出しようとしているのですが、その文字列の抽出がうまくできません。 <文字列を含むファイル：xxx.txt> -------------------------- To 鈴木太郎さん 1行目： 01,りんご, 3 個, ナシ, 1個 14行目 02,キャベツ, 3 個, なす, 10本 15行目： -------------------------- <スクリプトファイル：yyy.pl> -------------------------- open(DAT, "./xxx.txt") || die("can't open file : ($!)"); @file = <DAT>; close DAT; if ( $file[0] =~ /(\W+\s)(\W+)/ ) { print "$1\n"; } print "$file[13]\n"; print "$file[14]\n"; -------------------------- <結果> -------------------------- 鈴木 -------------------------- 抽出したい結果は「鈴木太郎」なんですが、上記のような結果（「1byteのスペース」鈴木「2byteのスペース」）になってしまいます。xxx.txtの「To」と「鈴木」の間と、「鈴木」と「太郎」の間にはそれぞれ1byteのスペースがあります。どうやったら「鈴木太郎」と抽出できるか教えてください。スクリプトは「Copal2(ver2.77)」というツールを使って作りました。そのツールではエンコードは「自動判別」となっており実際何が使われているのか分かりません。また他にも質問があります。今抽出したい行を指定して出力させてますが、「To」から始まる行「01」といった2桁の数字から始まる行というような抽出の仕方をしたいのですが可能でしょうか？本当に初心で大変恐縮ではありますが、教えてください。よろしくお願いいたします。
- ベストアンサー
- Perl
アプリケーションのログファイルから、特定文字列を抽出し、
アプリケーションのログファイルから、特定文字列を抽出し、一致する場合ユーザ名とアクションをまとめたcsvファイルに出力をさせるvbsを作成したいのですが、いろいろと調べても殆どが結果に結びついていません。イメージは以下のようなものになります。インプットファイル（ログファイル）には、以下のように出力されています。 20100601 USER1 update 20100601 USER2 logon 20100601 USER3 delete . . . . このファイルから、たとえばupdateを抽出し、その行にupdateの文字列が含まれていたら、行内にあるUSER1を抽出させます。処理が終わったら、以下イメージのCSV出力ファイルを作成します。 DATE,USERNAME,logon,update,delete 20100601,USER1,0,1,0 20100601,USER2,1,0,0 20100601,USER3,0,0,1 集計はエクセルを使用するのでカウントはせず、フラグ（１）を立てるだけをイメージしています。 updateの文字列は実際には記号等が含まれるので、grepのような正規表現にて抽出しないと難しいと思うのですが、vbsでのgrepがちょっとよくわかりません。 http://okwave.jp/qa/q5973058.html 上記アドレスで同じような質問がされていたのですが、記載内容を実行してもエラー出力されてしまったため、質問させて頂きました。なにとぞよろしくお願い致します。
- 締切済み
- Visual Basic
文字列検索
文字列検索テキストファイルの検索を行いたいです．下記のようなサンプルファイルでfooを検索し，含まれるならマッチした個数，含まれないならnilを返す関数を作りたいです． mecabを用いて形態素解析を１行ずつしようかと思ったんですが，大量のファイルを処理する予定なので，オーバヘッドが気になります．関数でgrepがあるみたいですが，マッチした行しか返されません．標準関数で１行ずつよみこんで，１行のなかでマッチした回数を返す関数はありますか？ --sample.txt-- foo foo bar bar foo hoge,hoge,hoge,hoge hage-hage-hage-foo -- end --
- ベストアンサー
- Ruby
Perlの文字列削除とcsv出力の方法について
現在、Perlを用いてtxtファイルから必要なデータだけを取り出し、それをcsv ファイルに出力したいと考えております。 Perlはほとんど触ったことがなく、色々と勉強しながら行っているのですが、期日が迫っているという事情もあり質問させていただきます。 txtファイルには以下のような文が1000行ほどあります。 *○ △ /△/△/△/△/○.txt, ○|○): ○ ○,△:任意の数字、または文字列です。この内、"○"のものだけを一つ一つ分けてcsvに出力したいのです。つまり○は4つありますが、出力する際は1つ目の"○"を1行目に、2つ目の"○"を2行目にといった形にしたいです。そして、それが1000列分あるということになります。上手く△のものだけを除外し、○だけを抽出する方法はあるでしょうか？どなたかよい方法をご存知のかたいらっしゃいましたら、教えていただけると幸いです。エクセルで行うということも考えましたが、htmlファイルが入力ファイルとなる可能性もあるためPerlで行うことにしました。
- ベストアンサー
- Perl
連続数字の抽出（VBA)
過去歴にてあてはまる物が見受けられなかったので質問させて頂きます。ある計測器からデータが出力されるのですが、１行に付き５列が１SETで 25行ご1マス空けて出力され又20行後1マス空けて20行それを４回繰り返し後次のtxtとして出力され。データ採取が終了まで続きます。今現在csvにて取り込んでいるのですが、データにより変更しますが、 15～23ページ有ります。データ採取した中で、隣と連続数字の行を抽出したいのですがどうすれば宜しいでしょうか（数字は全て整数MAX120です）５列の内隣同士連続であればコピーで別のエクセルブック（シート）へ貼り付け（コピー）を１ページ４SET分を前ページ分の抽出例えば 1,2,3,4,5　　抽出 21,35,38,49,66 抽出しない 21,35,38,65,66 抽出の様にどこかで連続が有れば抽出を行いたいです 1行目1,2,3,4,5_11,12,13,14,15_21,22,23,24,25_31,32,33,34,35 2行目：： 25行目1,2,7,10,16_19,21,23,24,35_21,22,23,24,25_31,32,33,34,35 の様に数字が出力されます
- 締切済み
- Visual Basic
バイナリファイルからの文字列抽出
バイナリファイルをCSVに変換するツールがございます。 CSV変換した後の文字列は、"日付"　"数字"となっています。今回、問題となっておりますのは、バイナリファイルのサイズが大きく CSV変換に時間がかかってしまいます。少しでもバイナリファイルのサイズを小さくするべく、バイナリファイルから特定の"日付"を抽出しようと考えておりますが、可能でしょうか？また、その手法をご教授ください。 OSはWINDOWSです。よろしくお願いします。
- ベストアンサー
- その他([技術者向] コンピューター)
バッチコマンドで指定行を抽出しファイル名を含める
日付毎に複数ファイルになっているｆｔｐのログファイルから必要な行だけを１ファイルにまとめたいのです set spath=d:\データ for /d /r %spath% %%d in ( * ) do ( type "%%d\*.log"|findstr /i ".csv">>%spath%\抽出ログ.txt ) で目的のものにかなり近いデータを抽出することができました ex110825.log　00:01:21 172.21.111.123 [6443]created /hoge/hoge.csv 226 しかし問題がありこのデータには日付がありません日付部分はファイル名に含まれていますex110825.logのように・・・・なので ex110825.log　00:01:21 172.21.111.123 [6443]created /hoge/hoge.csv 226 工夫次第でこのような形でデータを出力する事ができるでしょうか？アドバイス下さい
- ベストアンサー
- その他（プログラミング・開発）
ダブルクォートで囲まれた文字列の取り出し
Windows環境でRuby 1.8.7を使用しております。 ----sample1.txt----- hoge"foo\"bar\"foo"hage"bar\"baz\"bar"hoge ------------------ ファイルから1行ずつテキストを読み込んで処理を行います。上のsample.txtの様な行を読み込んだ場合にダブルクォートで囲まれた部分 foo\"bar\"foo bar\"baz\"bar を取り出すのにはどの様な正規表現を用いればよろしいでしょうか？エスケープされたダブルクォートを除ける上手い方法がわかりません。また、ダブルクォートで囲まれた部分が複数行にまたがる場合はどの様に処理をすれば良いでしょうか？ -----sample2.txt----- hoge"foo \"bar\" baz" hage ---------------------- -----sample3.txt----- hoge"foo \"ba r\"baz" hage ---------------------- 最初の例のように1行の場合は File.foreach(file) do | line | …… end で良いのですが、複数行の場合には同じように単純には行きません。ダブルクォートの数を数えて、奇数の場合は偶数になるまで次行をくっつける様な処理を考えているのですが、もっと適切な方法はありますか？宜しくお願いします。
- 締切済み
- Ruby
Excel 2007 マクロ文字列の抽出について
Excel 2007 マクロ文字列の抽出について元データのB列（番号）に5桁、3桁、7桁の数字が入っています。その番号をSheet2にコピーして貼り付けます。貼り付ける際に、5桁、3桁、7桁をそれぞれの列に入れます。 Sheet2のB列（番号2）で400番台はF列（種別）に国産同じくB列（番号2）で900番台はF列（種別）に外国産を反映するようにしたいです。どのようなマクロになりますでしょうか。サンプルがございましたら、お教えください。
- ベストアンサー
- その他MS Office製品

文字列抽出についてご質問です。

質問者が選んだベストアンサー

関連するQ&A

注目のQ&A

カテゴリ
一覧

専門家に質問してみよう
専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

文字列抽出についてご質問です。

質問者が選んだベストアンサー

関連するQ&A

注目のQ&A

カテゴリ 一覧

専門家に質問してみよう 専門家登録

あなたにピッタリな商品が見つかる！ OKWAVEセレクト

カテゴリ
一覧

専門家に質問してみよう
専門家登録